Differences
This shows you the differences between two versions of the page.
Both sides previous revisionPrevious revisionNext revision | Previous revision | ||
data_mining:correlation [2015/08/20 16:31] – [Schätzung] phreazer | data_mining:correlation [2017/08/06 23:49] (current) – phreazer | ||
---|---|---|---|
Line 2: | Line 2: | ||
Covarianz (nicht-standardisierter Pearson Korrelationskoeffizient) | Covarianz (nicht-standardisierter Pearson Korrelationskoeffizient) | ||
+ | |||
+ | Lineare Abhängigkeiten. | ||
< | < | ||
Line 45: | Line 47: | ||
Solange die Samplezahl sehr viel größer ist als die Anzahl der Bins erhält man mit der Verwendung der empirischen Verteilung $\hat{p}$ eine gute Schätzung: | Solange die Samplezahl sehr viel größer ist als die Anzahl der Bins erhält man mit der Verwendung der empirischen Verteilung $\hat{p}$ eine gute Schätzung: | ||
+ | \begin{align*} | ||
+ | I(\hat{p}(X; | ||
+ | \end{align*} | ||
+ | |||
+ | Wobei $\hat{p}(x) = \sum_x \hat{p}(x, | ||
+ | |||
+ | Der Schätzer besitzt einen positiven Bias, der aber verbessert werden kann (http:// | ||
====== Total correlation ====== | ====== Total correlation ====== | ||
Line 60: | Line 69: | ||
Die maximale totale Correlation tritt auf, wenn eine Variable alle anderen Variabeln bestimmen kann. | Die maximale totale Correlation tritt auf, wenn eine Variable alle anderen Variabeln bestimmen kann. | ||
+ | |||
+ | ====== Correlation for categorial values ====== | ||
+ | |||
+ | See https:// | ||
+ |