statistik:aehnlichkeitsmasse

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revisionPrevious revision
Next revision
Previous revision
Last revisionBoth sides next revision
statistik:metrik [2012/08/20 01:03] – [Minkowski Distanz] phreazerstatistik:aehnlichkeitsmasse [2012/08/20 01:54] – [Binäre Attribute] phreazer
Line 1: Line 1:
 +====== Metrik ======
 +Distanz d(i,j) ist eine Metrik wenn gilt: 
 +
 +  * Positiv definit: $d(i,j) > 0$ wenn $i \neq j$ und $d(i,i) = 0$
 +  * Symmetrisch: $d(i,j) = d(j,i)$
 +  * Dreiecksungleichung: $d(i,j) \leq d(i,k) + d(k,j)$
 +
 +====== Minkowski Distanz ======
 +$$d(i,j) = \sqrt[p]{|x_{i1}-x_{j1}|^p + \dots + |x_{in}-x_{jn}|^p} = \sqrt[p]{\sum_{k=1}^n  |x_{ik}-x_{jk}|^p}$$
 +
 +  * p=1: Manhattan Distanz (City Block, L1 Norm, Hammingdistanz (Anzahl verschiedener Bits in 2 Vektoren))
 +  * p=2: Euklidische Distanz (L2 Norm)
 +  * $p \rightarrow \infty$: Supremum Distanz (LMax, LInf Norm)
 +
 ====== Disimilarity Matrix ====== ====== Disimilarity Matrix ======
  
Line 9: Line 23:
 \end{pmatrix}$$ \end{pmatrix}$$
  
-====== Minkowski Distanz ====== +====== Ähnlichkeit ====== 
-$$d(i,j) = \sqrt{a}^h$$+===== Nominale Variablen  ===== 
 + 
 +  - Einfaches Matching: $d(i,k) = \frac{m-p}{m}$ mit Anzahl der Variablen m und Anzahl der Matches p. 
 +  - Binäre Attribute für jeden nominalen Zustand 
 + 
 +===== Binäre Attribute  ===== 
 + 
 +Kontingenztabelle 
 + 
 +^     Objekt j              ^^^^^ 
 +^ Objekt i    |  | 1 | 0 | Summe | 
 +^ :::    | 1 | q | r | q+r | 
 +^ :::    | 0 | s | t | s+t | 
 +^ :::    | Summe | q+s | r+t | p | 
 + 
 +  * Symmetrische binäre Variablen: $d(i,j) = \frac{r+s}{q+r+s+t}$ 
 +  * Asymmetrische binäre Variablen: $d(i,j) = \frac{r+s}{q+r+s}$ 
 +  * Jaccard Koeefizient (Ähnlichkeitsmaß für asymmetrische binäre Variablen) - Kohärenz: $d(i,j) = \frac{q}{q+r+s}$ 
 + 
 +===== Ordinale Variablen  ===== 
 +Behandeln wie intervallskalierte Variablen, d.h. Bereich jeder Variablen auf [0,1] mappen 
 +===== Kosinusähnlichkeit  ===== 
 +Korrelation zwischen Objekten (nicht Variablen) bei quantitativen und ordinalen Variablen 
 + 
  • statistik/aehnlichkeitsmasse.txt
  • Last modified: 2014/02/11 21:49
  • by 127.0.0.1