statistik:aehnlichkeitsmasse

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revisionPrevious revision
Next revision
Previous revision
Last revisionBoth sides next revision
statistik:metrik [2012/08/20 01:26] – [Minkowski Distanz] phreazerstatistik:aehnlichkeitsmasse [2012/08/20 01:54] – [Binäre Attribute] phreazer
Line 9: Line 9:
 $$d(i,j) = \sqrt[p]{|x_{i1}-x_{j1}|^p + \dots + |x_{in}-x_{jn}|^p} = \sqrt[p]{\sum_{k=1}^n  |x_{ik}-x_{jk}|^p}$$ $$d(i,j) = \sqrt[p]{|x_{i1}-x_{j1}|^p + \dots + |x_{in}-x_{jn}|^p} = \sqrt[p]{\sum_{k=1}^n  |x_{ik}-x_{jk}|^p}$$
  
-p=1: Manhattan Distanz (City Block, L1 Norm, Hammingdistanz (Anzahl verschiedener Bits in 2 Vektoren)) +  * p=1: Manhattan Distanz (City Block, L1 Norm, Hammingdistanz (Anzahl verschiedener Bits in 2 Vektoren)) 
-p=2: Euklidische Distanz (L2 Norm) +  p=2: Euklidische Distanz (L2 Norm) 
-$p \rightarrow \infty$: Supremum Distanz (LMax, LInf Norm)+  $p \rightarrow \infty$: Supremum Distanz (LMax, LInf Norm)
  
 ====== Disimilarity Matrix ====== ====== Disimilarity Matrix ======
Line 22: Line 22:
 d(3,1) & d(3,2) & 0   d(3,1) & d(3,2) & 0  
 \end{pmatrix}$$ \end{pmatrix}$$
 +
 +====== Ähnlichkeit ======
 +===== Nominale Variablen  =====
 +
 +  - Einfaches Matching: $d(i,k) = \frac{m-p}{m}$ mit Anzahl der Variablen m und Anzahl der Matches p.
 +  - Binäre Attribute für jeden nominalen Zustand
 +
 +===== Binäre Attribute  =====
 +
 +Kontingenztabelle
 +
 +^     Objekt j              ^^^^^
 +^ Objekt i    |  | 1 | 0 | Summe |
 +^ :::    | 1 | q | r | q+r |
 +^ :::    | 0 | s | t | s+t |
 +^ :::    | Summe | q+s | r+t | p |
 +
 +  * Symmetrische binäre Variablen: $d(i,j) = \frac{r+s}{q+r+s+t}$
 +  * Asymmetrische binäre Variablen: $d(i,j) = \frac{r+s}{q+r+s}$
 +  * Jaccard Koeefizient (Ähnlichkeitsmaß für asymmetrische binäre Variablen) - Kohärenz: $d(i,j) = \frac{q}{q+r+s}$
 +
 +===== Ordinale Variablen  =====
 +Behandeln wie intervallskalierte Variablen, d.h. Bereich jeder Variablen auf [0,1] mappen
 +===== Kosinusähnlichkeit  =====
 +Korrelation zwischen Objekten (nicht Variablen) bei quantitativen und ordinalen Variablen
 +
 +
  • statistik/aehnlichkeitsmasse.txt
  • Last modified: 2014/02/11 21:49
  • by 127.0.0.1