Differences
This shows you the differences between two versions of the page.
Both sides previous revisionPrevious revisionNext revision | Previous revision | ||
statistik:aehnlichkeitsmasse [2012/08/19 23:36] – aehnlichkeitsmasse umbenannt in statistik:aehnlichkeitsmasse phreazer | statistik:aehnlichkeitsmasse [2014/02/11 20:49] (current) – external edit 127.0.0.1 | ||
---|---|---|---|
Line 24: | Line 24: | ||
====== Ähnlichkeit ====== | ====== Ähnlichkeit ====== | ||
+ | ===== Nominale Variablen | ||
+ | |||
+ | - Einfaches Matching: $d(i,k) = \frac{m-p}{m}$ mit Anzahl der Variablen m und Anzahl der Matches p. | ||
+ | - Binäre Attribute für jeden nominalen Zustand | ||
+ | |||
+ | ===== Binäre Attribute | ||
+ | |||
+ | Kontingenztabelle | ||
+ | |||
+ | ^ | ||
+ | ^ Objekt i | | 1 | 0 | Summe | | ||
+ | ^ ::: | 1 | q | r | q+r | | ||
+ | ^ ::: | 0 | s | t | s+t | | ||
+ | ^ ::: | Summe | q+s | r+t | p | | ||
+ | |||
+ | * Symmetrische binäre Variablen: $d(i,j) = \frac{r+s}{q+r+s+t}$ | ||
+ | * Asymmetrische binäre Variablen: $d(i,j) = \frac{r+s}{q+r+s}$ | ||
+ | * Jaccard Koeefizient (Ähnlichkeitsmaß für asymmetrische binäre Variablen) - Kohärenz: $d(i,j) = \frac{q}{q+r+s}$ | ||
+ | |||
+ | ===== Ordinale Variablen | ||
+ | Behandeln wie intervallskalierte Variablen, d.h. Bereich jeder Variablen auf [0,1] mappen | ||
===== Kosinusähnlichkeit | ===== Kosinusähnlichkeit | ||
Korrelation zwischen Objekten (nicht Variablen) bei quantitativen und ordinalen Variablen | Korrelation zwischen Objekten (nicht Variablen) bei quantitativen und ordinalen Variablen | ||