Differences

This shows you the differences between two versions of the page.

--- time_series:anomaly_detection [2014/12/05 19:41] – phreazer
+++ time_series:anomaly_detection [2014/12/05 20:14] (current) – [Model Based] phreazer
@@ Line 30: / Line 30: @@
 K-NN Algorithmus.
 Outlier Score ist die Distanz eines Punktes zu dessen k-nächsten Nachbarn.
+===== Model Based =====
+Lernen eines erzeugenden Models aus den Daten mit mathematischer Struktur und eine Menge von Parametern. Für sequentielle Daten wird typischerweise ein Hidden Markov Model verwendet.
+Literaturverweis: Rabiner
+HMM Parameter: $\theta = (N,M,A,\pi,B)$
+  * N: Anzahl von Zuständen
+  * M: Anzahl der Symbole, die durch jeden Zustand generiert werden.
+  * A: Übergangsmatrix
+  * $\pi$: Initialzustandswahrscheinlichkeiten
+  * B: NxM Matrix mit Wahrscheinlichkeit, ein bestimmtes Symbol in einem der N Zustände beobachten zu können.
+Wenn die Parameter eines HMM gelernt wurden, können wichtige Statistiken berechnet werden, wie die Wahrscheinlichkeit eine neue Sequenz beobachten zu können oder die wahrscheinlichste Sequenz.
+Probleme von HMMs:
+Skalieren nicht gut
+Training erfordert manuelle Intervention, Datenerfahrung und Parameterwahl.