time_series:anomaly_detection

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revisionPrevious revision
Next revision
Previous revision
time_series:anomaly_detection [2014/12/05 19:41] phreazertime_series:anomaly_detection [2014/12/05 20:14] (current) – [Model Based] phreazer
Line 30: Line 30:
 K-NN Algorithmus. K-NN Algorithmus.
 Outlier Score ist die Distanz eines Punktes zu dessen k-nächsten Nachbarn. Outlier Score ist die Distanz eines Punktes zu dessen k-nächsten Nachbarn.
 +
 +===== Model Based =====
 +Lernen eines erzeugenden Models aus den Daten mit mathematischer Struktur und eine Menge von Parametern. Für sequentielle Daten wird typischerweise ein Hidden Markov Model verwendet.
 +
 +Literaturverweis: Rabiner
 +
 +HMM Parameter: $\theta = (N,M,A,\pi,B)$
 +  * N: Anzahl von Zuständen
 +  * M: Anzahl der Symbole, die durch jeden Zustand generiert werden.
 +  * A: Übergangsmatrix
 +  * $\pi$: Initialzustandswahrscheinlichkeiten
 +  * B: NxM Matrix mit Wahrscheinlichkeit, ein bestimmtes Symbol in einem der N Zustände beobachten zu können.
 +
 +Wenn die Parameter eines HMM gelernt wurden, können wichtige Statistiken berechnet werden, wie die Wahrscheinlichkeit eine neue Sequenz beobachten zu können oder die wahrscheinlichste Sequenz.
 +
 +Probleme von HMMs:
 +
 +Skalieren nicht gut
 +Training erfordert manuelle Intervention, Datenerfahrung und Parameterwahl.
  • time_series/anomaly_detection.1417804908.txt.gz
  • Last modified: 2014/12/05 19:41
  • by phreazer