data_mining:anomaly_detection

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revisionPrevious revision
Next revision
Previous revision
Last revisionBoth sides next revision
data_mining:anomaly_detection [2014/08/30 14:47] – [Feature selection] phreazerdata_mining:anomaly_detection [2014/08/30 17:00] – [Multivariate Normal Distribution] phreazer
Line 47: Line 47:
  
 Anomaly betrachten und Features entwickeln, bei denen die Anomaly außerhalb liegt. Anomaly betrachten und Features entwickeln, bei denen die Anomaly außerhalb liegt.
 +
 +===== Multivariate Normal Distribution =====
 +
 +Nicht $p(x_n)$ modellieren, sonden ein Model $p(x)$ als Ganzes
 +
 +Parameter:
 +$\mu$
 +Crosscorrelation Matrix: $\Sigma \in \mathbb{R}^{n \times n}$
 +
 +Vorteilhaft, wenn Features positiv/negativ korreliert.
 +
 +==== Schätzung ====
 +  - Fitten des Models durch Schätzung von $\mu,\Sigma$
 +  - p(x) berechnen
 +    * Anomaly flaggen wenn $p(x) < \epsilon$
 +
 +Unterschied zu vorherigem Modell: $\Sigma$ kann hier von 0 verschiedene Werte für nicht-diagonal Elemente besitzen.
 +
 +Ursprüngliches Modell:
 +  * Wenn manuell Features erzeugt werden, die ungewöhnliche Kombinationen beinhalten $x_3=x_1/x_2$
 +  * Weniger  Rechenintensiv (n = 10000 bis 100000)
 +  * Geeignet auch wenn m klein (Multivar. muss m > n haben)
  • data_mining/anomaly_detection.txt
  • Last modified: 2014/08/30 17:00
  • by phreazer