data_mining:anomaly_detection

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revisionPrevious revision
Next revision
Previous revision
data_mining:anomaly_detection [2014/08/30 14:53] phreazerdata_mining:anomaly_detection [2014/08/30 17:00] (current) – [Schätzung von $\mu, \sigma$ (Normalverteilung)] phreazer
Line 7: Line 7:
  
 ===== Schätzung von $\mu, \sigma$ (Normalverteilung) ==== ===== Schätzung von $\mu, \sigma$ (Normalverteilung) ====
-$\mu_j = 1/m \sum_{i=1}^m x_j^{(i)}$+$\mu_j = \frac{1}{m\sum_{i=1}^m x_j^{(i)}$
  
 Vektorisierbar als $\mu = 1/m \sum_{i=1}^m x^{(i)}$ Vektorisierbar als $\mu = 1/m \sum_{i=1}^m x^{(i)}$
  
-$\sigma^2_j = 1/m \sum^m_{i=1} (x_j^{(i)}-\mu_j)^2$+$\sigma^2_j = \frac{1}{m\sum^m_{i=1} (x_j^{(i)}-\mu_j)^2$
  
 ===== Evaluierung durch Kennzahl ===== ===== Evaluierung durch Kennzahl =====
Line 53: Line 53:
  
 Parameter: Parameter:
-$\mu\Sigma \in R^{n \dot n}$+$\mu
 +Crosscorrelation Matrix: $\Sigma \in \mathbb{R}^{n \times n}$ 
 + 
 +Vorteilhaft, wenn Features positiv/negativ korreliert. 
 + 
 +==== Schätzung ==== 
 +  - Fitten des Models durch Schätzung von $\mu,\Sigma$ 
 +  - p(x) berechnen 
 +    * Anomaly flaggen wenn $p(x) < \epsilon$ 
 + 
 +Unterschied zu vorherigem Modell: $\Sigma$ kann hier von 0 verschiedene Werte für nicht-diagonal Elemente besitzen. 
 + 
 +Ursprüngliches Modell: 
 +  * Wenn manuell Features erzeugt werden, die ungewöhnliche Kombinationen beinhalten $x_3=x_1/x_2$ 
 +  * Weniger  Rechenintensiv (n = 10000 bis 100000) 
 +  * Geeignet auch wenn m klein (Multivar. muss m > n haben)
  • data_mining/anomaly_detection.1409403218.txt.gz
  • Last modified: 2014/08/30 14:53
  • by phreazer