Differences
This shows you the differences between two versions of the page.
Both sides previous revisionPrevious revisionNext revision | Previous revision | ||
data_mining:aggregationsfunktion [2013/04/12 14:12] – phreazer | data_mining:aggregationsfunktion [2014/02/11 20:49] (current) – external edit 127.0.0.1 | ||
---|---|---|---|
Line 23: | Line 23: | ||
M ist apriori bekannt, ebenso der Typ der Tupel. | M ist apriori bekannt, ebenso der Typ der Tupel. | ||
- | Bsp.: Durchschnitt, Truncated Average | + | Bsp.: |
+ | -Durchschnitt | ||
+ | -Truncated Average | ||
+ | -Standardabweichung | ||
+ | -Top-N | ||
+ | Bsp.: Durchschnitt: | ||
+ | |||
+ | G: (Summe, Count) | ||
+ | H: (Gesamtsumme, | ||
+ | |||
+ | Bsp.: Truncated Average: | ||
+ | G: (Summe, Count, Min, Max) | ||
+ | |||
+ | Bsp.: Standardabweichung: | ||
+ | |||
+ | Unkorrigierte Standardabweichung: | ||
+ | |||
+ | G: (Summe, Summe der Quadrate, Count) | ||
===== holistisch ===== | ===== holistisch ===== | ||
+ | Es kann keine Beschränkung des Speicherbedarfs für Sub-Aggregate d.h. für Aggregate über | ||
+ | $$\{X_{i,j} | i=1, \dots, I\}$$ | ||
+ | angegeben werden / Größe des Zwischenergebnisses ist nicht beschränkt. | ||
+ | |||
+ | Beispiele | ||
+ | - Median() | ||
+ | - HäufigsterWert() | ||
+ | - TruncatedAverage() (dynamisch) | ||
+ | |||
+ | ===== Self-maintainable ===== | ||
+ | Wenn nach Änderung der neue Wert der Aggregationsfunktion aus dem alten Wert und den Änderungen berechnet werden kann. | ||
+ | Algebraische und holistische Aggregationsfunktionen sind nicht self-maintainable. | ||
+ | Bsp.: | ||
+ | - Count() self-maint. bzgl. Einfügen, Löschen | ||
+ | - Min() self-maint. bzgl. Einfügen | ||
+ | - Avg() ist nicht self-maint. | ||
+ |