Differences
This shows you the differences between two versions of the page.
Both sides previous revisionPrevious revision | Next revisionBoth sides next revision | ||
data_mining:association_rules [2013/03/30 22:34] – [Phase 1] phreazer | data_mining:association_rules [2013/03/30 23:24] – [Phase 2] phreazer | ||
---|---|---|---|
Line 41: | Line 41: | ||
- Head of node-link: Ein Zeiger auf den ersten Knoten mit dem Itemnamen | - Head of node-link: Ein Zeiger auf den ersten Knoten mit dem Itemnamen | ||
- Optional ein Support Count eines Items. | - Optional ein Support Count eines Items. | ||
+ | |||
+ | === FP-Tree Erzeugung === | ||
+ | Input: DB und Minimum Support Grenzwert. | ||
+ | Output: FP-tree, das Häufigkeitsmuster der DB | ||
+ | |||
+ | Phase 1 (siehe oben): Einmaliges Scannen der DB. Sammeln der Menge der frequent Items F und Support jedes frequent Items. Sortieren von F dem Support nach absteigend, als Liste der Frequent Items FList. | ||
+ | |||
+ | Phase 2: Wurzelknoten eines FP-Tree T erzeugen und für jede Transaktion in der DB folgendes durchführen: | ||
+ | - Erstelle sortierte Frequent-Item-Liste[p|P] für die Transaktion, | ||
+ | - insert_tree([p|P], | ||
+ | |||
+ | Es werden 2 Scans benötigt: Scan 1 sammelt und sortiert die Menge der Frequent Items, Scan 2 erstellt FP-Tree. | ||
+ | |||
+ | ==== Phase 3 ==== | ||
+ | Aufgabe: Extrahieren des Frequent Itemsets aus FP-Tree (FP-Growth Algorithmus) | ||
+ | |||
+ | Input: DB in Form eines FP-Trees und Minimumsupport Grenzwert. | ||
+ | Output: Vollständige Menge der Fequent Patterns | ||
+ | |||
+ | |||
+ | |||