data_mining:association_rules

This is an old revision of the document!


Association Rules Mining

  1. Apriori
    1. Naiv
    2. Multi-Dimensionale Association Rules
    3. Multi-Level Association Rules
      1. Alternative Variante
    4. Level Crossing association Rules
    5. Optimierung
      1. Direct Hashing and Pruning
      2. Sampling
      3. Apriori B
  2. FP-Tree
    1. Projected Databases

FP-Growth Algorithmus verwendet “Divide and conquer”-Strategie. Spezielle Datenstruktur sind die Frequent-Pattern Trees.

Aufgabe: Sortieren der Frequent Items

Ausgangspunkt: Frequent Item List L=<c:4,f:4,a:3,b:3,m:3,p:3>

TID Items Sortierte häufige Items
1 f,a,c,d,h,i,m,p c,f,a,m,p
2 a,b,c,f,l,m,o c,f,a,b,m
3 b,c,h,j,o c,b
4 b,f,k,s,p f,b,p
5 a,f,c,e,l,p,m,n c,f,a,m,p

Aufgabe: Aufbau des FP-Tree

Zwei Bestandteile: - Baumstruktur

  1. Wuzelelement mit “null” als Label
  2. Geordnete Transaktion als Pfad des Baumes
  3. Item-Prefix Subtrees bestehen aus Itemname, Häufigkeit, Node-link (Links zu nächstem Knoten, mit gleichem Itemnamen)

- Frequent-Item-Header-Tabelle

  1. Itemname
  2. Head of node-link: Ein Zeiger auf den ersten Knoten mit dem Itemnamen
  3. Optional ein Support Count eines Items.
  • data_mining/association_rules.1364679278.txt.gz
  • Last modified: 2014/02/11 21:47
  • (external edit)