Differences
This shows you the differences between two versions of the page.
Both sides previous revisionPrevious revisionNext revision | Previous revision | ||
data_mining:tf-idf [2013/09/15 13:04] – phreazer | data_mining:tf-idf [2014/02/11 20:49] (current) – external edit 127.0.0.1 | ||
---|---|---|---|
Line 6: | Line 6: | ||
Heuristik | Heuristik | ||
+ | |||
+ | Web-Page content => TF-IDF => Web-Page keywords | ||
Wort wie " | Wort wie " | ||
Line 23: | Line 25: | ||
Mutual information zwischen allen Seiten und allen Wörtern ist proportional zu $\sum_d \sum_w n^d_w log_2 \frac{N}{N_w}$ | Mutual information zwischen allen Seiten und allen Wörtern ist proportional zu $\sum_d \sum_w n^d_w log_2 \frac{N}{N_w}$ | ||
+ | |||
+ | Automatische Berechnung der Top-Keywords für ein Absatz | ||
+ | -> guter Titel? | ||
+ | |||
+ | Hits | IDF | TF | TF-IDF | ||
+ | |||
+ | |||
+ | Haben ähnliche Dokumente ähnliche TF-IDF Keywords? | ||
+ | Semantik von Wörtern, d.h. Gebrauchskontext notwendig | ||
+ | |||
+ | Modelle: latent semantics, topic models | ||
+ |