data_mining:tf-idf

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revisionPrevious revision
Next revision
Previous revision
data_mining:tf-idf [2013/09/15 15:05] – [TF-IDF] phreazerdata_mining:tf-idf [2014/02/11 21:49] (current) – external edit 127.0.0.1
Line 7: Line 7:
 Heuristik Heuristik
  
-Web-Page conetent => TF-IDF => Web-Page keywords+Web-Page content => TF-IDF => Web-Page keywords
  
 Wort wie "der" weniger als Turing Wort wie "der" weniger als Turing
Line 25: Line 25:
  
 Mutual information zwischen allen Seiten und allen Wörtern ist proportional zu $\sum_d \sum_w n^d_w log_2 \frac{N}{N_w}$ Mutual information zwischen allen Seiten und allen Wörtern ist proportional zu $\sum_d \sum_w n^d_w log_2 \frac{N}{N_w}$
 +
 +Automatische Berechnung der Top-Keywords für ein Absatz
 +-> guter Titel?
 +
 +Hits | IDF | TF | TF-IDF
 +
 +
 +Haben ähnliche Dokumente ähnliche TF-IDF Keywords?
 +Semantik von Wörtern, d.h. Gebrauchskontext notwendig
 +
 +Modelle: latent semantics, topic models
 +
  • data_mining/tf-idf.1379250301.txt.gz
  • Last modified: 2014/02/11 21:48
  • (external edit)