data_mining:tf-idf

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revisionPrevious revision
Next revision
Previous revision
Last revisionBoth sides next revision
data_mining:tf-idf [2013/09/15 15:05] – [TF-IDF] phreazerdata_mining:tf-idf [2013/09/15 15:18] – [TF-IDF] phreazer
Line 7: Line 7:
 Heuristik Heuristik
  
-Web-Page conetent => TF-IDF => Web-Page keywords+Web-Page content => TF-IDF => Web-Page keywords
  
 Wort wie "der" weniger als Turing Wort wie "der" weniger als Turing
Line 25: Line 25:
  
 Mutual information zwischen allen Seiten und allen Wörtern ist proportional zu $\sum_d \sum_w n^d_w log_2 \frac{N}{N_w}$ Mutual information zwischen allen Seiten und allen Wörtern ist proportional zu $\sum_d \sum_w n^d_w log_2 \frac{N}{N_w}$
 +
 +Automatische Berechnung der Top-Keywords für ein Absatz
 +-> guter Titel?
 +
 +Hits | IDF | TF | TF-IDF
 +
 +
 +Haben ähnliche Dokumente ähnliche TF-IDF Keywords?
 +Semantik von Wörtern, d.h. Gebrauchskontext notwendig
 +
 +Modelle: latent semantics, topic models
 +
  • data_mining/tf-idf.txt
  • Last modified: 2014/02/11 21:49
  • by 127.0.0.1