data_mining:large_datasets [AE Wiki]

data_mining:large_datasets

This is an old revision of the document!

Wie kann man feststellen, ob ein Algo mit mehr Daten besser funktioniert?

Plotten einer Learning Curve für verschiedene m. Wenn Algorithmus hohe Varianz bei kleinem m hat, ist dies der Fall.

Learning Curve:

x: Größe Trainingsset
y: Fehler

Plotten von

J_CV(theta)
J_train(theta)

Wenn Lücke ⇒ High Variance
Wenn nah beieinander ⇒ High Bias

data_mining/large_datasets.1409863924.txt.gz
Last modified: 2014/09/04 22:52
by phreazer