Large Dataset

This is an old revision of the document!

Wie kann man feststellen, ob ein Algo mit mehr Daten besser funktioniert?

Plotten einer Learning Curve für verschiedene m. Wenn Algorithmus hohe Varianz bei kleinem m hat, ist dies der Fall.

Learning Curve:

Plotten von

Wenn Lücke ⇒ High Variance (Mehr Daten)
Wenn nah beieinander ⇒ High Bias (Mehr Hidden units, mehr Features zur Verbesserung)

Batch gradient descent: “Batch” - Alle Trainingsbeispiele berücksichtigen (also m).

Algorithmen