Differences
This shows you the differences between two versions of the page.
Both sides previous revisionPrevious revisionNext revision | Previous revisionLast revisionBoth sides next revision | ||
data_mining:svm [2014/08/17 20:41] – [Feature Vector f] phreazer | data_mining:svm [2014/08/17 21:05] – [Parameterwahl] phreazer | ||
---|---|---|---|
Line 98: | Line 98: | ||
Niedriges C: Hoher Bias, niedrige Varianz => Underfitting | Niedriges C: Hoher Bias, niedrige Varianz => Underfitting | ||
- | $sigma^2$ | + | $\sigma^2$ |
Groß: Features variieren sanfter | Groß: Features variieren sanfter | ||
Line 104: | Line 104: | ||
Niedrig: Features varrieren abrupter | Niedrig: Features varrieren abrupter | ||
=> Niedriger Bias, hohe Varianz | => Niedriger Bias, hohe Varianz | ||
+ | |||
+ | ===== Kernelwahl ===== | ||
+ | |||
+ | * Kein Kernel (linear Kernel): n groß, m klein | ||
+ | * Gaussian Kernel: n klein, m groß | ||
+ | * Implementierung der Ähnlichkeitsfunktion (bzw. Features $f_i$) | ||
+ | * Feature Scaling vor Verwendung des Gaussian Kernel $||v||^2 = v_1^2 + v_2^2 + \dots + v_n^2$ | ||
+ | * Polynomial Kernels: Eher selten benutzt | ||
+ | * Weitere | ||
+ | |||
+ | Manche Ähnlichkeitsfunktionen erzeugen keine gültigen Kernel. Diese müssen Mercer' | ||
+ | |||
+ | ===== Algowahl ===== | ||
+ | |||
+ | * Wenn n groß gegenüber m: Log Reg oder SVM ohne Kernel | ||
+ | * Wenn n klein (1-1000) und m mittelgroß (10-10000): SVM mit Gaussian Kernel | ||
+ | * Wenn n klein (1-1000) und m groß (50000+): Mehr Features + Log Reg oder SVM ohne Kernel | ||
+ |