Differences
This shows you the differences between two versions of the page.
Next revision | Previous revision | ||
data_mining:pipeline [2014/09/06 13:10] – angelegt phreazer | data_mining:pipeline [2014/09/06 14:21] (current) – [Artificial Data Synthesis] phreazer | ||
---|---|---|---|
Line 1: | Line 1: | ||
====== Machine Learning Pipeline ====== | ====== Machine Learning Pipeline ====== | ||
- | Bsp. | + | Bsp. Texterkennung (OCR) in Bildern. |
Image -> Text Detection -> Character Segmentiation -> Character recognition | Image -> Text Detection -> Character Segmentiation -> Character recognition | ||
Aufteilbar in Teams | Aufteilbar in Teams | ||
+ | |||
+ | ===== Text Detection ===== | ||
+ | |||
+ | Ratio der Rechtecke | ||
+ | |||
+ | Bildgröße festlegen und großes Datenset an positiven und negativen Beispielen anlegen. | ||
+ | |||
+ | Sliding windows detection | ||
+ | |||
+ | Bspw. links oben anfangen und Classifier befragen. Dann Rechteck nach rechts schieben. Step-Size ist Länge der Verschiebung. | ||
+ | |||
+ | Größerer Bildausschnitt nehmen und herunterskalieren, | ||
+ | |||
+ | |||
+ | Im nächsten Schritt einen expansion Operator anwenden. Mathematisch: | ||
+ | |||
+ | Weiterhin Bildverhältnis beachten und andere herausfiltern. | ||
+ | |||
+ | ===== Character Segmentation ===== | ||
+ | |||
+ | 1D Sliding window | ||
+ | Entscheiden, | ||
+ | |||
+ | ===== Artificial Data Synthesis ===== | ||
+ | |||
+ | Bei Bildern z.B. Verzerrungen einbauen. | ||
+ | Bei Audio z.B. Hintergrundgeräusche. | ||
+ | |||
+ | Low Bias Classifier (Learning curves), bevor künstliche Daten erzeugen. | ||
+ | |||
+ |