Differences

This shows you the differences between two versions of the page.

--- data_mining:pipeline [2014/09/06 13:10] – angelegt phreazer
+++ data_mining:pipeline [2014/09/06 14:21] (current) – [Artificial Data Synthesis] phreazer
@@ Line 1: / Line 1: @@
 ====== Machine Learning Pipeline ======
-Bsp.
+Bsp. Texterkennung (OCR) in Bildern.
 Image -> Text Detection -> Character Segmentiation -> Character recognition
 Aufteilbar in Teams
+===== Text Detection =====
+Ratio der Rechtecke
+Bildgröße festlegen und großes Datenset an positiven und negativen Beispielen anlegen.
+Sliding windows detection
+Bspw. links oben anfangen und Classifier befragen. Dann Rechteck nach rechts schieben. Step-Size ist Länge der Verschiebung.
+Größerer Bildausschnitt nehmen und herunterskalieren, sliding windows durchführen.
+Im nächsten Schritt einen expansion Operator anwenden. Mathematisch: Ist Pixel in Umgebung eines anderen weißen Pixels? Dann auch weiß färben.
+Weiterhin Bildverhältnis beachten und andere herausfiltern.
+===== Character Segmentation =====
+D Sliding window
+Entscheiden, ob Split zwischen Buchstaben (wieder positive/negative Beispiele).
+===== Artificial Data Synthesis =====
+Bei Bildern z.B. Verzerrungen einbauen.
+Bei Audio z.B. Hintergrundgeräusche.
+Low Bias Classifier (Learning curves), bevor künstliche Daten erzeugen.