data_mining:pipeline

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Next revisionBoth sides next revision
data_mining:pipeline [2014/09/06 15:10] – angelegt phreazerdata_mining:pipeline [2014/09/06 15:25] phreazer
Line 1: Line 1:
 ====== Machine Learning Pipeline ====== ====== Machine Learning Pipeline ======
  
-Bsp. +Bsp. Texterkennung (OCR) in Bildern.
  
 Image -> Text Detection -> Character Segmentiation -> Character recognition Image -> Text Detection -> Character Segmentiation -> Character recognition
  
 Aufteilbar in Teams Aufteilbar in Teams
 +
 +===== Text Detection =====
 +
 +Ratio der Rechtecke
 +
 +Bildgröße festlegen und großes Datenset an positiven und negativen Beispielen anlegen.
 +
 +Sliding windows detection
 +
 +Bspw. links oben anfangen und Classifier befragen. Dann Rechteck nach rechts schieben. Step-Size ist Länge der Verschiebung.
 +
 +Größerer Bildausschnitt nehmen und herunterskalieren, sliding windows durchführen.
 +
 +
 +Im nächsten Schritt einen expansion Operator anwenden. Mathematisch: Ist Pixel in Umgebung eines anderen weißen Pixels? Dann auch weiß färben.
 +
 +Weiterhin Bildverhältnis beachten und andere herausfiltern.
 +
 +===== Character Segmentation =====
 +
 +1D Sliding window
 +Entscheiden, ob Split zwischen Buchstaben (wieder positive/negative Beispiele).
 +
 +
  • data_mining/pipeline.txt
  • Last modified: 2014/09/06 16:21
  • by phreazer