Det finns både kommersiella och open source-OCR-program:
Bland open source-programmen för Linux finns bland annat Cuneiform, gocr, ocrad och Tesseract. Till Linux finns även de kommersiella verktygen Vividata OCR Shop XTR (som verkar bygga på en gammal version av ett Omnipage-utvecklingskit från Nuance) och AbbyyCLI.
Exempelvis Tesseract och Vividata OCR Shop XTR arbetar bitonalt (helt svartvitt) i OCR-processen och verkar ha svårt för färgfiler. Abbyy:s verktyg verkar själva justera färgfilerna, så att det blir lättare att OCR-tolka. Man kan naturligtvis hjälpa de "svagare" OCR-motorerna att få ett bättre resultat genom att manipulera bildfilen (t ex räta upp texten/sidan, kontrollera att textens svärta blir bra och göra bakgrunden helt vit).
Till Windows finns bland annat Abbyy FineReader, Nuance Omnipage och Readiris. För större volymer kan man i Windows använda Abbyy Recognition Server eller IRIS Document Server.
Ifall man letar streckkoder (förutom text), kan gocr och ZBar vara bra open source-hjälpmedel. Mobiltelefoner/smartphones kan exempelvis leta streckkoder med hjälp av sina kameror.
Överlag verkar OCR-open source-verktygen vara mer begränsade till själva teckentolkningen och förvänta sig mer "hjälp" i form av att filerna förbereds för OCR. Tesseract kräver t ex att bildfiler konverteras till exakt rätt format och bitdjup. De kommersiella verktygen verkar ha mer automatisk bildbearbetning internt. Ju högre pris på OCR-motorn, desto bättre verkar detta stöd vara (t ex för komplexa, sneda/ojämna färgfiler med fläckig bakgrund).
0 kommentarer:
Skicka en kommentar