Magkaroon ng isang dokumento na PDF o isang imahe na nais mong i-convert sa teksto? Kamakailan lamang, may nagpadala sa akin ng isang dokumento sa mail na kailangan kong i-edit at maipabalik kasama ang mga pagwawasto. Ang tao ay hindi mahanap ang isang digital na kopya, kaya't naatasan ako sa pagkuha ng lahat ng teksto na iyon sa digital na format.

Walang paraan na ako ay gumugol ng maraming oras sa pag-type sa lahat, kaya natapos ko ang pagkuha ng isang magandang kalidad ng larawan ng dokumento at pagkatapos ay sinunog ang aking paraan sa pamamagitan ng isang bungkos ng mga online na serbisyo ng OCR upang makita kung alin ang magbibigay sa akin ng pinakamahusay mga resulta.

Sa artikulong ito, pupunta ako sa isang pares ng aking mga paboritong site para sa OCR na libre. Nararapat na tandaan na ang karamihan sa mga site na ito ay nagbibigay ng isang pangunahing libreng serbisyo at pagkatapos ay may mga bayad na pagpipilian kung nais mo ng mga karagdagang tampok tulad ng mas malaking mga imahe, mga dokumento na multi-pahina na PDF, iba't ibang mga wika sa pag-input, atbp.

Mahusay din na malaman bago ang karamihan sa mga serbisyong ito ay hindi maaaring tumugma sa pag-format ng iyong orihinal na dokumento. Ito ay higit sa lahat para sa pagkuha ng teksto at iyon na. Kung kailangan mo ang lahat upang maging sa isang tiyak na layout o format, kakailanganin mong manu-manong gawin na sa sandaling makuha mo ang lahat ng teksto mula sa OCR.

Bilang karagdagan, ang pinakamahusay na mga resulta para sa pagkuha ng teksto ay magmumula sa mga dokumento na may 200 hanggang 400 DPI na resolusyon. Kung mayroon kang isang mababang imahe ng DPI, ang mga resulta ay hindi magiging maganda.

Panghuli, maraming mga site na sinubukan ko na hindi lamang gumana. Kung Google ang libreng online na OCR, makakakita ka ng isang grupo ng mga site ngunit ang ilan sa mga site sa nangungunang 10 mga resulta ay hindi nakumpleto ang conversion. Ang ilan ay mawawala ang oras, ang iba ay magbibigay ng mga pagkakamali at ang ilan ay natigil lamang sa "pag-convert" na pahina, kaya hindi ko rin nabalisa na banggitin ang mga site na iyon.

Para sa bawat site, sinubukan ko ang dalawang dokumento upang makita kung gaano kahusay ang output. Para sa aking mga pagsubok, ginamit ko lang ang aking iPhone 5S upang kumuha ng larawan ng parehong mga dokumento at pagkatapos ay nai-upload ang mga ito nang direkta sa mga website para sa conversion.

Kung nais mong makita kung ano ang hitsura ng mga imahe na ginamit ko para sa aking pagsubok, inilakip ko ang mga ito dito: Test1 at Test2. Tandaan na hindi ito ang buong bersyon ng resolusyon ng mga imahe na kinuha mula sa telepono. Ginamit ko ang buong imahe ng resolusyon kapag nag-upload sa mga site.

OnlineOCR

Ang OnlineOCR.net ay isang malinis at simpleng site na naghatid ng napakagandang resulta sa aking pagsubok. Ang pangunahing bagay na gusto ko tungkol dito ay na wala itong mga toneladang ad sa buong lugar, na karaniwang nangyayari sa mga ganitong uri ng mga site ng niche service.

libre online ocr

Upang magsimula, piliin ang iyong file at maghintay hanggang matapos na ang pag-upload. Ang maximum na laki ng upload para sa site na ito ay 100 MB. Kung nagparehistro ka para sa isang libreng account, nakakakuha ka ng ilang mga dagdag na tampok tulad ng mas malaking laki ng pag-upload, mga multi-pahina na PDF, iba't ibang mga wika sa pag-input, higit pang mga conversion bawat oras, atbp.

Susunod, piliin ang iyong wika sa pag-input at pagkatapos ay piliin ang format ng output. Maaari kang pumili mula sa Word, Excel, o Text na Plain. I-click ang pindutan ng I-convert at makikita mo ang teksto na ipinapakita sa ibaba sa isang kahon kasama ang isang link ng pag-download.

output ng ocr

Kung ang nais mo ay ang teksto, kopyahin lamang at i-paste ito mula sa kahon. Gayunpaman, iminumungkahi kong i-download mo ang dokumento ng Salita dahil gumagawa ito ng isang nakakagulat na mahusay na trabaho sa pagpapanatili ng layout ng orihinal na dokumento.

Halimbawa, nang binuksan ko ang dokumento ng Salita para sa aking pangalawang pagsubok, nagulat ako nang makita na ang dokumento ay may kasamang talahanayan na may tatlong mga haligi, tulad ng imahe.

online na output

Sa lahat ng mga site, ang isa ay ang pinakamahusay sa malayo. Ito ay lubos na nagkakahalaga ng pagrehistro para sa kung kailangan mong gumawa ng maraming mga conversion.

Para sa pagkumpleto, pupunta rin ako sa link sa mga output file na nilikha ng bawat serbisyo upang makita mo ang mga resulta para sa iyong sarili. Narito ang mga resulta mula sa OnlineOCR: Test1 Doc at Test2 Doc.

Tandaan na kapag binubuksan ang mga dokumento na Salita sa iyong computer, makakakuha ka ng isang mensahe sa Salita na nagsasabi na mula sa Internet at hindi pinagana ang pag-edit. Iyon ay perpekto na OK dahil ang Salita ay hindi nagtitiwala sa mga dokumento mula sa Internet at hindi mo talaga kailangang paganahin ang pag-edit kung nais mo lamang na tingnan ang dokumento.

i2OCR

Ang isa pang site na nagbigay ng magandang resulta ay i2OCR. Ang proseso ay halos kapareho: piliin ang iyong wika, file, at pagkatapos ay pindutin ang Extract Text.

i2ocr

Kailangan mong maghintay ng isang minuto o dalawa dito dahil mas matagal ang site na ito. Gayundin, sa Hakbang 2, tiyakin na ang iyong imahe ay nagpapakita ng kanang bahagi sa preview, kung hindi, makakakuha ka ng isang bungkos ng gibberish bilang output. Para sa ilang kadahilanan, ang mga imahe mula sa aking iPhone ay ipinapakita sa portrait mode sa aking computer, ngunit tanawin nang mag-upload ako sa site na ito.

i2ocr output

Kailangan kong manu-manong buksan ang imahe sa isang app sa pag-edit ng larawan, paikutin ito 90 degrees, pagkatapos ay iikot ito pabalik sa larawan at pagkatapos ay i-save ito muli. Kapag kumpleto, mag-scroll pababa at magpapakita ito sa iyo ng isang preview ng teksto kasama ang isang pindutan ng pag-download.

Ang site na ito ay nagbabala nang maayos sa output para sa unang pagsubok, ngunit hindi ito ginawang mabuti sa pangalawang pagsubok na mayroong layout ng haligi. Narito ang mga resulta mula sa i2OCR: Test1 Doc at Test2 Doc.

FreeOCR

Dadalhin ng libre-OCR.com ang iyong mga imahe at i-convert ito sa payak na teksto. Wala itong pagpipilian upang ma-export sa format ng Word. Piliin ang iyong file, pumili ng isang wika at pagkatapos ay i-click ang Start.

Mabilis ang site at makakakuha ka ng mabilis sa output. Mag-click lamang sa link upang i-download ang text file sa iyong computer.

freeocr

Tulad ng nabanggit sa NewOCR sa ibaba, binabago ng site na ito ang lahat ng T sa dokumento. Wala akong ideya kung bakit ito gagawin, ngunit sa ilang kakatwang kadahilanan na ginawa ito ng site at NewOCR. Hindi ito isang malaking pakikitungo upang baguhin ito, ngunit ito ay isang nakakapagod na proseso na hindi mo talaga dapat gawin.

Narito ang mga resulta mula sa FreeOCR: Test1 Doc at Test2 Doc.

ABBYY FineReader Online

Upang magamit ang FineReader Online, kailangan mong magparehistro para sa isang account, na makakakuha ka ng isang 15-araw na libreng pagsubok sa OCR hanggang sa 10 mga pahina nang libre. Kung kailangan mo lamang gumawa ng isang beses na OCR para sa isang pares ng mga pahina, pagkatapos ay maaari mong gamitin ang serbisyong ito. Tiyaking na-click mo ang link na pag-verify sa email ng kumpirmasyon pagkatapos mong magrehistro.

finereader online

Mag-click sa Kilalanin sa tuktok at pagkatapos ay i-click ang Upload upang piliin ang iyong file. Piliin ang iyong wika, format ng output at pagkatapos ay i-click ang Kilalanin sa ibaba. Ang site na ito ay may malinis na interface at walang mga ad din.

Sa aking mga pagsusulit, ang site na ito ay nagawang kunin ang teksto mula sa unang dokumento ng pagsubok, ngunit ganap na napakalaking kapag binuksan ko ang Word doc, kaya natapos kong gawin itong muli at pagpili ng Plain Text bilang format ng output.

Para sa pangalawang pagsubok kasama ang mga haligi, walang laman ang dokumento ng Salita at hindi ko mahanap ang teksto. Hindi sigurado kung ano ang nangyari doon, ngunit tila hindi makayanan ang anupaman maliban sa mga simpleng talata. Narito ang mga resulta mula sa FineReader: Test1 Doc at Test2 Doc.

NewOCR

Ang susunod na site, NewOCR.com, ay OK, ngunit hindi halos kasing ganda ng unang site. Una, nakakakuha ng mga ad, ngunit salamat sa hindi isang tonelada. Pinili mo muna ang iyong file at pagkatapos ay i-click ang pindutan ng Preview.

mag-upload ng imahe

Pagkatapos ay maaari mong paikutin ang imahe at ayusin ang lugar kung saan nais mong i-scan para sa teksto. Ito ay medyo uri ng tulad ng kung paano gumagana ang proseso ng pag-scan sa isang computer na may nakalakip na scanner.

imahe ng ocr

Kung ang dokumento ay may maraming mga haligi, maaari mong suriin ang pindutan ng pagsasaayos ng layout ng Pahina at susubukan nitong hatiin ang teksto sa mga haligi. I-click ang pindutan ng OCR, maghintay ng ilang segundo upang makumpleto ito at pagkatapos ay mag-scroll pababa sa ilalim kapag nagre-refresh ang pahina.

Sa unang pagsubok, nakuha nito nang tama ang lahat ng teksto, ngunit para sa ilang kadahilanan na pinalaki ang bawat T sa dokumento! Walang ideya kung bakit gagawin iyon, ngunit nagawa ito. Sa pangalawang pagsubok na pinagana ang pag-aaral ng pahina, nakuha nito ang karamihan sa teksto, ngunit ang layout ay ganap na naka-off.

Narito ang mga resulta mula sa NewOCR: Test1 Doc at Test2 Doc.

Konklusyon

Tulad ng nakikita mo, ang libreng ay hindi nagbibigay sa iyo ng napakahusay na mga resulta sa karamihan sa oras sa kasamaang palad. Ang unang site na nabanggit ay ang pinakamahusay sa malayo dahil hindi lamang ito ay gumawa ng isang mahusay na trabaho sa pagkilala sa lahat ng teksto, pinamamahalaan din nitong mapanatili ang format ng orihinal na dokumento.

Kung kailangan mo lamang ng teksto, bagaman, ang karamihan sa mga website sa itaas ay dapat gawin iyon para sa iyo. Kung mayroon kang anumang mga katanungan, huwag mag-atubiling magkomento. Masaya!