Hvis du skal papirløs, trenger du en enkel måte å gjøre de skannede dokumentene søkbare, slik at de er mer enn bare statiske bilder av papirdokumenter. Vi har allerede sett på måter å OCR-dokumenter på i programmer som Adobe Acrobat, PDFPen og Google Drive. Selv om hver av disse appene kan gjenkjenne tekst i dokumentene dine, er det ikke deres primære funksjon.
Kanskje en av de mest kjente OCR-utviklerne er ABBYY, som produserer mange forskjellige papirløse styringsprogrammer. I denne veiledningen vil jeg vise deg hvordan du kan bruke sin FineReader for webapplikasjoner og dens OCR-teknologi for å konvertere PDF-filer, skanninger og andre bildefiler til redigerbar tekst.
Selv om nettversjonen ikke er like kraftig som desktopversjonen, er ABBYY FineReader Online kanskje den kraftigste online OCR-tjenesten tilgjengelig nå.
ABBYY FineReader tar ut det meste av arbeidet som måtte ha blitt gjort for at OCR skal lykkes i en annen tjeneste, da forbehandling er utført i selve appen. ABBYY FineReader korrigerer bildeforvrengninger, for eksempel sideorientering og støy, før du starter skanningen. Selvfølgelig er aspekter som lysstyrke og bildekvalitet avhengig av brukeren, men ingen videre redigering vil være nødvendig på brukerens slutt.
Etter forhåndsbehandlingen bryter ABBYY FineReader dokumentet ned i elementer som tabeller, bilder og tekstblokker før det oppdages linjer og individuelle bokstaver og ord. Teknologien bestemmer da forholdet mellom alle egenskapene til siden til hverandre. Dette er for å sikre nøyaktig replikering ikke bare av teksten i dokumentet, men hele oppsettet av selve siden.
ABBYY FineReader Online støtter nå 42 språk, selv de med ikke-latinske tegn som hebraisk og koreansk. Det er ordbokstøtte for 37 av disse språkene, noe som bidrar til å skape en enda mer nøyaktig rekreasjon ved å sjekke oppdagede ord i minst en ordbok. Tjenesten kan OCR på dokumenter med opptil tre forskjellige språk på et gitt tidspunkt.
Den komplette listen over støttede språk for ABBYY FineReader Online.I tillegg til språkstøtte kan tjenesten skanne gamle tekster på tysk og latvisk som ble satt i svart brev, noe som gjør ABBYY FineReader Online et mulig alternativ for OCR av historiske dokumenter.
En tjeneste denne kraftige kommer ikke uten pris. OCR på ABBYY FineReader Online er ikke altfor kostbar: sidekreditt koster mellom $ 3- $ 10USD for inkrementer på henholdsvis 20-200 sider. Du får imidlertid 20 sider på gratis når du registrerer deg for tjenesten.
Når du har logget deg på din ABBYY FineReader Online-konto, blir du omdirigert til opplastingssiden.
Finn først dokumentet eller bildet du vil laste opp, og sørg for at ABBYY FineReader støtter OCR for filen din. Tjenesten støtter OCR for PDF, .jpg, .png, .bmp, .pcx, .dcx, .tif, .gif og .djvu filer. Maksimal filstørrelse er 30 MB.
Tips: For best resultat, kontroller at filen din er av høy kvalitet, og størrelsen på teksten er minst 9pt eller 10pt.
Hvis du vil OCR et fysisk dokument, bruker du en maskinvareskanner, for eksempel Doxie, eller en mobilapp for å konvertere det fysiske dokumentet til et ABBYY FineReader-kompatibelt filformat.
Når dokumentet ditt er klar for opplasting, klikker du på Laste opp knappen under Legg inn en fil som skal behandles felt. Finn din fil i Finder-vinduet, og klikk Åpen. Jeg vil anbefale å sjekke av Send meg en nedlastingskobling via e-post boksen rett under filfeltet for enkel tilgang til det gjenskapte dokumentet etter at det har blitt OCRed. Den opplastede filen vises i Velg filer som skal behandles feltet noen få seksjoner nedenfor.
Velg en fil for opplasting.Deretter definerer du språkene til dokumentet ditt under Velg språket (e) av dokumentet ditt felt. Bla gjennom listen til du finner språkene i dokumentet ditt. Hvis du har mer enn én, velger du de ekstra språkene ved å holde inne Kommando nøkkel hvis du bruker en Mac eller Styre nøkkel, hvis du bruker en PC, og klikker.
ABBYY FineReader Online støtter OCR for opptil tre språk i et enkelt dokument.Hvis du skanner et eldre dokument som ble satt i svart bokstav, klikker du på hyperlink til høyre for språkvalgboksen. Språlisten vil endres og tilby deg de riktige tyske og latviske alternativene til OCR.
Deretter går du til Velg et utdataformat feltet for å velge formatet som filen vil bli OCRed. På dette tidspunktet kan ABBYY FineReader Online eksportere filene som Microsoft Word eller Excel (i både 97-2003 og nye versjonformater), Open Office, PDF, RTF eller plain text-dokumenter. Velg formatet du vil at det endelige dokumentet skal konverteres til, fra rullegardinmenyen.
Velg et utdataformat fra rullegardinmenyen.Tips: Når du velger dokumentutgang, vær forsiktig med tabeller, diagrammer og andre bilder som kan være i innskrivingsdokumentet, fordi tekstbehandleren kanskje ikke kan håndtere dem riktig og gi dårlige resultater.
Kontroller at dokumentene du vil OCRed, er merket av i Velg filer som skal behandles felt. Trykk nå på Kjenne igjen knappen, og ABBYY FineReader vil starte OCR.
trykk Kjenne igjen for å starte OCR-prosessen.Etter å ha trykket på Kjenne igjen, Du blir omdirigert til Oppgavehistorikk siden, hvor du kan sjekke fremdriften til OCRed-dokumentet. Avhengig av filens størrelse kan OCR ta alt fra noen få sekunder til få minutter.
Når behandlingen er ferdig, kan du laste ned dokumentet ditt i formatet du valgte, samt eksportere dokumentet direkte fra web-appen til Google Disk, Evernote og Dropbox. Du kan også vurdere kvaliteten på OCR-jobben, noe som gjør at ABBYY kan forbedre sine produkter.
Når behandlingen er ferdig, kan du laste ned dokumentet eller eksportere det direkte til en skygtjeneste.OCRed-dokumenter forblir på ABBYY FineReader-serveren i to uker før de slettes automatisk.
ABBYY FineReader Online er en enkel måte å OCR kompliserte dokumenter på nettet for en lav pris. Selv om det ikke er helt perfekt når det gjelder bilder og andre stilistiske elementer, oversetter den tekst feilfritt, selv i dokumenter med mer enn ett språk, til mange forskjellige redigerbare filformater.
Hvis du har problemer med OCR i ABBYY FineReader Online, eller noen tanker eller bekymringer om OCR eller gå papirløs generelt, legg igjen en kommentar nedenfor!