Slik lagrer du OCR-tekst i PDF- og bildefiler i Adobe Acrobat

Skannede dokumenter er flotte. De lar deg arkivere stabler papir i mapper på datamaskinen din, tar opp langt mindre plass og er uendelig enklere å organisere, flytte og kopiere. Det som ikke er så bra er å finne innhold lagret vekk i et av hundrevis av skannede dokumenter. Som standard er de lite mer enn et bilde av dokumentet ditt, og hvis du vil finne informasjon i dem, må du åpne hver og lese det selv.

Du kan også la datamaskinen gjøre den tunge løftet for deg ved å slå bildet i tekst og la deg søke gjennom dine skannede dokumenter like enkelt som du søker gjennom andre dokumenter. Det er hva OCR-Optical Character Recognition-gjør. Den bruker datamaskinens smarts til å gjenkjenne bokstavformer i et bilde eller skannet dokument, og slå dem til digital tekst som du kan kopiere og redigere etter behov.

Slik bruker du OCR-verktøyet som er innebygd i Adobe Acrobat, slik at du skann dine skannede dokumenter og bilder av tekst til ekte digital tekst.

OCR et dokument eller bilde i Acrobat

Adobe Acrobat er det opprinnelige standardprogrammet for oppretting, redigering og visning av PDF-filer. Den brukes ofte i virksomheten, og er kombinert med Adobe Creative Suite og den fullstendige versjonen av Creative Cloud, så det er en god sjanse for at bedriftens datamaskin allerede har den installert, eller du kan installere den gratis fra Creative Cloud-abonnementet ditt. I så fall er det et flott verktøy for å OCR dokumentene dine raskt på en Mac eller PC.

Merk: denne opplæringen krever Adobe Akrobat, ikke Adobe Leser. Sistnevnte er en gratis app bare for visning av PDF-filer. Hvis det er alt du har, hoppe til slutten av denne opplæringen for noen andre gode OCR-verktøy du kan bruke.

Åpne bildet ditt eller PDF og få Acrobat til å gjenkjenne teksten

Acrobat kan gjenkjenne tekst i en hvilken som helst PDF- eller bildefil i dusinvis av språk. Alt du trenger å gjøre er å åpne det skannede dokumentet eller bildet du vil OCR, og klikk deretter på det blå Verktøy knappen øverst til høyre i verktøylinjen. I det sidebaret velger du Gjenkjenne tekst kategorien, og klikk deretter på I denne filen knapp.

Du får nå noen alternativer for å finjustere OCR-en. Hvis du gjenkjenner et dokument som er på datamaskinens standard språk (engelsk) i mitt tilfelle), klikker du bare på OK for å få teksten gjenkjent. Ellers klikker du på Redigere… knappen for å velge OCR-språket, velg PDF-utgangsstilen, og oppløsningen du vil bruke Acrobat, mens du gjenkjenner teksten.

Koble til OCR-innstillingene dine

Etter en kort pause som er angitt av en fremdriftslinje nederst i vinduet, blir teksten fullstendig gjenkjent. Det tok bare rundt 15 sekunder å gjenkjenne tekst på en skannet 1-sidig form på min MacBook Air 2012, men et par minutter på en 30-siders fullfarge lærebok PDF. Når det er gjort, kan du velge hvilken som helst tekst i dokumentet og kopiere den som vanlig, eller søke etter tekst i dokumentet. Som standard lagrer Acrobat den gjenkjente teksten i den opprinnelige filen når du OCR en PDF, og hvis du OCR et bilde, lagrer du bildet med teksten i en ny PDF-fil. Uansett vil den gjenkjente teksten dukke opp i en PDF-leser etterpå, akkurat som om det var et originalt digitalt dokument.

Kopier tekst fra et skannet dokument som ren tekst eller med formatering - eller bruk bare PDF-filen som en vanlig PDF

Med teksten som er gjenkjent, kan du nå markere PDF-filen ved hjelp av alle de vanlige markeringsverktøyene. Du kan markere, krysse tekst og mer. Du kan til og med kopiere teksten med den oppdagede formateringen, selv om den ofte er mindre nøyaktig enn selve tekstgenkjenningen.

Eksporter dine OCRed-dokumenter

Hvis du vil redigere dine originale skannede dokumenter, eller kanskje bruke informasjonen i dem i et nytt dokument, vil du ha mer enn bare valgbar tekst på en PDF. Du vil at hele dokumentet skal konverteres. Acrobat gjør det så enkelt også, OCRing teksten og eksporterer den som et nytt dokument i ett trinn.

Bare åpne dokumentet du vil OCR og konverter, klikk Fil > Lagre som… og velg formatet du vil ha. Du kan eksportere som et Word- eller Rich Text Document, Excel eller CSV-regneark, eller som HTML. Legg til filnavnet du vil ha, og stedet du vil lagre den nye filen, og klikk Lagre. Acrobat fortsetter å vise samme fremdriftslinje nederst i vinduet som det gjenkjenner teksten og formateringen i dokumentet, og deretter lagres den eksporterte kopien.

Eksporter bilder og PDF-filer fra Acrobat med varierende resultater.

Akrobateksport fra skannede dokumenter er både overraskende bra og frustrerende dårlig. Den vil gjenkjenne det meste av teksten og formateringen, og du vil sannsynligvis bli overrasket over hvor fint det ferdige eksporterte dokumentet ser ut hvis det ikke er for komplisert. Men så er det fortsatt ikke det opprinnelige dokumentet. Det vil bli feil, formatering du må fikse, og mer. Den beste måten er alltid å bruke det originale digitale dokumentet, men dette er en fin måte å få tilbake en digital kopi av et dokument hvis alt du har er en skanning.

Selv om OCR ikke er perfekt, er Acrobats OCR ganske bra. I dette skannede skjemaet ble nesten hvert ord oppdaget riktig, men en forekomst av ordet Navn ble oppdaget som N "" e. Det er helt bra nok hvis du bare ønsker å kunne gjennomgå dokumentene dine ved hjelp av PDF-leserens søkeverktøy, men hvis du faktisk bruker OCR til å lage en kopi av den opprinnelige teksten, vil du prøve -les det først og sørg for å rette opp eventuelle åpenbare feil.

OCR flere dokumenter på en gang

Har du massevis av dokumenter du vil OCR på en gang? Acrobat er også bra for det. Bare åpne et hvilket som helst dokument i Acrobat, og åpne deretter Gjenkjenne tekst sidefelt som før. Denne gangen velger du I flere filer knappen, og du får se et vindu der du kan dra alle filene du vil OCR. Igjen kan du legge til PDF- eller bildefiler, og Acrobat vil gjenkjenne teksten og lagre dem i PDF-format. Det er også noen ekstra alternativer, hvor du kan velge hvor du skal lagre de ferdige filene og hvordan du vil ha dem som heter.

Andre OCR-verktøy

Acrobat er ikke den eneste måten å OCR-tekst fra dine skannede dokumenter, selvfølgelig. Hvis du ikke allerede har en kopi av det, er det massevis av andre verktøy du kan bruke. Vi dekket allerede de beste verktøyene for OCR på Mac: Prizmo, FineReader, Doxie app, PDFPen og Evernote. Prizmo og PDFPen vil også fungere på IOS-enhetene dine for OCR på farten, og Doxie-appen fungerer også på PCer. Evernote lar deg ikke kopiere tekst ut, men det fungerer overalt - og på PCen er OneNotes OCR flott og gratis.

Det er også det gratis Tesseract OCR-biblioteket, med en veldig grunnleggende gratis Mac-app som kan gjenkjenne tekst for deg. Et annet budsjettvennlig OCR-verktøy er Pica-tekst, for $ 3,99. Uansett, hvis OCR er alt du trenger, trenger du ikke å få en kopi av Acrobat bare for det - men hvis du har Acrobat, er OCR-verktøyet et flott tillegg.

Konklusjon

Med noen få minutter til OCR er PDF-dokumentene alt du trenger for å få dem til å være grunnleggende bilder av papirdokumenter til fullverdige digitale dokumenter du kan søke, kopiere tekst fra, markere og eksportere i Office-formater. Acrobat har blitt malignert for sin PDF-leser, men det har fortsatt massevis av flotte funksjoner, og OCR er en av dem.

Hvis du har en kopi av Acrobat eller et Creative Cloud-abonnement, kan du prøve det og få de skannede dokumentene OCRed. De vil øyeblikkelig være mye mer verdifullt for deg enn de noen gang hadde vært som enkle skanninger.

Dataferdigheter