Velkommen til World of Machine Vision

Det føles som maskinens visjon skårer opp overalt i disse dager, men hva er det?

Kameraet er en datamaskin

Maskinsyn er et system som bruker et kamera kombinert med en datamaskin og bildefortolkingsprogramvare for å lage data. Dataene blir i sin tur behandlet og brukt til å avgjøre en handling. I hovedsak er en maskin programmert til å lete etter en bestemt ting og deretter utføre en handling når den ser hva den leter etter.

For eksempel kan et kamera settes opp på fabrikkens pakkelinje for å lete etter mangler i emballasje. Når det oppstår en feil i en gjenstand, kan maskinen avvise det aktuelle elementet. Alt dette kan skje mye raskere enn om et menneske gjorde det samme.

Definisjonen av maskinsyn kan også inkludere alle typer maskiner som eksisterer for å lage bilder for tolkning, og derfor utfører de roller i produksjon, sikkerhet, overvåking og mer. Maskiner med kameraer blir brukt i en rekke oppgaver, for eksempel Celestial Tea, med kameraer til å utføre emballasje inspeksjon på transportbåndet, eller Tesla bruker teknologien til å få sine biler til å lese hastighetsgrense tegn og justere hastigheten tilsvarende. Et annet godt eksempel på maskinvisjon er i sikkerhetssektoren: Når du går gjennom tollkontrollen på flyplassen, knuser et kamera bildet ditt og bruker ansiktsgjenkjenning for å se etter personer som har blitt flagget.

Maskinvisjon og mønstergjenkjenningskraft Google Translate er på-fly-språkbytt.

Maskinsyn er her for å bli. Etter hvert som kameraene og teknologien blir billigere, blir de integrert i flere steder og gjør flere oppgaver på en raskere og mer pålitelig måte enn et menneske. Som fotografer vil vi få mer tilgang til teknologien for å hjelpe oss med å gjøre vårt arbeid. Teknologien vil redde oss fra å gjøre de mer kjedelige oppgavene knyttet til vårt arbeid, og hjelpe oss med å behandle og katalogisere store mengder informasjon.

Mekanikken til maskinvisjonen

Maskinsynet bruker synlig lys og et kamera for å ta et bilde. Bildene i bildet blir deretter behandlet av programvare som søker etter kontrastområder eller piksler med angitte verdier. Noen eksempler på parametere programvaren ser etter er:

  • Kantdeteksjon: finner objektkanter
  • Fargevalg: Søker etter farge innenfor et spesifikt RGB-område
  • Pixeltelling: teller antall lys eller mørke piksler
  • Mønstergjenkjenning: piksler i et bestemt arrangement
  • Dybdemåling: Bruk bilder til å modellere tredimensjonalt mellomrom

Det er mange flere parametere som algoritmer kan jakte på i et hav av piksler. Den nøyaktige prosessen avhenger av søknaden. Faktisk utvikles programvaren ofte i takt med den rollen den skal utføre.

Maskinsyn på jobben

Maskinens synsfelt stammer fra spennende og spennende eksempler på applikasjoner både nåværende eller bare i horisonten. Et godt eksempel er et kamera som kan gi en synskadet informasjon om et objekt, en bygning eller omtrent alt som er foran dem. Du kan allerede bruke en smarttelefon kamera til å gjenkjenne et maleri i et museum og få det til å fortelle deg navnet til maleren. Du kan til og med bruke smarttelefonen til å oversette utenlandsk tekst på et tegn.

Google Translate-app ved hjelp av OCR for å oversette tekst.

Andre eksempler inkluderer:

Ansiktsgjenkjenning

  • Lås opp enheter og datamaskiner
  • Overvåkning
  • Merking av bilder i Adobe Photoshop Lightroom

Optisk karaktergjenkjennelse

  • Serienummer lesing
  • Lisensplaten lesere
  • Prosjekt Gutenberg (bokdigitalisering)
  • Biler som leser fartbegrensningstegn

Inspisere på en produksjonslinje

  • Emballasje kan inspiseres for riktig tetting
  • Deler kan inspiseres for feil
  • Måle væskenivåer i en tappelinje eller måle delstørrelser
  • Teller for å sørge for at en boks med 24 har riktig beløp

Jordbruk

  • Beskjær vedlikehold og vanning
  • høsting
  • Etter høstkvalitetskontroll

Vitenskap

  • Cellanalyse
  • Kartlegging og GIS analyse
  • Værmodell

Hva betyr maskinvisjon for fotografer?

Nå kan du være bekymret for at maskiner med kameraer vil erstatte deg. Jeg forsikrer deg, jobben din er trolig trygg i overskuelig fremtid. Menneskefotografer tar bilder for mennesker å tolke, dele og nyte. Maskiner er ikke helt i stand til å forstå alle nyanser som kan leses på et fotografi enda, og derfor vil de bli sittende fast i industrien for en stund lenger.

På den annen side er det noen forstyrrende utviklinger i feltet hvis du er en profesjonell retoucher eller redaktør. Googles kunstige intelligens kan nå automatisk kombinere og retusjere bilder på noen forstyrrende måter, og opprette og redigere historier. Kanskje det virker som en gimmick nå, men det gjorde også fotografering i det tidligste.

Men å sette vår eksistensielle angst til side for et sekund, er det mange måter du kan bruke maskinvisjon til din egen fordel som fotograf.  

En lovende måte å bruke maskinens visjonsteknologi på, er automatisk merking, hvor programvaren forsøker å se på innholdet i et bilde og vise ut de tingene som er til stede. Hvis du for eksempel har analysert et bilde av jordbær, kan programvaren returnere kodene: bær, frukt, jordbær, friskt. Denne automatiserte prosessen lover å eliminere mange timer med manuelt tagging av bilder med søkeord. Bildedelsstedet Flickr, for eksempel, automatisk tagger for deg når du laster opp.

En annen maskinens visjonsteknologi som er tilgjengelig for fotografer akkurat nå, er ansiktsgjenkjenning som en del av Lightroom 6, Apple Photos og Picasa. Ansiktsgjenkjenning vurderer bildene dine og ser etter ansikter. Det grupperer deretter lignende ansikter sammen som programmet synes å tilhøre den samme personen. Du må fortsatt gå inn og gi et navn til ansiktet og sortere ut falske kamper, men denne teknologien kan hjelpe deg med å finne og holde oversikt over alle bildene du har tatt for kunder.

Bruk ansiktsgjenkjenning i Adobe Lightroom til å merke personer.

Kanskje ditt neste bildeoppdrag kan innebære å lage bilder som vil bli utsatt for noen form for maskiner for å samle inn data. Hvis det er tilfelle, må du vite hva det systemet ser etter for å hjelpe prosessen sammen. For eksempel, hvis programvaren er på utkikk etter endringer i kontrast, vil du ønske å vite hvordan du justerer belysningen for å bedre oppdage kontrast.

The Takeaway på Machine Vision

Maskinsyn er et lovende teknologisk område som kan være svært nyttig i mange bransjer og roller, blant annet for fotografer. Mens det ikke er en umiddelbar fare for å bli erstattet av en maskin med et kamera, er det nok mulighet til å bruke den nye teknologien for å forbedre arbeidsflyten din. Den digitale revolusjonen har ført til en spredning av kameraer og bilder, muligens flere bilder enn vi kan være fornuftige uten å bruke noen slags maskinvisjon for å hjelpe oss å tolke.