Billedanmærkning og mærkning til computervision

Den ultimative køberguide 2023

Computersyn er et stort emne, og det er ikke muligt for techpreneurs og håbefulde iværksættere at vide helt om dem på kort tid. Især når de udvikler et produkt baseret på computersyn og har begrænset tid til at markedsføre, har de brug for noget omfattende og væsentligt for at kende de grundlæggende i computersyn og billedkommentarer for at have funktionel viden og træffe informerede beslutninger.

Denne vejledning håndplukker koncepter og præsenterer dem på de enkleste måder, så du har god klarhed om, hvad det handler om. Det hjælper dig med at få en klar vision om, hvordan du kan gå videre med at udvikle dit produkt, de processer, der ligger bag det, de involverede tekniske ting og mere. Så denne vejledning er ekstremt opfindsom, hvis du er:

Billedkommentar

Introduktion

Har du brugt Google Lens for nylig? Hvis du ikke har gjort det, ville du indse, at den fremtid, vi alle har ventet på, endelig er her, når du først begynder at udforske dens vanvittige muligheder. En enkel, ekstra funktionel del af Android-økosystemet, udviklingen af ​​Google Lens fortsætter med at bevise, hvor langt vi er kommet med hensyn til teknologisk udvikling og udvikling.

Fra det tidspunkt, hvor vi simpelthen stirrede på vores enheder og kun oplevede envejskommunikation - fra mennesker til maskiner, har vi nu banet vejen for ikke-lineær interaktion, hvor enheder kan stirre lige tilbage på os, analysere og behandle det, de ser i realtid.

Billedkommentar

De kalder det computersyn, og det handler om, hvad en enhed kan forstå og give mening om virkelige elementer fra det, den ser gennem kameraet. Når vi vender tilbage til Google Lens fantastiskhed, kan du finde oplysninger om tilfældige objekter og produkter. Hvis du blot peger dit enheds kamera på en mus eller et tastatur, fortæller Google Lens dig enhedens mærke, model og producent.

Derudover kan du også pege på en bygning eller et sted og få detaljer om det i realtid. Du kan scanne dit matematiske problem og have løsninger til det, konvertere håndskrevne noter til tekst, spore pakker ved blot at scanne dem og gøre mere med dit kamera uden nogen som helst grænseflade.

Computersyn slutter ikke der. Du ville have set det på Facebook, når du prøver at uploade et billede til din profil, og Facebook automatisk registrerer og mærker ansigter på dig og dine venners og familie. Computersyn er at hæve folks livsstil, forenkle komplekse opgaver og gøre det lettere for mennesker.

Men hvorfor siger vi alt dette?

Det er simpelt. At komme til det punkt, vi befinder os lige nu, har ikke været så simpelt. Hvis Google Lens med det samme kunne registrere et billede og trække alt, hvad der er på Internettet om det, har det taget mange års udvikling og træning. Succesen med computersyn koger helt ned til det, vi kalder billedkommentarer - den grundlæggende proces bag teknologien, der får computere og enheder til at tage intelligente og ideelle beslutninger.

Der kan ikke være nogen computersyn og dets allierede fordele uden billedkommentarer, og det er netop det, vi er ved at diskutere og udforske i denne omfattende guide. Fra det grundlæggende om, hvad billedannotering handler om, til hvordan du kan finde de rigtige leverandører, vil vi undersøge alle aspekter. Dette hjælper dig med at udvikle et bedre produkt og i sidste ende udvide din viden om moduler til maskinindlæring og dyb læring.

Billedkommentar

Hvad er billednotering

Lad os være ærlige. Computere er grundlæggende og ganske dumme. De skal få instruktioner om skeen, hvordan de udfører opgaver. Det er først for nylig, at fremskridt har gjort det muligt for maskiner at udvikle evnen til at tænke autonomt gennem kunstig intelligens, maskinindlæring og dyb læring og komme på de bedste måder at løse et problem på.

Når en utrænet enhed ser på billedet af et palme, ved det ikke, hvad det er. Dens viden svarer næsten til et spædbarn, der ikke har lært, hvad et træ er. Maskiner skal læres, hvad et træ er, og de forskellige typer træer i verden.

Billednotering er en delmængde af datamærkning, der også er kendt under navnet billedmærkning, transkribering eller mærkning, der involverer mennesker i back-end, utrætteligt tagger billeder med metadataoplysninger og attributter, der hjælper maskiner med at identificere objekter bedre. I betragtning af det samme eksempel på træer dedikerer maskinindlæringseksperter en stor del af deres tid til at kommentere billeder af træer og angive, hvad et palme er, og hvordan det ser ud. Dette giver en enhed mulighed for nøjagtigt at registrere palmer.

Processen er dog ikke afsluttet endnu. Det ser ud til, at maskiner nu har mestret processen med at detektere palmer, men kun når du viser dem billedet af et piletræ, vil du indse, at maskinen ikke er klar endnu. Så eksperter er nødt til at kommentere billeder for at instruere maskiner, hvad palmer også er 'ikke'. Gennem kontinuerlig træning i årevis lærer maskiner at opdage og identificere objekter problemfrit afhængigt af deres niche, formål og datasæt.

Billedkommentar for computersyn 

BilledkommentarBilledkommentar er en delmængde af datamærkning, der også er kendt under navnet billedmærkning, transkribering eller mærkning, som billedannotering involverer mennesker i backend, og utrætteligt tagger billeder med metadataoplysninger og attributter, der hjælper maskiner med at identificere objekter bedre.

Billeddata

  • 2-D-billeder
  • 3-D-billeder

Typer af kommentar

  • Billedklassificering
  • Objektdetektion
  • Billedsegmentering
  • Object Tracking
  • Billedtranskription

Annoteringsteknikker

  • Afgrænsningsboks
  • polyline
  • Polygon
  • Vartegn-kommentar

Hvilken slags billeder kan kommenteres?

  • Billeder og billeder med flere billeder, dvs. videoer, kan mærkes til maskinindlæring. De mest almindelige typer er:
    • 2-D & multi-frame billeder (video), dvs. data fra kameraer eller spejlreflekskameraer eller et optisk mikroskop osv.
    • 3-D & multi-frame billeder (video), dvs. data fra kameraer eller elektron-, ion- eller scanningssondemikroskoper osv.

Hvilke detaljer føjes til et billede under kommentar?

Alle oplysninger, der lader maskiner få en bedre forståelse af, hvad et billede indeholder, kommenteres af eksperter. Dette er en ekstremt arbejdskrævende opgave, der kræver utallige timers manuel indsats.

For detaljerne afhænger det af projektspecifikationer og krav. Hvis projektet kræver, at det endelige produkt bare klassificerer et billede, tilføjes passende oplysninger. For eksempel, hvis dit computersynsprodukt handler om at fortælle dine brugere, at det, de scanner, er et træ og skelne det fra en krybning eller en busk, ville kommenterede detaljer kun være et træ.

Imidlertid, hvis projektkravene er komplekse og kræver mere indsigt, der skal deles med brugerne, vil kommentar indebære inkludering af detaljer som træets navn, dets botaniske navn, jord- og vejrkrav, ideel væksttemperatur og mere.

Med disse informationer analyserer og behandler maskiner input og leverer nøjagtige resultater til slutbrugere.

Billedkommentar

Typer af billedkommentarer 

Et billede indeholder normalt flere elementer. Du kan fokusere på et bestemt emne eller et objekt, men du vil stadig have andre elementer i dit billede. Nogle gange kræves disse objekter til analyse, og andre gange skal de elimineres for at holde forekomster af bias eller data skæv til side. Uanset tilfælde skal maskiner kende alle elementerne i et billede for at tage deres egne beslutninger. Billedkommentar indebærer også at identificere andre objekter. Selvom dette adskiller sig fra projekt til projekt, er det godt at have en idé om forskellige billedkommenteringsfunktioner.

For at få det visuelle af, hvordan det gøres, lad os bruge følgende billede som vores reference. Hvis du bemærker, ser billedet simpelt og klart ud, men vær opmærksom på antallet af forskellige elementer i det. Du har biler, bygninger, fodgængerfelt, trafiklys og meget mere. Hvis du forfiner det yderligere, er der taxaer og private køretøjer, bygninger og skyskrabere, skilt og meget mere. Billedkommentar handler om at gå i detaljerne.

Typer af billedkommentarer

Billedklassificering

Billedklassificering

Den mest basale type, hvor objekter er bredt klassificeret. Så her involverer processen bare identificering af elementer som køretøjer, bygninger og trafiklys.

Objektdetektion

Objektdetektion

En lidt mere specifik funktion, hvor forskellige objekter identificeres og kommenteres. Køretøjer kan være biler og taxaer, bygninger og skyskrabere og bane 1, 2 eller mere.

Billedsegmentering

Billedsegmentering

Dette går nærmere ind på hvert billede. Det indebærer at tilføje info om et objekt, dvs. farve, placeringsudseende osv. For at hjælpe maskiner med at differentiere. For eksempel ville køretøjet i midten være en gul taxa på bane 2.

Object Tracking

Objektsporing

Dette indebærer at identificere et objekts detaljer såsom placering og andre attributter på tværs af flere rammer i samme datasæt. Optagelser fra videoer og overvågningskameraer kan spores for objektbevægelser og studiemønstre.

Billedkommentarteknikker

Billedkommentering sker gennem forskellige teknikker og processer. For at komme i gang med billedkommentarer har man brug for en softwareapplikation, der tilbyder de specifikke funktioner og funktionaliteter, og de nødvendige værktøjer til at kommentere billeder baseret på projektkrav.

For uinitierede er der flere kommercielt tilgængelige billedannoteringsværktøjer, der giver dig mulighed for at ændre dem til din specifikke brugssag. Der er også værktøjer, der også er open source. Men hvis dine krav er niche, og du føler, at modulerne, der tilbydes af kommercielle værktøjer, er for grundlæggende, kan du få et tilpasset billednoteringsværktøj udviklet til dit projekt. Dette er naturligvis dyrere og tidskrævende.

Uanset hvilket værktøj du bygger eller abonnerer på, er der visse billedannoteringsteknikker, der er universelle. Lad os se på, hvad de er.

Afgrænsningskasser

Afgrænsningskasser

Den mest basale billednoteringsteknik involverer eksperter eller kommentatorer, der tegner en boks omkring et objekt for at tildele objektspecifikke detaljer. Denne teknik er mest ideel til at kommentere objekter, der har symmetrisk form.

En anden variation af afgrænsningskasser er cuboider. Disse er 3D-varianter af afgrænsningsbokse, som normalt er todimensionelle. Cuboids sporer objekter på tværs af deres dimensioner for mere nøjagtige detaljer. Hvis du overvejer ovenstående billede, kan køretøjerne let kommenteres gennem afgrænsningsbokse.

For at give dig en bedre idé giver 2D-kasser dig detaljer om et objekts længde og bredde. Kuboidteknikken giver dig dog også detaljer om objektets dybde. Annotering af billeder med cuboids bliver mere beskatning, når et objekt kun er delvis synligt. I sådanne tilfælde tilnærmer annotatorer et objekts kanter og hjørner baseret på eksisterende visuals og information.

Landemærkning

Landemærkning

Denne teknik bruges til at få forviklingerne frem i bevægelser af objekter i et billede eller optagelser. De kan også bruges til at registrere og kommentere små objekter. Vartegn bruges specifikt i ansigtsgenkendelse til annoterede ansigtstræk, gestus, udtryk, stillinger og mere. Det indebærer individuelt at identificere ansigtstræk og deres egenskaber for nøjagtige resultater.

For at give dig et virkeligt eksempel på, hvor vartegn er nyttigt, skal du tænke på dine Instagram- eller Snapchat-filtre, der nøjagtigt placerer hatte, beskyttelsesbriller eller andre sjove elementer baseret på dine ansigtsegenskaber og udtryk. Så næste gang du stiller til et hundefilter, skal du forstå, at appen har markeret dine ansigtsegenskaber for at få præcise resultater.

polygoner

polygoner

Objekter i billeder er ikke altid symmetriske eller regelmæssige. Der er mange tilfælde, hvor du finder dem at være uregelmæssige eller bare tilfældige. I sådanne tilfælde anvender annotatorer polygonteknikken til præcist at kommentere uregelmæssige former og objekter. Denne teknik indebærer at placere prikker på tværs af et objekts dimensioner og tegne linjer manuelt langs objektets omkreds eller omkreds.

Lines

Lines

Bortset fra grundlæggende former og polygoner bruges enkle linjer også til at kommentere objekter i billeder. Denne teknik giver maskiner mulighed for problemfrit at identificere grænser. For eksempel trækkes linjer over kørebaner til maskiner i autonome køretøjer for bedre at forstå de grænser, inden for hvilke de har brug for at manøvrere. Linjer bruges også til at træne disse maskiner og systemer til forskellige scenarier og omstændigheder og hjælpe dem med at træffe bedre kørselsbeslutninger.

Brug sager til billedkommentarer

Dette afsnit taler om, hvordan billedannotering eller billedmærkning kan bruges til at træne ML-modeller til at udføre specifikke opgaver baseret på deres respektive brancher.

Retail

Detail: I et indkøbscenter eller en købmand kan 2-D afgrænsningskasse-teknik bruges til at mærke billeder af produkter i butikken, dvs. skjorter, bukser, jakker, personer osv. Til effektivt at træne ML-modeller om forskellige attributter såsom pris, farve, design osv

Healthcare: Polygonteknik kan bruges til at kommentere/mærke menneskelige organer i medicinske røntgenstråler for at træne ML-modeller til at identificere deformiteter i det menneskelige røntgen. Dette er en af ​​de mest kritiske anvendelsessager, som revolutionerer sundhedspleje industri ved at identificere sygdomme, reducere omkostninger og forbedre patientoplevelsen.

Medicinal
Selvkørende biler

Selvkørende biler: Vi har allerede set succesen med autonom kørsel, men vi har en lang vej at gå. Mange bilproducenter har endnu ikke vedtaget den nævnte teknologi, der er afhængig af semantisk segmentering, der mærker hver pixel på et billede for at identificere vejen, biler, trafiklys, pol, fodgængere osv., Så køretøjer kan være opmærksomme på deres omgivelser og kan fornemme forhindringer på deres måde.

Følelsesdetektion: Skelsættende annotering bruges til at opdage menneskelige følelser/følelser (glad, trist eller neutral) til at måle subjektets følelsesmæssige sindstilstand ved et givet stykke indhold. Følelsesdetektering eller følelser analyse kan bruges til produktanmeldelser, service anmeldelser, film anmeldelser, e -mail klager/feedbacks, kundeopkald og møder osv.

Følelsesdetektering
Forsyningskæde

Forsyningskæde: Linjer og splines bruges til at mærke baner i et lager for at identificere stativer baseret på deres leveringssted, hvilket igen vil hjælpe robotterne med at optimere deres sti og automatisere leveringskæden og derved minimere menneskelig indblanding og fejl.

Hvordan nærmer du dig billedkommentarer: Internt vs Outsource?

Billednotering kræver investeringer ikke kun med hensyn til penge, men også tid og kræfter. Som vi nævnte, er det arbejdskrævende, der kræver omhyggelig planlægning og flittig involvering. Hvilken billedannotator attributter er, hvad maskinerne behandler og leverer resultater. Så billedkommenteringsfasen er yderst afgørende.

Fra et forretningsmæssigt perspektiv har du to måder at gå til annotering af dine billeder - 

  • Du kan gøre det internt
  • Eller du kan outsource processen

Begge er unikke og tilbyder deres egen rimelige andel af fordele og ulemper. Lad os se på dem objektivt. 

In-house 

I dette tager din eksisterende talentmasse eller teammedlemmer sig af billedkommentarer. Den interne teknik indebærer, at du har en datagenereringskilde på plads, har det rigtige værktøj eller dataarnnotering platform og det rigtige team med et tilstrækkeligt færdighedssæt til at udføre annotationsopgaver.

Dette er perfekt, hvis du er en virksomhed eller en kæde af virksomheder, der er i stand til at investere i dedikerede ressourcer og teams. At være en virksomhed eller en markedsaktør, ville du heller ikke have mangel på datasæt, hvilket er afgørende for at dine træningsprocesser kan begynde.

outsourcing

Dette er en anden måde at udføre billedbemærkningsopgaver på, hvor du giver jobbet til et team, der har den nødvendige erfaring og ekspertise til at udføre dem. Alt du skal gøre er at dele dine krav med dem og en deadline, og de vil sikre, at du har dine leveringer i tide.

Det outsourcede team kan være i samme by eller kvarter som din virksomhed eller i en helt anden geografisk placering. Det, der betyder noget ved outsourcing, er den praktiske eksponering for jobbet og viden om, hvordan man kommenterer billeder.

Billedanmærkning: Outsourcing vs interne teams-alt hvad du behøver at vide

outsourcingIn-house
Yderligere lag af klausuler og protokoller skal implementeres, når projektet outsourcer til et andet team for at sikre dataintegritet og fortrolighed.Oprethold problemfrit fortroligheden af ​​data, når du har dedikerede interne ressourcer, der arbejder på dine datasæt.
Du kan tilpasse den måde, du ønsker, at dine billeddata skal være.Du kan skræddersy dine data genereringskilder til at imødekomme dine behov.
Du behøver ikke bruge ekstra tid på at rengøre data og derefter begynde at arbejde på at kommentere dem.Du bliver nødt til at bede dine medarbejdere om at bruge ekstra timer på at rense rådata, før de kommenterer dem.
Der er ingen overarbejde af ressourcer involveret, da du har processen, kravene og planen fuldstændigt kortlagt inden du samarbejder.Du ender med at overarbejde dine ressourcer, fordi datanotering er et yderligere ansvar i deres eksisterende roller.
Frister overholdes altid uden kompromis med datakvaliteten.Deadlines kan forlænges, hvis du har færre teammedlemmer og flere opgaver.
Outsourcede hold er mere tilpassede til nye retningslinjeændringer.Sænker moral hos teammedlemmer, hver gang du drejer fra dine krav og retningslinjer.
Du behøver ikke at vedligeholde datagenererings kilder. Det endelige produkt når dig til tiden.Du er ansvarlig for at generere dataene. Hvis dit projekt kræver millioner af billeddata, er det op til dig at skaffe relevante datasæt.
Skalerbarhed af arbejdsbyrde eller teamstørrelse er aldrig et problem.Skalerbarhed er et stort problem, da hurtige beslutninger ikke kan træffes problemfrit.

The Bottom Line

Som du tydeligt kan se, er det meget mere rentabelt at outsource hele processen på lang sigt, selvom det er mere praktisk at have et internt billed- / datanoteringsteam. Når du samarbejder med dedikerede eksperter, byrder du dig selv med flere opgaver og ansvarsområder, som du ikke skulle bære i første omgang. Med denne forståelse, lad os yderligere indse, hvordan du kunne finde de rigtige leverandører eller teams af datanoteringer.

Faktorer, der skal overvejes, når du vælger en dataanmærkningsleverandør

Dette er et stort ansvar, og hele ydeevnen for dit maskinindlæringsmodul afhænger af kvaliteten af ​​datasæt leveret af din leverandør og timingen. Derfor skal du være mere opmærksom på, hvem du taler med, hvad de lover at tilbyde, og overveje flere faktorer, inden du underskriver kontrakten.

For at hjælpe dig i gang er her nogle vigtige faktorer, du bør overveje.Leverandør af dataanmærkninger

ekspertise

En af de primære faktorer at overveje er ekspertisen hos den sælger eller det team, du agter at ansætte til dit maskinlæringsprojekt. Det team, du vælger, bør have den mest praktiske eksponering for dataarnnotering værktøjer, teknikker, domænekendskab og erfaring med at arbejde på tværs af flere brancher.

Udover tekniske forhold skal de også implementere metoder til optimering af workflow for at sikre problemfrit samarbejde og ensartet kommunikation. For mere forståelse, spørg dem om følgende aspekter:

  • De tidligere projekter, de har arbejdet med, svarer til dine
  • Års erfaring, de har 
  • Arsenalet af værktøjer og ressourcer, de anvender til annotering
  • Deres måder at sikre ensartet datanotering og levering til tiden
  • Hvor behagelige eller forberedte de er med hensyn til projektets skalerbarhed og mere

Datakvalitet

Datakvaliteten har direkte indflydelse på projektets output. Alle dine år med slid, netværk og investeringer kommer ned på, hvordan dit modul fungerer, før det startes. Så sørg for, at de leverandører, du agter at arbejde med, leverer datasæt af højeste kvalitet til dit projekt. For at hjælpe dig med at få en bedre idé, her er et hurtigt snydeark, du skal undersøge:

  • Hvordan måler din leverandør datakvaliteten? Hvad er standardmålingerne?
  • Detaljer om deres kvalitetssikringsprotokoller og klageadgangsprocesser
  • Hvordan sikrer de overførsel af viden fra et teammedlem til et andet?
  • Kan de opretholde datakvaliteten, hvis mængderne efterfølgende øges?

Kommunikation og samarbejde

Levering af output i høj kvalitet betyder ikke altid glat samarbejde. Det involverer også problemfri kommunikation og fremragende vedligeholdelse af rapport. Du kan ikke arbejde med et team, der ikke giver dig nogen opdatering under hele løbet af samarbejdet eller holder dig ude af løkken og pludselig leverer et projekt på tidspunktet for deadline. 

Derfor bliver en balance vigtig, og du skal være meget opmærksom på deres modus operandi og generelle holdning til samarbejde. Så still spørgsmål om deres kommunikationsmetoder, tilpasningsevne til retningslinjer og kravændringer, nedskalering af projektkrav og mere for at sikre en jævn rejse for begge involverede parter. 

Aftalens vilkår og betingelser

Bortset fra disse aspekter er der nogle vinkler og faktorer, der er uundgåelige med hensyn til lovligheder og regler. Dette involverer prisvilkår, varighed af samarbejde, foreningsbetingelser og betingelser, tildeling og specifikation af jobroller, klart definerede grænser og mere. 

Få dem sorteret, inden du underskriver en kontrakt. For at give dig en bedre idé, her er en liste over faktorer:

  • Spørg om deres betalingsbetingelser og prismodel - om prisfastsættelsen er for det arbejde, der er udført pr. Time eller pr. Kommentar
  • Er udbetalingen månedligt, ugentligt eller hver anden uge?
  • Indflydelsen af ​​prismodeller, når der sker en ændring i projektretningslinjer eller arbejdsområde

Skalerbarhed 

Din virksomhed vil vokse i fremtiden, og dit projekts omfang vil ekspandere eksponentielt. I sådanne tilfælde skal du være sikker på, at din leverandør kan levere de mængder mærkede billeder, din virksomhed kræver i stor skala.

Har de talent nok internt? Udtømmer de alle deres datakilder? Kan de tilpasse dine data baseret på unikke behov og brugssager? Aspekter som disse vil sikre, at sælgeren kan overgå, når større datamængder er nødvendige.

Indpakning op

Når du først har overvejet disse faktorer, kan du være sikker på, at dit samarbejde vil være problemfrit og uden hindringer, og vi anbefaler at outsource dine billedkommenteringsopgaver til specialisterne. Hold øje med førende virksomheder som Saip, der markerer alle de felter, der er nævnt i guiden.

Efter at have været i det kunstige intelligensrum i årtier, har vi set udviklingen af ​​denne teknologi. Vi ved, hvordan det startede, hvordan det går, og dets fremtid. Så vi holder os ikke kun opdateret med de seneste fremskridt, men forbereder os også på fremtiden.

Desuden håndplukker vi eksperter for at sikre, at data og billeder annoteres med de højeste præcisionsniveauer til dine projekter. Uanset hvor niche eller unikt dit projekt er, skal du altid være sikker på at du får upåklagelig datakvalitet fra os.

Du skal blot kontakte os og diskutere dine krav, så kommer vi i gang med det med det samme. Kontakt os hos os i dag.

Lad os tale

  • Ved tilmelding er jeg enig med Shaip Privatlivspolitik , Servicevilkår og give mit samtykke til at modtage B2B marketingkommunikation fra Shaip.

Ofte stillede spørgsmål (FAQ)

Billednotering er en delmængde af datamærkning, der også er kendt under navnet billedmærkning, transkription eller mærkning, der involverer mennesker i backend, og utrætteligt tagger billeder med metadatainformation og attributter, der hjælper maskiner med at identificere objekter bedre.

An billedbemærknings- / mærkningsværktøj er en software, der kan bruges til at mærke billeder med metadatainformation og attributter, der hjælper maskiner med at identificere objekter bedre.

Billedmærkning / annoteringstjenester er tjenester, der tilbydes af tredjepartsleverandører, der mærker eller kommenterer et billede på dine vegne. De tilbyder den krævede ekspertise, kvalitetsfleksibilitet og skalerbarhed efter behov.

En mærket /kommenteret billede er en, der er mærket med metadata, der beskriver billedet, hvilket gør det forståeligt af maskinlæringsalgoritmer.

Billedkommentar til maskinlæring eller dyb læring er processen med at tilføje etiketter eller beskrivelser eller klassificere et billede for at vise de datapunkter, du vil have din model til at genkende. Kort sagt tilføjer det relevante metadata for at gøre det genkendeligt af maskiner.

Billedkommentar indebærer anvendelse af en eller flere af disse teknikker: afgrænsningsfelter (2-d, 3-d), milepæl, polygoner, polyliner osv.