Visió artificial

De la Viquipèdia, l'enciclopèdia lliure.
Saltar a la navegació Saltar a la cerca

La visió per màquina (també coneguda com a visió per ordinador) és el conjunt de processos que tenen com a objectiu crear un model aproximat del món real ( 3D ) a partir d’imatges bidimensionals ( 2D ). El propòsit principal de la visió per ordinador és reproduir la visió humana. S'entén veure no només com l'adquisició d'una fotografia bidimensional d'una àrea, sinó sobretot com la interpretació del contingut d'aquesta àrea. En aquest cas, la informació s’entén com una cosa que implica una decisió automàtica.

Un sistema de visió artificial consisteix en la integració de components òptics, electrònics i mecànics que permeten adquirir, gravar i processar imatges tant en l’espectre de la llum visible com a l’exterior ( infrarojos , ultraviolats , rajos X , etc.). El resultat del processament és el reconeixement de certes característiques de la imatge amb diversos propòsits de control, classificació, selecció, etc.

Sistema de visió

Un sistema de visió consta de diversos components:

  • càmeres i òptica
  • sistema d’il·luminació
  • l'objecte a examinar
  • el sistema d’adquisició i processament d’imatges
  • interfícies home-màquina
  • interfícies amb l’entorn extern

Les peces que s’han d’inspeccionar es col·loquen –sovint mitjançant sistemes de manipulació automàtica– davant d’una o més càmeres i s’il·luminen adequadament, per tal de ressaltar al màxim els defectes a identificar. El sistema òptic forma una imatge al sensor de la càmera que produeix un senyal de sortida elèctrica. Aquest senyal es digitalitzarà i s’emmagatzemarà.

La imatge, capturada i representada d'aquesta manera "comprensible" per un ordinador, es pot processar amb un programari especial que inclou algoritmes de càlcul i anàlisi particulars, capaços d'identificar les característiques de la imatge i amplificar alguns aspectes, per exemple, contorns, arestes , formes, estructures - per dur a terme les comprovacions i verificacions per a les quals es va dissenyar el sistema.

Sobre la base dels resultats del processament, el sistema prendrà decisions sobre la destinació de l'objecte, per exemple, l'ordenarà entre els "bons" o el descartarà i proporcionarà la informació adequada a la resta del sistema de producció.

Tasques típiques

Un problema clàssic en la visió per ordinador és determinar si la imatge conté o no certs objectes ( reconeixement d’objectes ) o activitats. El problema es pot resoldre de manera eficaç i sense dificultats per a objectes específics en situacions específiques, com ara el reconeixement d’objectes geomètrics específics com ara poliedres , reconeixement de cares o personatges manuscrits. Les coses es compliquen en el cas d'objectes arbitraris en situacions arbitràries.

A la literatura trobem diferents varietats del problema:

  • Reconeixement (reconeixement): un o més objectes preespecificats o emmagatzemats es poden rastrejar a classes genèriques generalment juntament amb la seva ubicació 2D o 3D a l'escena.
  • Identificació (ID): es detecta una instància específica d'una classe. Per exemple, identificació d’una cara, empremta digital o vehicle concretes.
  • Detecció (detecció): la imatge s’escaneja fins a identificar una condició específica. Per exemple, la detecció de possibles cèl·lules o teixits anormals en imatges mèdiques

Una altra tasca típica és la reconstrucció de l’escenari: donades imatges 2D o més en 2D, s’intenta reconstruir un model 3D de l’escenari. En el cas més senzill, parlem d’un conjunt de punts individuals en espai 3D o superfícies senceres. En general, és important trobar la matriu fonamental que representa els punts comuns a partir de diferents imatges.

Aplicacions industrials

Gràcies a la funcionalitat i l’alta potència informàtica, els sistemes de visió poden trobar camps d’aplicació pràcticament il·limitats.

Les aplicacions industrials inclouen:

  • Reconeixement de defectes i compliment de toleràncies
  • Orientació, posicionament i guiatge del robot
  • Mesures sense contacte
  • Comprovacions de cinturons continus ( inspecció web )
  • Classificació i elecció
  • Lectura de caràcters i codis

Reconeixement de defectes i compliment de toleràncies

És una de les aplicacions més esteses, ja que no es pot dir que cap producció industrial estigui lliure de defectes i la majoria dels defectes es puguin veure visualment. Sovint la inspecció de la producció la duen a terme operadors especialitzats, amb costos elevats per a la manipulació de les peces i els recursos humans.

L’aplicació d’un sistema de control basat en la visió per computador té diversos avantatges:

  • Reducció dels costos laborals
  • 100% control de producció
  • Control basat en criteris objectius i repetibles

Els principals controls de qualitat es remunten a moltes de les característiques típiques de la visió per computador: comprovacions de superfície, comprovació de la presència / absència de peces, recompte, comprovació del color, etc.

Orientació, posicionament i guiatge del robot

Una part important de la intel·ligència artificial s’ocupa de la gestió de sistemes interfaces amb robots o màquines que es mouen a l’espai o realitzen moviments. Aquest tipus de procés sovint implica l'adquisició d'informació proporcionada per un sistema de visió artificial que ocupa el paper d' un sensor visual.

Hi ha sistemes capaços de dirigir manipuladors, robots antropomorfs o carretons en entorns industrials desconeguts a priori. Per exemple, robots de càrrega i descàrrega que han d’identificar la posició exacta de diferents objectes i col·locar-los en palets o en contenidors o cap a un sistema de manipulació intel·ligent, capaç de moure’s en una planta on circulin persones, altres mitjans de manipulació i sovint zones. estan ocupats per mercaderies.

Mesures sense contacte

Generalment es distingeixen mesures una o dues dimensions: diàmetres, longituds, alçades, excentricitat, linealitat, mesures tridimensionals, càlculs de volum (mitjançant l’anàlisi d’imatges adquirides des de múltiples angles). L’ús del SdV és especialment adequat per a la mesura d’objectes fràgils, difícils d’accedir, continguts en altres objectes, a altes temperatures: per exemple, fosa d’acer fos en laminadors, etc. Un avantatge de la visió artificial també consisteix en la possibilitat de realitzar mesures no convencionals que siguin superiors a les realitzades amb sistemes tradicionals, per exemple mesurant zones de formes complexes.

Lectura contínua ( inspecció web )

Consisteix en la detecció de defectes o lectures de caràcters en cintes o plaques col·locades en un desplaçament ràpid. Aquesta anàlisi es fa normalment amb càmeres lineals. Alguns exemples d’aquesta aplicació són la verificació de la correcció de la impressió, l’absència de defectes en laminats, teixits, etc.

Classificació i elecció

És una de les aplicacions més complexes, ja que sovint els mecanismes d’elecció no es codifiquen fàcilment. Un sector típic és l’elecció de rajoles de ceràmica o marbre o taulers de fusta.

Lectura de caràcters i codis

Són característiques molt habituals en sectors com l’alimentari o el farmacèutic per realitzar tota una sèrie de controls dels productes de sortida, com ara la data de caducitat dels productes, els lots de producció, la correcció dels fulls d’instruccions adjunts, etc.

Aplicacions en altres camps

  • Control autònom del vehicle
  • Detecció d'esdeveniments (videovigilància)
  • Organització de la informació (indexació de bases de dades d'imatges i seqüències d'imatges)
  • Modelització d'objectes o entorns (inspeccions industrials, anàlisi d'imatges en l'entorn mèdic i modelització topogràfica )
  • Interacció (entrada en un dispositiu per a la interacció home-ordinador)
  • Estudis interdisciplinaris amb neurobiologia

En física , s'utilitza una branca significativa de la visió per ordinador per comprendre els mecanismes en què la radiació electromagnètica, normalment en el rang d'infrarojos, es reflecteix des de les superfícies.

Un altre entorn d’aplicació és el processament de senyals . De fet, moltes tècniques que s’utilitzen per processar senyals d’una variable es poden estendre a senyals de 2 variables d’una manera natural. No obstant això, no tots els mètodes utilitzats per a imatges es poden reutilitzar en senyals variables individuals.

Control autònom del vehicle

Una nova àrea d’aplicació emergent és la de vehicles autònoms com ara submarins, vehicles terrestres o rodes o avions. Un sistema de visió artificial pot donar suport a un conductor d’aquests vehicles en diverses situacions, ja que fins i tot (en el cas de vehicles totalment autònoms ) es pot encarregar de tota la navegació. En aquest cas, és important ser capaç de reconèixer els obstacles i poder elaborar un mapa de la zona circumdant. Alguns exemples en aquesta àrea són els sistemes d'alerta en automòbils, sistemes d'aterratge automàtic d'avions o sistemes de conducció automàtica de vehicles. Aquesta última tecnologia, fins i tot estudiada i produïda, encara no ha assolit els costos suficients per llançar-se al mercat.

Les aplicacions militars són, sens dubte, una de les àrees més grans que obtenen els beneficis de la visió per ordinador, tot i que només es fa pública una petita fracció del treball realitzat en aquest entorn. Exemples obvis poden ser el sistema d’orientació i apuntament de míssils .

Camp mèdic

Una de les àrees més grans i prometedores és la mèdica. Aquesta àrea es caracteritza per extreure informació de la imatge amb la intenció de fer un diagnòstic d’un pacient. Normalment la imatge s’adquireix mitjançant microscòpia , raigs X , angiografia i tomografia . Exemples d’informació que es pot deduir de les imatges són la presència de tumors, arteriosclerosi o altres disfuncions malignes.

Neurobiologia

Un altre paper important és la neurobiologia, concretament l’estudi del sistema visual. En biologia s’estudia la percepció visual dels humans i dels animals a través de sistemes que operen en termes de processos psicològics. La visió artificial, per altra banda, estudia i descriu un sistema visual artificial implementat en programari o maquinari. El primer tracta del problema des de fora, el segon des de dins. L’intercanvi interdisciplinari entre l’estudi biològic i la visió per ordinador ha donat resultats importants per ambdues parts. Al llarg del segle passat hi ha hagut un intens estudi dels ulls, les neurones i l'estructura del cervell per entendre com processen el senyal visual els organismes humans i animals. Aquí les dues disciplines es van reunir, ja que la visió artificial també intenta simular com es comporta realment l’aparell visual biològic, fins i tot amb un nivell de complexitat diferent. D'aquí la raó per la qual alguns mètodes utilitzats en la visió artificial també s'han reflectit en el camp biològic.

Els beneficis de la tecnologia

Constància, fiabilitat, objectivitat dels controls

Un operador humà que treballa en una cinta transportadora per comprovar els defectes de les peces no pot realitzar una comprovació del 100% de totes les peces i mantenir la constància dels criteris d’avaluació al llarg del temps, mentre que un sistema de visió pot funcionar durant dies sencers sense cap variació de rendiment. . Fins i tot l’homogeneïtat del judici entre diferents operadors constitueix un element que condueix a preferir un control automatitzat: és pràcticament impossible obtenir la constància i l’homogeneïtat dels criteris d’avaluació d’operadors humans.

Operabilitat en entorns hostils

En condicions ambientals extremes, com ara entorns molt sorollosos, exposats a agents químics, temperatures molt altes o molt baixes, zones dins del rang d’acció de màquines o sistemes de manipulació, espais reduïts, un sistema de visió pot funcionar en pau sense posar en perill la vida dels treballadors. o sotmetre’ls a estrès físic innecessari.

Elevades velocitats de control

Un sistema de visió és capaç de dur a terme operacions de verificació en fraccions de segon fins i tot en objectes en moviment molt ràpid, com per exemple en cintes transportadores.

La velocitat de control genera dues importants oportunitats interrelacionades: és possible repensar el sistema de control de qualitat que passa dels controls de mostra al total de controls (el 100% dels productes) amb tots els avantatges següents;

és possible redissenyar els processos i les línies de producció, introduint sistemes de manipulació automàtica i evitant els pulmons intermedis dedicats prèviament als controls de qualitat i la transferència de peces d'una fase a una altra.

Petita mida d'objectes que cal revisar

La mida dels objectes és una variable que sovint limita la verificació i el control humà en el procés de producció. Els sistemes de visió permeten analitzar detalls que no són visibles ni difícils d’identificar per l’home gràcies a l’òptica i el programari específics.

Alta precisió de control

Fins i tot en presència d’objectes caracteritzats per toleràncies molt estretes, els sistemes de visió permeten assolir una precisió i una precisió de control molt superiors a les dels humans. Això ens permet obtenir productes que cada vegada compleixen més les necessitats del mercat.

Generació de dades de procés

A més de dur a terme tasques de control, per exemple identificant i descartant peces defectuoses, els nostres sistemes de visió són capaços de generar i emmagatzemar dades sobre el procés en temps real, destacant desviacions dels paràmetres òptims.

Això permet identificar qualsevol signe o tendència d'empitjorament del procés (derives), ajudant així els gestors de la línia de producció a prendre accions correctives abans de superar els llindars de tolerància establerts.

Noves tendències

Després de l'any 2000, amb l'augment de la integració de maquinari i la consegüent reducció d'espais, veiem com s'afirma la categoria de sistemes de visió compactes anomenats càmeres intel·ligents . Bàsicament no hi ha variacions qualitatives en comparació amb els sistemes basats en PC, només un augment de la seva practicitat. Després de l'any 2005, apareixen els primers sistemes de visió integrats que aprofiten al màxim la potència cada vegada més gran dels ordinadors personals mitjançant un programari d'alt nivell que utilitza lògiques híbrides . Aquests sistemes de visió tenen, a diferència dels sistemes clàssics, un alt nivell d’adaptació a esdeveniments externs que els fan molt més fiables i versàtils. Aquests sistemes són molt més senzills d’utilitzar perquè resolen automàticament alguns problemes típics de visió per computador, deixant a l’operador configurar només els aspectes funcionals del sistema.

Història

Tot i que hi ha estudis i treballs previs, no és abans del 1970 que els estudis del sector s'han pogut especialitzar, gràcies a l'augment del rendiment dels ordinadors que han estat capaços de processar grans quantitats d'informació com ara imatges. Hem d’esperar als anys vuitanta per veure les primeres aplicacions pràctiques reals d’aquesta disciplina, sovint caracteritzada per un propòsit purament demostratiu . A la dècada de 1990 veiem que apareixen els primers captadors de fotogrames estàndard que s’inserien als ordinadors i els sistemes de visió adquireixen una major funcionalitat i robustesa, abandonant l’aspecte típicament experimental de la dècada anterior, especialment en el camp industrial. disciplina caracteritzada per algunes solucions funcionals esquitxades de diversos fracassos. El 2000 - 2008 es pot descriure el camp de la visió per computador com a divers i immadur. La causa es troba probablement en la seva evolució, a la qual han contribuït diverses disciplines científiques sense acordar, però, una formulació estàndard del "problema de la visió artificial". A més, amb conseqüències encara més evidents, no hi ha una formulació estàndard de com cal resoldre els problemes de visió per ordinador. En canvi, hi ha una gran quantitat de mètodes per resoldre tasques de visió per ordinador ben definides, on els procediments solen dependre del context i poques vegades es poden estendre a un espectre més ampli d'aplicacions. Molts d'aquests mètodes continuen al nivell bàsic de la investigació, però molts altres han trobat espai en la producció comercial on formen part de grans sistemes que resolen problemes complexos. En la majoria d’aplicacions pràctiques, els ordinadors estan entrenats prèviament per resoldre una tasca particular, però, els mètodes basats en l’aprenentatge són cada vegada més comuns. Des del 2009 hem vist l’ús de càmeres amb comunicació digital, especialment l’estàndard GIGEtherneth, que combina factors com una velocitat justa, economia, estandardització (utilitza ports Ethernet GigaBit normals des de PC) i una solidesa justa en el camp industrial. en conseqüència, els captors de marcs analògics tendeixen a sortir de la imatge. Des del punt de vista de la generació de programari, veiem una concentració particular en la solució de problemes 3D. En general, la fiabilitat de les solucions millora.

Xarxes neuronals

Tot i l'experimentació amb xarxes neuronals en visió artificial i algunes aplicacions anteriors al 1996 , és precisament a partir d'aquest any que, especialment a Europa i Japó, comencem a veure diverses aplicacions de visió que resolen brillantment aplicacions de tipus industrial. L’ús d’aquestes lògiques respecte als algorismes clàssics ha conduït sens dubte a resoldre satisfactòriament problemes més complexos, però sovint la complicació de l’aprenentatge i els resultats no sempre homogenis han reduït els beneficis que aporta aquest tipus de lògica. De fet, els models produïts per les xarxes neuronals , encara que siguin molt eficients, no es poden explicar amb un llenguatge simbòlic humà: els resultats s’han d’acceptar "tal com són", d’aquí la definició anglesa de xarxes neuronals com a caixa negra ("caixa negra") . Com passa amb qualsevol algorisme de modelització, les xarxes neuronals només són eficients si s’escullen acuradament les variables predictives.

Lògiques híbrides

Hybrid Logics ( 2001 ) és la terminologia genèrica que s’utilitza per classificar una sèrie d’ algoritmes compostos per una miscel·lània de lògiques. Aquest no és un terme estrictament "exacte" i sovint diversos fabricants de sistemes de visió i centres de recerca donen noms diferents a aquest tipus de tecnologia i és difícil identificar-la. La filosofia d’aquest terme és més interessant: donats els límits de la lògica clàssica (matemàtica i estadística) i neuronal, algunes empreses per resoldre els diferents problemes de visió per ordinador han “barrejat” diversos tipus de lògiques per resoldre amb un alt índex de fiabilitat de problemes reals. . Els sistemes de visió que utilitzen diferents algoritmes d’aquest tipus també s’anomenen sistemes de visió integrats .

Articles relacionats

Altres projectes

Enllaços externs

Control de l'autoritat Thesaurus BNCF 61074 · LCCN (EN) sh85029549 · BNF (FR) cb11976826n (data)