02 Nov Computer Vision: tecnologia a supporto delle imprese
La Computer Vision è una delle soluzioni più promettenti nell’ambito dell’Intelligenza Artificiale, e sempre più imprese si affidano a questa tecnologia. Ma di cosa si tratta?
Cos’è la Computer Vision
Con il termine Computer Vision si intende un campo dell’Intelligenza Artificiale che permette ai computer di ricavare informazioni significative da input visivi. Lo scopo principale di questa tecnologia è quello di riprodurre la vista umana, intesa non solo come la capacità di riconoscere soggetti all’interno di un’immagine singola o in sequenza, ma anche di estrarre informazioni utili per la loro elaborazione. Si tratta, in sostanza, dell’abilità di ricostruire un contesto intorno all’immagine, dandole un significato.
Come funziona la Computer Vision
Per imparare a “vedere”, i sistemi di Computer Vision hanno bisogno di essere addestrati con una grande quantità di immagini, che andranno a costruire il set di dati che renderanno il sistema intelligente. La Computer Vision analizza i dati più volte fino a quando non è in grado di riconoscere le immagini. Per arrivare a questo risultato finale viene utilizzato un particolare tipo di Machine Learning, la rete neurale convoluzionale (CNN), che estrapola i dati per ottenerne una lettura propria.
Grazie ai progressi dell’Intelligenza Artificiale, la Computer Vision ha affinato la propria precisione. Questo perché i dati utilizzati e che generiamo sono in continuo aumento: più dati vengono utilizzati, migliori diventano le prestazioni della macchina.
Le task della Computer Vision
Esistono quattro diverse task della Computer Vision:
- Image classification, con cui si riconosce la classe di appartenenza del soggetto.
- Object detection, ovvero l’identificazione di oggetti all’interno dell’immagine e la loro collocazione spaziale.
- Semantic segmentation, che individua oggetti simili nell’immagine che appartengono alla stessa classe a livello di pixel.
- Instance segmentation, che identifica le diverse istanze presenti nell’immagine e i loro contorni a un livello di pixel più profondo.
Inoltre, negli ultimi anni, altre due voci si sono aggiunte all’elenco delle task:
- Data generation: imparando la distribuzione di un set di dati utilizzando approcci come le GAN (generative adversarial networks), è possibile generare nuove immagini che sembrano reali e possono essere utilizzate in nuovi set di dati. Ciò permette di superare il limite imposto dal Deep Learning sulla quantità di dati necessari per addestrare un modello
- Adattamento al dominio: i GAN possono essere utilizzati per trasformare le immagini da un dominio di origine a un dominio di destinazione. Ciò è molto utile per acquisire le prestazioni delle reti su compiti diversi senza dover annotare nuovi dati. In questo ambito rientrano applicazioni come Deepfakes, una tecnologia che permette di sostituire l’immagine di una persona con un’altra all’interno un video.
Le applicazioni della Computer Vision
I sistemi di visione artificiale hanno numerose applicazioni, sia in ambito della smart surveillance che in quello dell’analisi diagnostica della telemedicina. Anche la sicurezza sul lavoro utilizza questi software, sia per la manutenzione predittiva e per la sicurezza, sia per il monitoraggio dei prodotti, che permette di controllare la loro qualità e individuare eventuali difetti.
Se l’Intelligenza Artificiale permette a un computer di pensare, la Computer Vision gli permette di vedere, ampliando il raggio d’azione e le sue applicazioni.