09 marzo 2012

Riconoscere gli oggetti: capacità umane ancora non eguagliate dalle macchine. Un articolo su Journal of Neuroscience offre nuovi scenari.

Davide Zoccolan SISSA Cosa c'è alla base del riconoscimento visivo degli oggetti che ci circondano? Per tentare di rispondere a questa fondamentale domanda Davide Zoccolan (nella foto), direttore del Laboratorio di neuroscienze visive della Sissa di Trieste, insieme a James DiCarlo (MIT) e Nicole Rust (Università della Pennsylvania), hanno condotto uno studio, culminato in un articolo pubblicato su Journal of Neuroscience. Il riconoscimento visivo è un processo di elaborazione dell'informazione estremante complesso: nei primati non umani metà della corteccia cerebrale è destinata allo svolgimento di compiti visivi. Zoccolan e il suo team hanno scoperto recentemente che anche i ratti riescono a codificare in modo invariante gli oggetti, il loro sistema visivo è in grado cioè di identificare un oggetto nonostante appaia di volta in volta in posizioni, dimensioni e contesti differenti.
«Noi - spiega Zoccolan dal 2009 alla Scuola Internazionale Superiore di Studi Avanzati di Trieste - siamo in grado di classificare e identificare gli oggetti, indipendentemente dagli inifiniti modi in cui possono presentarsi davanti ai nostri occhi: per la posizione, l’orientamento, la dimensione, il contesto e le condizioni di illuminazione. E riusciamo a farlo in poche centinaia di millisecondi. La comprensione dei meccanismi neuronali che consentono al cervello di interpretare la straordinaria ricchezza di informazioni visive rappresenta non solo una delle maggiori sfide delle neuroscienze sistemiche e computazionali, ma anche un passo fondamentale verso lo sviluppo di sistemi di visione artificiale»
Andrea Mameli www.linguaggiomacchina.it
fonte: ufficio stampa Sissa, Trieste, 8 marzo 2012


How does the brain solve visual object recognition?
Dicarlo JJ, Zoccolan D, Rust NC.
Mounting evidence suggests that 'core object recognition,' the ability to rapidly recognize objects despite substantial appearance variation, is solved in the brain via a cascade of reflexive, largely feedforward computations that culminate in a powerful neuronal representation in the inferior temporal cortex. However, the algorithm that produces this solution remains poorly understood. Here we review evidence ranging from individual neurons and neuronal populations to behavior and computational models. We propose that understanding this algorithm will require using neuronal and psychophysical data to sift through many computational models, each based on building blocks of small, canonical subnetworks with a common functional goal.

Nessun commento: