Cercetătorii conduși de profesorul MIT James DiCarlo, director al MIT Quest for Intelligence și coleg la MIT-IBM Watson AI Lab, au făcut modelul de viziune computerizată mai robust, antrenându-l să funcționeze ca parte a creierului uman și al altor primate, bazându-se pe recunoașterea obiectelor. În luna mai, la Conferința Internațională privind Reprezentările Învățării, echipa a raportat că, atunci când a antrenat o rețea neuronală artificială folosind modele de activitate neuronală în cortexul temporal inferior (IT), rețeaua neuronală artificială a fost capabilă să identifice mai fiabil obiectele din imagini decât un model care nu avea pregătire neuronală. Iar interpretarea imaginilor de către model se potrivea mai strâns cu ceea ce vedeau oamenii, chiar și atunci când imaginile conțineau distorsiuni minore care au îngreunat sarcina.
Compararea circuitelor neuronale
Multe dintre rețelele neuronale artificiale folosite pentru vederea computerizată seamănă deja cu circuitele cerebrale stratificate care procesează informațiile vizuale la oameni și la alte primate. La fel ca creierul, ei folosesc unități asemănătoare neuronilor care lucrează împreună pentru a procesa informații. Pe măsură ce învață să finalizeze o anumită sarcină, aceste componente stratificate procesează colectiv și progresiv informațiile vizuale pentru a finaliza sarcina - determinând, de exemplu, că o imagine este un urs, o mașină sau un copac.
DiCarlo și alții au descoperit anterior că, atunci când astfel de sisteme de învățare profundă de viziune pe computer stabilesc modalități eficiente de rezolvare a problemelor vizuale, ajung la circuite artificiale care funcționează similar cu circuitele neuronale care procesează informațiile vizuale în propriul nostru creier. Adică, s-au dovedit a fi modele științifice surprinzător de bune ale mecanismelor neuronale care stau la baza vederii primatelor și umane.
Această asemănare îi ajută pe neurologi să-și aprofundeze înțelegerea creierului. Demonstrând modul în care informațiile vizuale sunt procesate pentru a da sens imaginilor, modelele computaționale emetează ipoteza modului în care creierul poate îndeplini aceeași sarcină. Pe măsură ce dezvoltatorii continuă să perfecționeze modelele de viziune computerizată, neurologii găsesc noi perspective pe care să le exploreze în munca lor.
„Pe măsură ce sistemele de viziune artificială se îmbunătățesc în lumea reală, unele dintre ele devin mai asemănătoare cu oamenii în procesarea lor internă. Este util în ceea ce privește înțelegerea biologiei”, spune DiCarlo, care este, de asemenea, profesor de științe cerebrale și cognitive și cercetător la Institutul McGovern pentru Știința Creierului.
Dezvoltarea unei IA mai asemănătoare creierului
Deși potențialul lor este promițător, sistemele de viziune computerizată nu sunt încă modele perfecte ale vederii umane. DiCarlo a bănuit că o modalitate de a îmbunătăți vederea computerizată ar putea fi includerea anumitor funcții ale creierului în aceste modele.
Pentru a testa această idee, el și colaboratorii săi au construit un model de viziune computerizată folosind date neuronale colectate anterior de la neuronii de procesare a vederii din cortexul IT al maimuței - o parte cheie a căii vizuale ventrale a primatelor implicate în recunoașterea obiectelor - în timp ce animalele observau diverse imagini. Mai precis, Joel Dapello, un student absolvent al Universității Harvard și fost stagiar MIT-IBM Watson AI Lab; și Kohitij Kar, profesor asistent, Canada Research Chair (Visual Neuroscience) la Universitatea York și vizitator de stiinta la MIT; în colaborare cu David Cox, vicepreședintele IBM Research pentru modele AI și director IBM al MIT-IBM Watson AI Lab; și alți cercetători de la IBM Research și MIT au cerut unei rețele neuronale artificiale să imite comportamentul acestor neuroni de procesare a vederii primatelor, în timp ce rețeaua a învățat să identifice obiecte într-o sarcină standard de viziune pe computer.
„De fapt, i-am spus rețelei: „Vă rugăm să rezolvați această sarcină standard de viziune pe computer, dar vă rugăm să faceți, de asemenea, ca funcția unuia dintre straturile „neurale” simulate din interior să fie cât mai asemănătoare cu funcția stratului neuronal biologic corespunzător. '”, explică DiCarlo. „I-am cerut să facă ambele lucruri cât se poate de bine.” Acest lucru a forțat circuitele neuronale artificiale să găsească o modalitate diferită de procesare a informațiilor vizuale decât abordarea standard, a vederii computerizate, spune el.
După antrenarea modelului artificial cu date biologice, echipa lui DiCarlo și-a comparat activitatea cu un model de rețea neuronală de dimensiuni similare antrenat fără date neuronale, folosind abordarea standard pentru vederea computerizată. Ei au descoperit că noul nivel IT model, informat biologic, a fost, așa cum sa indicat, o potrivire mai bună pentru datele neuronale IT. Adică, pentru fiecare imagine testată, populația de neuroni IT artificiali din model a răspuns mai similar cu populația corespunzătoare de neuroni IT biologici.
Cercetătorii au descoperit, de asemenea, că modelul IT a fost, de asemenea, o potrivire mai bună cu datele neuronale IT colectate de la o altă maimuță, chiar dacă modelul nu a văzut niciodată date de la acel animal și chiar și atunci când acea comparație a fost evaluată cu privire la răspunsurile IT ale acelei maimuțe la imagini noi. Acest lucru a indicat că noul model de computer „aliniat neuronal” al echipei poate fi un model îmbunătățit al funcției neurobiologice a cortexului IT al primatelor - o descoperire interesantă, având în vedere că anterior nu se știa dacă cantitatea de date neuronale care poate fi colectată în prezent din sistemul vizual al primatelor este capabil să ghideze direct dezvoltarea modelului.
Cu noul lor model computerizat în mână, echipa a întrebat dacă procedura de „aliniere neuronală IT” duce, de asemenea, la vreo modificare a performanței comportamentale generale a modelului. Într-adevăr, ei au descoperit că modelul aliniat neuronal era mai asemănător cu comportamentul său - avea tendința de a reuși să clasifice corect obiectele în imagini pentru care oamenii reușesc și ea și avea tendința să eșueze atunci când oamenii eșuează.
Atacurile adverse
Echipa a descoperit, de asemenea, că modelul aliniat neuronal era mai rezistent la „atacuri adverse” pe care dezvoltatorii le folosesc pentru a testa viziunea computerizată și sistemele AI. În viziunea computerizată, atacurile adverse introduc mici distorsiuni în imagini care sunt menite să inducă în eroare o rețea neuronală artificială.
„Spuneți că aveți o imagine pe care modelul o identifică drept pisică. Deoarece aveți cunoștințele despre funcționarea internă a modelului, puteți proiecta modificări foarte mici ale imaginii, astfel încât modelul să creadă brusc că nu mai este o pisică”, explică DiCarlo.
Aceste distorsiuni minore nu păcălesc de obicei oamenii, dar modelele de viziune computerizată se luptă cu aceste modificări. O persoană care se uită la pisica subtil distorsionată încă raportează în mod fiabil și robust că este o pisică. Dar modelele standard de computer vision sunt mai probabil să confunde pisica cu un câine sau chiar cu un copac.
„Trebuie să existe unele diferențe interne în modul în care creierul nostru procesează imaginile care duc la faptul că vederea noastră este mai rezistentă la aceste tipuri de atacuri”, spune DiCarlo. Și într-adevăr, echipa a descoperit că atunci când și-a făcut modelul mai aliniat neuronal, acesta a devenit mai robust, identificând corect mai multe imagini în fața atacurilor adverse. Modelul ar putea fi păcălit de „atacuri” mai puternice, dar și oamenii pot fi păcăliți, spune DiCarlo. Echipa sa explorează acum limitele robusteții adverse la oameni.и у людей.
În urmă cu câțiva ani, echipa lui DiCarlo a descoperit că ar putea îmbunătăți și rezistența unui model la atacurile adverse prin proiectarea primului strat al rețelei artificiale pentru a emula stratul timpuriu de procesare vizuală din creier. Următorul pas cheie este combinarea unor astfel de abordări - realizarea de noi modele care sunt simultan aliniate neuronal la mai multe straturi de procesare vizuală.
Noua lucrare este o dovadă suplimentară că un schimb de idei între neuroștiință și informatică poate conduce progresul în ambele domenii. „Toată lumea obține ceva din ciclul virtuos interesant dintre inteligența naturală/biologică și inteligența artificială”, spune DiCarlo. „În acest caz, cercetătorii din viziunea computerizată și IA obțin noi modalități de a obține robustețe, iar oamenii de știință în neuroștiință și oamenii de știință cognitiv obțin modele mecaniciste mai precise ale vederii umane.”
Această lucrare a fost susținută de MIT-IBM Watson AI Lab, Semiconductor Research Corporation, U.S. Defense Research Projects Agency, MIT Shoemaker Fellowship, U.S. Office of Naval Research, Simons Foundation și Canada Research Chair Program.
Sursă: MIT News - Jennifer Michalowski (McGovern Institute for Brain Research)
Tradus: Compania GLT |