Vai dators var iemācīt veselo saprātu?

Ne pārāk tālā pagātnē, domājot, ka dators var parādīt “veselo saprātu”, tiks uzskatīts par oksimoronu. Bet tādi superdatori kā IBM Watson var atveidot jaunas lomas datoriem.

Pašlaik Karnegi Melona universitātes pētnieki visu diennakti darbojas datorprogrammā, cenšoties uztvert datus un masveidā iemācīt veselo saprātu.

Programma tiek dēvēta par Never Ending Image Learner (NEIL), jo programmatūra meklē attēlus tīmeklī, darot visu iespējamo, lai tos saprastu atsevišķi, un, veidojot aizvien pieaugošu vizuālo datu bāzi, masveidā apkopojot veselo saprātu.

NEIL izmanto jaunākos sasniegumus datoru redzes jomā, kas ļauj datorprogrammām identificēt un marķēt attēlos esošos objektus, raksturot ainas un atpazīt atribūtus, piemēram, krāsas, apgaismojumu un materiālus, ar minimālu cilvēku uzraudzību.

Savukārt tā ģenerētie dati vēl vairāk uzlabos datoru spēju izprast vizuālo pasauli.

NEIL ir ievērojams progress salīdzinājumā ar iepriekšējām robotizētajām ierīcēm, jo ​​tas var radīt asociācijas starp lietām, lai iegūtu veselā saprāta informāciju. Informācija, kuru cilvēki zina gandrīz intuitīvi - ka automašīnas bieži tiek atrastas uz ceļiem, ka ēkas mēdz būt vertikālas un ka pīles izskatās līdzīgas zosīm.

Pamatojoties uz teksta atsaucēm, varētu šķist, ka ar aitām saistītā krāsa ir melna, taču cilvēki - un tagad NEIL - tomēr zina, ka aitas parasti ir baltas.

"Attēli ir labākais veids, kā iemācīties vizuālās īpašības," sacīja Karinegi Melona Robotikas institūta pētniecības docente Abhinava Gupta, Ph.D.

“Attēli ietver arī daudz saprāta informācijas par pasauli. Cilvēki to apgūst paši, un mēs ceram, ka ar NEIL to darīs arī datori. ”

Datoru kopa jau kopš jūlija beigām darbojas NEIL programmā, un tā jau ir analizējusi trīs miljonus attēlu, identificējot 1500 objektu tipus pusmiljonā attēlu un 1200 sižetu tipus simtiem tūkstošu attēlu.

Tas ir savienojis punktus, lai iemācītos 2500 asociācijas no tūkstošiem gadījumu.

Viena no NEIL projekta motivācijām ir izveidot pasaulē lielāko vizuāli strukturēto zināšanu bāzi, kur objekti, ainas, darbības, atribūti un kontekstuālās attiecības tiek apzīmētas un katalogētas.

"Tas, ko mēs esam iemācījušies pēdējo 5-10 gadu laikā ar datoru redzes pētījumu, ir tas, ka jo vairāk datu jums ir, jo labāka kļūst datora redze," sacīja Gupta.

Daži projekti, piemēram, ImageNet un Visipedia, mēģināja apkopot šos strukturētos datus ar cilvēku palīdzību.

Bet interneta mērogs ir tik plašs - Facebook vien ir vairāk nekā 200 miljardi attēlu -, ka vienīgā cerība to visu analizēt ir iemācīt datoriem to darīt pašiem.

Cilvēki arī stāsta NEIL, kādas objektu, ainu uc kategorijas meklēt un analizēt. Bet dažreiz tas, ko atrod NEIL, var pārsteigt pat pētniekus.

Var paredzēt, ka, piemēram, meklējot vārdu “ābols”, var tikt parādīti gan augļu, gan klēpjdatoru attēli. Bet Gupta un viņa komanda, visi zemes īpašnieki, nenojauta, ka, meklējot F-18, tiks identificēti ne tikai iznīcinātāja attēli, bet arī F18 klases katamarāni.

Tā kā meklēšana turpinās, NEIL izstrādā objektu apakškategorijas - trīsriteņu velosipēdi var būt paredzēti gan bērniem, gan pieaugušajiem, gan motorizēti, vai arī automašīnām ir dažādi zīmoli un modeļi.

Un tas sāk pamanīt asociācijas - ka zebras mēdz atrasties, piemēram, savannās un ka akciju tirdzniecības grīdas parasti ir pārpildītas.

Pirms NEIL var kļūt par vispārpieņemtu vārdu, mērogs būs jāsamazina, jo NEIL ir skaitļošanas intensīva, programmai darbojoties divās datoru kopās, kurās ir 200 apstrādes kodolu.

Avots: Karnegi Melona universitāte

!-- GDPR -->