Lielie dati var palīdzēt datoriem identificēt emocijas, kas saistītas ar attēliem

Tādas populāras vietnes kā Twitter un Facebook un citi kanāli tagad ir piepildīti ar attēliem, kas palīdz cilvēkam labāk paust domas un jūtas. Jauni pētījumi liecina, ka “lielos datus” - jebkuru tik lielu vai sarežģītu datu kopu, kuru ir grūti apstrādāt, izmantojot tradicionālās datu apstrādes lietojumprogrammas, var izmantot, lai iemācītu datoriem interpretēt ar attēliem saistīto saturu un jūtas.

Dr Jiebo Luo, Ročesteras universitātes datorzinātņu profesors, sadarbībā ar Adobe Research pētniekiem nesen Amerikas mākslīgā intelekta asociācijas (AAAI) konferencē iepazīstināja ar rakstu, kurā aprakstīts pakāpeniski dziļi konvolucionāls neironu tīkls (CNN). .

Pēc tam apmācīto datoru var izmantot, lai noteiktu, kādas noskaņas šie attēli varētu izraisīt. Luo saka, ka šī informācija varētu būt noderīga tik daudzveidīgām lietām kā ekonomisko rādītāju mērīšana vai vēlēšanu prognozēšana.

Tomēr uzdevums ir sarežģīts. Teksta noskaņojuma analīze ar datoru palīdzību pats par sevi ir sarežģīts uzdevums. Sociālajos medijos sentimentu analīze ir sarežģītāka, jo daudzi cilvēki izpaužas, izmantojot attēlus un videoklipus, kurus datoram ir grūtāk saprast.

Piemēram, politiskās kampaņas laikā vēlētāji bieži dalīsies ar savu viedokli, izmantojot attēlus.

Divās dažādās bildēs varētu būt redzams viens un tas pats kandidāts, taču viņi, iespējams, sniedz ļoti atšķirīgus politiskos paziņojumus. Cilvēks varētu atpazīt vienu kā pozitīvu kandidāta portretu (piemēram, kandidāts smaida un paceļ rokas), bet otru - negatīvs (piemēram, kandidāta attēls, kurš izskatās sakauts).

Bet neviens cilvēks nevarēja aplūkot katru attēlu, kas tika kopīgots sociālajos medijos - tie ir patiesi “lielie dati”. Lai varētu izdarīt apzinātus minējumus par kandidāta popularitāti, datori ir jāapmāca, lai sagremotu šos datus, ko Luo un viņa līdzstrādnieku pieeja var izdarīt precīzāk, nekā tas bija iespējams līdz šim.

Pētnieki uztver sentimentu iegūšanu no attēliem kā attēlu klasifikācijas problēmu. Tas nozīmē, ka kaut kā jāanalizē katrs attēls un tam jāpielīmē etiķetes.

Lai sāktu apmācības procesu, Luo un viņa līdzstrādnieki esošajā datu bāzē, kas pazīstama kā SentiBank (izstrādājusi Dr. Shih-Fu Chang grupa Kolumbijā, izmantoja milzīgu skaitu Flickr attēlu, kurus ar mašīnu algoritmu brīvi apzīmēja ar īpašām noskaņām. Universitāte).

Tas dod datoram sākumpunktu, lai sāktu saprast, ko daži attēli var nodot.

Bet mašīnā ģenerētās etiķetes ietver arī varbūtību, ka šī etiķete ir patiesa, tas ir, cik drošs ir dators, ka etiķete ir pareiza?

Apmācības procesa galvenais solis ir nākamais, kad viņi izmet visus attēlus, kuriem noskaņojums vai noskaņojums, ar kuru tie ir apzīmēti, varētu neatbilst patiesībai. Tāpēc viņi izmanto tikai “labākus” marķētus attēlus tālākapmācībai, pakāpeniski uzlabojoties spēcīgā konvolucionālā neironu tīkla ietvaros.

Resaercher atklāja, ka šis papildu solis ievērojami uzlaboja to noskaņu precizitāti, ar kurām katrs attēls tiek marķēts.

Viņi arī pielāgoja šo noskaņojumu analīzes dzinēju ar dažiem attēliem, kas iegūti no Twitter. Šajā gadījumā viņi izmantoja "pūļa izlūkošanu", un vairāki cilvēki palīdzēja kategorizēt attēlus, izmantojot Amazon Mechanical Turk platformu.

Viņi izmantoja tikai nelielu skaitu attēlu, lai precīzi noregulētu datoru, un, tomēr, izmantojot šo domēna pielāgošanas procesu, viņi parādīja, ka viņi varētu uzlabot pašreizējās jaunākās metodes Twitter attēlu noskaņojuma analīzei.

Viens pārsteidzošs atklājums ir tāds, ka attēlu noskaņojuma klasifikācijas precizitāte ir pārsniegusi teksta noskaņojuma klasifikāciju tajos pašos Twitter ziņojumos.

Avots: Ročesteras universitāte

!-- GDPR -->