Sztuczna inteligencja nie pojmuje interakcji społecznych?

Nowe badania przeprowadzone na Uniwersytecie Johnsa Hopkinsa rzucają światło na poważne ograniczenia sztucznej inteligencji. Choć AI osiąga imponujące rezultaty w analizie statycznych obrazów, okazuje się, że wciąż nie potrafi skutecznie przewidywać ludzkich interakcji społecznych – kluczowego elementu potrzebnego do poruszania się w rzeczywistym świecie. Zdaniem naukowców, współczesne systemy nie są w stanie zrozumieć niuansów ludzkich relacji w ruchu.

W eksperymencie uczestnicy zostali poproszeni o obejrzenie trzysekundowych nagrań wideo przedstawiających ludzi w różnych sytuacjach społecznych – od wspólnych działań po całkowicie niezależne zachowania. Następnie oceniali je w skali od 1 do 5 pod kątem cech ważnych dla zrozumienia dynamiki międzyludzkiej. Wyniki tych ocen posłużyły jako punkt odniesienia do sprawdzenia możliwości kilkuset modeli AI.

Zespół badawczy przetestował ponad 350 modeli sztucznej inteligencji, w tym zaawansowane modele językowe, obrazowe i wideo. Modele miały za zadanie przewidzieć zarówno ludzkie oceny filmów, jak i reakcje mózgu na ich oglądanie. Choć modele językowe wypadły lepiej w przewidywaniu zachowań, a modele wideo – w przewidywaniu aktywności neuronowej, żaden z systemów nie dorównał spójności ocen prezentowanej przez ludzi.

Badacze podkreślają, że obecne modele sztucznej inteligencji nie były w stanie trafnie określić, czy osoby na nagraniach wchodzą w interakcje. Modele obrazowe analizujące sekwencje nieruchomych klatek okazały się szczególnie nieprecyzyjne. Nawet najbardziej zaawansowane AI nie potrafiły wiarygodnie odróżnić subtelnych gestów i zachowań społecznych, które dla człowieka są natychmiast zrozumiałe.

Zgodnie z analizą naukowców, źródłem problemu jest sama architektura sieci neuronowych, która wzorowana była na tych obszarach mózgu, które przetwarzają obrazy statyczne – nie zaś dynamiczne sceny społeczne. Oznacza to, że mimo technologicznego postępu, AI wciąż ma przed sobą długą drogę, zanim dorówna ludzkiej intuicji w rozumieniu złożoności relacji międzyludzkich.

Źródło: Uniwersytet Johnsa Hopkinsa

Czytaj też: Odkrycia polskich naukowców w rzymskim forcie Apsaros

Grafika tytułowa: Steve Johnson / Unsplash