Sistema avalia o comportamento de objetos em uma cena a partir de percepções intuitivas da física.
A grade curricular do ensino básico no Brasil só aprofunda os conteúdos de Física no ensino médio, quando os alunos já estão na adolescência. Mas a percepção das leis universais físicas é algo que já desenvolvemos desde os primeiros meses de idade. Ou, como explica , Kevin A. Smith, cientista do Departamento de Ciências do Cérebro e Cognitivas (BCS) e membro do Centro de Cérebros, Mentes e Máquinas (CBMM) do Massachusetts Institute of Technology (MIT):
“Quando os bebês completam 3 meses de idade, eles têm uma noção de que os objetos não piscam para dentro e para fora da existência e não podem se mover através de outros ou se teletransportar”
Smith é um dos responsáveis pela criação de um modelo de Inteligência Artificial (IA) que compreende conceitos básicos de física intuitiva relacionados ao comportamento de objetos. O objetivo é desenvolver ferramentas melhores de IA e fornecer aos estudiosos uma melhor compreensão da cognição infantil.
O sistema chamado ADEPT observa objetos em movimento em determinada cena e prevê como eles devem se comportar a partir de sua física subjacente. A cada quadro do vídeo é emitido um “sinal de surpresa”, que é tanto maior quanto mais improvável seja o comportamento do item observado.
Dois módulos compõem o experimento. Um extrai informações sobre o objeto (tais como posição, forma e velocidade), enquanto o outro prevê as representações futuras com base em um conjunto de possibilidades.
Por exemplo: se um objeto está atrás de uma parede, espera-se que ele permaneça lá, a não ser que algum fator externo incida sobre ele. Se a parede cair e o objeto tiver desaparecido, há uma incompatibilidade com um preceito físico. O modelo “pensa” assim: “havia um objeto que, segundo minha previsão, deveria continuar ali. Ele desapareceu. Isso é surpreendente!”.
Nos testes comparativos da percepção do computador e de humanos, os níveis de surpresa registrados foram semelhantes. Mas curiosamente o sistema se mostrou surpreso em algumas situações em que as pessoas não foram surpreendidas (mas talvez devessem ter sido). Em um vídeo em que um objeto se move a certa velocidade, passa por trás de uma parede e sai imediatamente do outro lado, o que só aconteceria se ele tivesse acelerado de forma impressionante ou teletransportado, duas coisas absolutamente improváveis. As pessoas não deram muita bola para essa incongruência, mas o ADEPT se incomodou.
Outra característica interessante é que como a identificação da cena observada é feita por geometria aproximada (sem grande atenção aos detalhes), o sistema demonstrou versatilidade para lidar com objetos para os quais não foi treinado.
“Não importa se um objeto é um retângulo, um círculo, um caminhão ou um pato. A ADEPT apenas vê que há um objeto em uma posição, movendo-se de uma certa maneira, para fazer previsões”, diz Smith. “Da mesma forma, crianças pequenas também parecem não se importar muito com algumas propriedades como a forma ao fazer previsões físicas”.
Na sequência dos estudos, os pesquisadores pretendem se aprofundar na investigação de como as crianças observam e aprendem sobre o mundo, incorporando essas descobertas no ADEPT. “Queremos ver o que mais precisamos construir para entender o mundo como os bebês e formalizar o que sabemos sobre psicologia para criar melhores agentes de IA”, comenta Smith.