Modelo de IA treinado para aprender através dos olhos e ouvidos das crianças em uma nova pesquisa

Numa nova investigação, um modelo de IA foi treinado para aprender palavras e conceitos através dos olhos e ouvidos de uma única criança, utilizando gravações de vídeo da câmara frontal desde quando a criança tinha seis meses até ao seu segundo aniversário.

Os pesquisadores mostraram que o modelo de inteligência artificial (IA) poderia aprender um número substancial de palavras e conceitos usando fatias limitadas do que a criança experimentou. Embora o vídeo tenha capturado apenas um por cento das horas de vigília da criança, eles disseram que isso era suficiente para um aprendizado genuíno do idioma.

“Ao usar modelos de IA para estudar o problema real de aprendizagem de línguas enfrentado pelas crianças, podemos abordar debates clássicos sobre quais ingredientes as crianças precisam para aprender palavras – se elas precisam de preconceitos específicos do idioma, conhecimento inato ou apenas aprendizagem associativa para seguir em frente, “, disse Brenden Lake, professor assistente do Centro de Ciência de Dados e Departamento de Psicologia da NYU e autor sênior do estudo publicado na revista Science.

Estamos nos canais do WhatsApp. Clique juntar-se.

Para desenvolver o modelo, os pesquisadores primeiro analisaram o processo de aprendizagem de uma criança capturado em vídeo em primeira pessoa – por meio de uma câmera leve montada na cabeça – semanalmente, começando aos seis meses e até os 25 meses.

Usando imagens de vídeo coletadas durante mais de 60 horas, a equipe observou que elas continham cerca de um quarto de milhão de ocorrências de palavras – o número de palavras comunicadas, muitas delas repetidamente – que estavam ligadas a quadros de vídeo do que a criança via como essas palavras. foram falados.

A filmagem também incluiu uma ampla gama de atividades diferentes durante o desenvolvimento, incluindo refeições, leitura de livros e a criança brincando, disse a equipe.

Os pesquisadores então treinaram uma rede neural multimodal com dois módulos separados – um que captava quadros únicos do vídeo e outro que captava a forma transcrita da fala dirigida à criança.

Esses módulos foram combinados e treinados usando um algoritmo chamado aprendizagem contrastiva, que visa aprender fazendo associações nos dados de entrada, disseram.

Por exemplo, explicaram, quando um pai dizia algo na visão da criança, era provável que algumas das palavras usadas se referissem a algo que a criança podia ver, o que significava que a compreensão era instilada através da ligação de pistas visuais e linguísticas.

“Isso fornece ao modelo uma pista sobre quais palavras devem ser associadas a quais objetos”, disse Wai Keen Vong, cientista pesquisador do Centro de Ciência de Dados da NYU.

“Combinar essas dicas é o que permite a aprendizagem contrastiva para determinar gradualmente quais palavras pertencem a quais recursos visuais e capturar a aprendizagem das primeiras palavras de uma criança”, disse Vong.

Depois de treinar o modelo, a equipe o testou apresentando o modelo com a palavra-alvo e uma série de quatro opções de imagens diferentes, e pedindo-lhe que selecionasse a imagem que correspondia à palavra-alvo.

O modelo foi capaz de aprender um número “substancial” de palavras e conceitos presentes na experiência cotidiana da criança, disseram os pesquisadores.

Além disso, para algumas das palavras que o modelo aprendeu, observou-se que era capaz de generalizá-las para instâncias visuais diferentes daquelas que viu nos seus dados de treinamento.

Isto, disseram os pesquisadores, reflete um aspecto de generalização também observado em crianças quando são estudadas em laboratório.

Leia também outras notícias importantes de hoje:

Apple dobrável chegando? A Apple pode lançar seu primeiro dispositivo dobrável em 2026 ou 2027, com tela de 7 a 8 polegadas. A incerteza envolve se será um iPhone ou iPad dobrável. Li tudo sobre isso aqui.

Gosta de editar fotos? Aqui estão os melhores para você fazer isso em um instante! Confira aqui.

Lançamento de smartphones! O Infinix Smart 8 apresenta uma variante de 8 + 128 GB. Possui uma câmera AI de 50 MP, elementos de design inovadores e um poderoso processador MediaTek Helio G36 Octa-Core. Confira aqui.

Os turistas que visitam a Torre Eiffel de Paris agora poderão reservar sua viagem ao monumento icônico usando a UPI. Leia tudo aqui.

Cuidado com Hackers! Um relatório recente encontrou 12 aplicativos maliciosos, sendo 6 deles na Google Play Store que espalham malware. Saiba como se proteger de tais ameaças. Saiba o que está acontecendo aqui.

Patrocinado por Google

Deixe uma resposta

Área Militar
Área Militarhttp://areamilitarof.com
Análises, documentários e geopolíticas destinados à educação e proliferação de informações de alta qualidade.
ARTIGOS RELACIONADOS

Descubra mais sobre Área Militar

Assine agora mesmo para continuar lendo e ter acesso ao arquivo completo.

Continue reading