O Google adiciona dois novos modelos de IA à sua família Gemma de LLMs – Por que isso é importante

Em fevereiro, o Google retirou o Gemma, sua família de Large Language Models (LLMs) leves para desenvolvedores de código aberto. Pesquisadores do Google DeepMind o desenvolveram com o objetivo de auxiliar desenvolvedores e pesquisadores na construção de IA de forma responsável. Agora anunciou duas novas adições ao Gemma – CodeGemma e RecurrentGemma. Com esta mudança, o Google DeepMind pretende manter o ritmo na corrida da inteligência artificial (IA), enfrentando a concorrência de empresas como OpenAI e Microsoft.

Leia também: Desastre de imagens do Google Gemini AI – O que realmente aconteceu com o gerador de imagens?

Embora a empresa tenha se encontrado em águas quentes em relação a algumas das capacidades de IA de seu modelo de IA mais popular, o Gemini, parece que a controvérsia não desacelerou os pesquisadores. Esses novos modelos de IA prometem possibilidades de inovação para desenvolvedores de Machine Learning (ML). Saiba tudo sobre os dois novos modelos Gemma AI – CodeGemma e Recurrent Gemma.

Google Code Gemma

O primeiro dos dois novos modelos de IA é o CodeGemma, um modelo leve com recursos de codificação e acompanhamento de instruções. Está disponível em três variantes:

1. Variante 7B pré-treinada para tarefas de conclusão de código e geração de código

2. Variante ajustada por instrução 7B para acompanhamento de instruções e bate-papo de código.

3. Variante 2B pré-treinada para conclusão rápida de código em PCs locais.

Google diz CodeGemma pode não apenas gerar linhas e funções, mas também criar blocos de código, independentemente de estar sendo usado localmente em PCs ou por meio de recursos de nuvem. Possui proficiência em vários idiomas, o que significa que você pode usá-lo como assistente enquanto codifica em linguagens como Python, JavaScript e Java. O código gerado pelo CodeGemma não é apenas anunciado como sintaticamente preciso, mas também semanticamente correto. Isso promete reduzir erros e tempo de depuração.

Leia também: Saiba tudo sobre Gemma – a família de LLMs do Google

Este novo modelo de IA é treinado em 500 bilhões de tokens de dados, principalmente em inglês, incluindo código de repositórios disponíveis publicamente, matemática e documentos na web.

Gemma recorrente do Google

O outro modelo de IA, denominado RecurrentGemma, visa melhorar a eficiência da memória aproveitando redes neurais recorrentes e atenção local. Assim, destina-se à experimentação de pesquisa. Embora ofereça desempenho de benchmark semelhante ao modelo Gemma 2B AI da DeepMind, o RecurrentGemma possui uma arquitetura exclusiva que permite fornecer três fontes: uso reduzido de memória, maior rendimento e inovação em pesquisa.

Leia também: Apple negocia com Google sobre licenciamento do Gemini para recursos de IA em iPhones

De acordo com o Google, o RecurrentGemma pode gerar amostras mais longas, mesmo em dispositivos com memória limitada devido aos menores requisitos de memória. Isso também permite que o modelo de IA realize inferências em grandes lotes, aumentando os tokens por segundo. O Google também diz que modelos baseados em Transformers, como Gemma, podem ficar mais lentos à medida que as sequências ficam mais longas. Por outro lado, RecurrentGemma mantém sua velocidade de amostragem independentemente do comprimento da sequência.

O Google afirma que mostra um “modelo não transformador que atinge alto desempenho, destacando os avanços na pesquisa de aprendizagem profunda”.

Mais uma coisa! Agora estamos nos canais do WhatsApp! Siga-nos lá para nunca perder nenhuma atualização do mundo da tecnologia. ?Para acompanhar o canal HT Tech no WhatsApp, clique aqui para aderir agora!

Patrocinado por Google

Deixe uma resposta

Área Militar
Área Militarhttp://areamilitarof.com
Análises, documentários e geopolíticas destinados à educação e proliferação de informações de alta qualidade.
ARTIGOS RELACIONADOS

Descubra mais sobre Área Militar

Assine agora mesmo para continuar lendo e ter acesso ao arquivo completo.

Continue reading