Inscreva-se no grupo de análise e inteligência no Telegram ▶️ https://t.me/areamilitar
Vendo o boom da inteligência artificial (IA), a Meta Platforms tem feito esforços para incorporar esta tecnologia em seu conjunto de produtos, e suas ofertas mais recentes incluem um editor de imagens alimentado por IA, bem como um gerador de vídeo. Esses produtos seguem o lançamento do chatbot de IA multipessoal chamado AI Personas, que a empresa estreou em seu evento Connect 2023 no mês passado. A empresa também anunciou o Emu, seu primeiro modelo fundamental para geração de imagens. As novas ferramentas de IA anunciadas pela Meta são baseadas no mesmo modelo. Aqui está tudo o que sabemos sobre isso.
Ferramentas de meta IA
Em um blog publicarMeta anunciou duas novas ferramentas de IA – Emu Video e Emu Edit, e ambas são baseadas no modelo fundamental do Emu.
1. Edição Emu – Esta ferramenta é um editor de imagens com tecnologia de IA que promete agilizar as tarefas de manipulação de imagens e introduzir a edição precisa de imagens. A empresa afirma que será capaz de “alterar imagens com precisão com base em entradas de texto”. Através do Emu Edit, os usuários podem realizar uma variedade de tarefas, como edição local e global, remoção e adição de plano de fundo, transformações de cor e geometria, detecção e segmentação e muito mais. Para treinar o modelo de IA, Meta usou 10 milhões de amostras sintetizadas, incluindo uma imagem de entrada, um prompt e o resultado de saída.
Meta disse: “Em nossas avaliações, o Emu Edit demonstra desempenho superior em relação aos métodos atuais, produzindo novos resultados de última geração em avaliações qualitativas e quantitativas para uma variedade de tarefas de edição de imagens”.
2. Vídeo Emu – Emu Video oferece recursos de geração de texto para vídeo baseados em modelos de difusão. De acordo com Meta, a ferramenta oferece múltiplas opções de entrada – somente texto, somente imagem e texto e imagem. A geração do vídeo segue uma abordagem dividida. Primeiro, as imagens são geradas com base nas instruções de texto. Em seguida, o Emu Video gera um vídeo baseado tanto na imagem gerada anteriormente quanto no prompt de texto. Esta ferramenta usa dois modelos de difusão para gerar vídeos 512×512 de quatro segundos de duração a 16 quadros por segundo.
Meta diz que ambas as ferramentas podem permitir que usuários sem qualquer conhecimento técnico gerem e editem fotos e vídeos. “Embora certamente não substituam artistas e animadores profissionais, Emu Video, Emu Edit e novas tecnologias como essas poderiam ajudar as pessoas a se expressarem de novas maneiras – desde um diretor de arte idealizando um novo conceito ou um criador animando seu mais recente vídeo até um melhor amigo compartilhando uma saudação de aniversário única”, diz a empresa.