Microsoft lança avatar de conversão de texto em fala de IA no Ignite 2023

Inscreva-se no grupo de análise e inteligência no Telegram ▶️ https://t.me/areamilitar

Nos últimos meses, a Microsoft embarcou na missão de incorporar inteligência artificial (IA) em seu conjunto de produtos, que vão desde o Microsoft Office voltado para o consumidor até o Copilot 365 para empresas. Em sua última conferência Ignite 2023, a gigante da tecnologia anunciou vários novos produtos baseados em IA, como Copilot Studio e Windows AI Studio, ao mesmo tempo que renomeou Bing Chat para simplesmente Copilot. A empresa também lançou um programa de avatar de conversão de texto em fala chamado Azure AI Speech, que pode ajudar a criar vídeos de avatares falantes. Ele está sendo lançado na versão prévia pública. Saiba tudo sobre esse novo recurso.

Discurso de IA do Microsoft Azure

O Azure AI Speech é um avatar de conversão de texto em fala que permite converter texto em um vídeo 2D de um avatar falante semelhante a um humano. A Microsoft afirma que os modelos de avatar neural de conversão de texto em fala são treinados por redes neurais profundas baseadas em amostras de gravação de vídeo humana, e a voz do avatar é fornecida por um modelo de voz de conversão de texto em fala. Os usuários podem usar entradas de texto para criar vídeos de treinamento, apresentações de produtos, depoimentos de clientes e muito mais, permitindo mais interações digitais.

Como funciona

O fluxo de trabalho de geração de conteúdo de avatar do Azure AI Speech envolve três etapas: o analisador de texto, o sintetizador de áudio TTS e o sintetizador de vídeo de avatar TTS. Primeiro, a entrada de texto é fornecida pelo usuário e o analisador de texto a produz na forma de uma sequência de fonemas. Em seguida, o sintetizador de áudio TTS prevê as características acústicas do texto de entrada e sintetiza a voz. Ambos os recursos são alimentados por modelos de voz de conversão de texto em fala.

Por fim, o modelo de avatar neural de conversão de texto em fala prevê a imagem de sincronização labial com as características acústicas, para que o vídeo sintético seja gerado.

O serviço Azure AI Speech está sendo oferecido em dois níveis. A primeira é uma voz neural pré-construída que apresenta vozes naturais e prontas para uso. Para acessá-lo, os usuários podem criar uma conta Azure e assinar o serviço Speech. Em seguida, eles podem usar o Speech SDK ou visitar o portal Speech Studio para selecionar vozes pré-construídas.

Por outro lado, a Microsoft também oferece a possibilidade de criar vozes neurais personalizadas. Este recurso é chamado de Voz Neural Personalizada. É um autoatendimento fácil de usar para criar uma voz natural da marca, com acesso limitado para uso responsável. Atualmente, a Microsoft oferece apenas acesso limitado a esse recurso.

Patrocinado por Google

Deixe uma resposta

Área Militar
Área Militarhttp://areamilitarof.com
Análises, documentários e geopolíticas destinados à educação e proliferação de informações de alta qualidade.
ARTIGOS RELACIONADOS

Descubra mais sobre Área Militar

Assine agora mesmo para continuar lendo e ter acesso ao arquivo completo.

Continue lendo