A Veritone lança uma nova plataforma para permitir que celebridades e influenciadores clonem suas vozes com IA

10

Gravar anúncios e endossar produtos pode ser um trabalho lucrativo para celebridades e influenciadores. Mas é muito parecido com trabalho duro? É isso que a empresa americana Veritone está apostando. Hoje, a empresa está lançando uma nova plataforma chamada Marvel.AI isso permitirá que criadores, figuras da mídia e outros gerem clones falsos de sua voz para licenciar como desejarem.

“As pessoas querem fazer esses negócios, mas não têm tempo suficiente para entrar em um estúdio e produzir o conteúdo”, disse o presidente da Veritone, Ryan Steelberg. The Verge. “Influenciadores digitais, atletas, celebridades e atores: este é um grande ativo que faz parte de sua marca.”

Com o Marvel.AI, diz ele, qualquer pessoa pode criar uma cópia realista de sua voz e implantá-la como quiser. Enquanto a celebridade Y está dormindo, sua voz pode estar fora de casa, gravando spots de rádio, lendo audiolivros e muito mais. Steelberg diz que a plataforma será capaz até de ressuscitar as vozes dos mortos, usando gravações de arquivo para treinar modelos de IA.

“Quem quer que tenha os direitos autorais dessas vozes, trabalharemos com eles para trazê-las ao mercado”, diz ele. “Isso caberá ao detentor dos direitos e ao que eles acharem apropriado, mas hipoteticamente, sim, você poderia deixar Walter Cronkite lendo o noticiário noturno novamente.”

A síntese de voz melhorou rapidamente nos últimos anos, com técnicas de aprendizado de máquina que permitem a criação de vozes cada vez mais realistas. (Pense na diferença entre como o Siri da Apple soava quando foi lançado em 2011 e como soa agora.) Muitas grandes empresas de tecnologia, como a Amazon, oferecem modelos de conversão de texto em voz prontos para uso que geram vozes em escala que são robóticas, mas não desagradáveis. Mas novas empresas também estão fazendo clones de voz boutique que soam como indivíduos específicos, e os resultados podem ser quase indistinguíveis dos reais. Apenas ouça esta voz clone do podcaster Joe Rogan, por exemplo.

Foi esse salto em qualidade que motivou a Veritone a criar o Marvel.AI, diz Steelberg, bem como o potencial da linguagem sintética para se encaixar nos negócios existentes da empresa.

Embora a Veritone se comercialize como uma “empresa de IA”, uma grande parte de sua receita aparentemente vem da publicidade da velha escola e do licenciamento de conteúdo. Como explica Steelberg, sua subsidiária de publicidade, Veritone One, investe pesadamente no espaço de podcast e todos os meses realiza mais de 75.000 “integrações de anúncios” com influenciadores. “São principalmente integrações nativas, como colocações de produtos”, diz ele. “É conseguir o talento para dar voz a patrocínios e comerciais. Isso é extremamente eficaz, mas muito caro e demorado. ”

Outra parte da empresa, a Veritone Licensing, licencia vídeos de vários arquivos importantes. Isso inclui arquivos pertencentes a emissoras como CBS e CNN e organizações esportivas como NCAA e US Open. “Quando você vê a filmagem da Apollo pousando na lua em filmes, ou o conteúdo das palavras de Tiger em um comercial da Nike, tudo isso vem através da Veritone”, diz Steelberg. É essa experiência com licenciamento e publicidade que dará à Veritone a vantagem sobre as startups de IA com foco puramente em tecnologia, diz ele.

Para os clientes, o Marvel.AI oferecerá dois fluxos. Um será um modelo de autoatendimento, onde qualquer pessoa pode escolher em um catálogo de vozes pré-geradas e criar um discurso sob demanda. (É assim que Amazon, Microsoft, et al. Têm feito isso há anos.) Mas o outro fluxo – "o foco", diz Steelberg – será uma "abordagem de luvas brancas", em que os clientes enviam dados de treinamento, e a Veritone criará um clone de voz só para eles. Os modelos resultantes serão armazenados nos sistemas da Veritone e disponíveis para gerar áudio como e quando o cliente quiser. O Marvel.AI também funcionará como um mercado, permitindo que os compradores em potencial enviem solicitações para usar essas vozes. (Como tudo isso terá o preço ainda não está claro.)

Steelberg está convencendo que a demanda por essas vozes existe e que o modelo de negócios da Veritone está pronto para ir. Mas um fator principal decidirá se o Marvel.AI terá sucesso: a qualidade das vozes de IA que a plataforma pode gerar. E isso é muito menos certo.

Quando questionada sobre exemplos do trabalho da empresa, a Veritone compartilhou três clipes curtos com The Verge, cada um, um endosso de linha única para uma marca de balas. A primeira linha é lida pelo próprio Steelberg, a segunda por seu clone de IA e a terceira por uma voz trocada de gênero. Você pode ouvir todos os três abaixo:

O clone de IA é, pelo menos para o meu ouvido, uma imitação muito boa, embora não seja uma cópia perfeita. É mais plano e cortado do que a coisa real. Mas também não é uma demonstração completa do que as vozes podem fazer durante um endosso. A entrega da Steelberg não tem o entusiasmo e a vivacidade que você esperaria de um anúncio real (não o culpamos por isso – ele é um executivo, não um dublador) e, portanto, não está claro se os modelos de voz da Veritone podem capturar uma gama completa de emoção.

Também não é um grande sinal que a narração para o carretel chiado da plataforma (embutido no início da história) foi feita pelo próprio Steelberg em vez de uma cópia de IA. Ou a empresa não achou que um clone de voz fosse bom o suficiente para o trabalho ou ficou sem tempo para gerar um – de qualquer forma, não é um grande endosso do produto.

A tecnologia está se movendo rapidamente, porém, e Steelberg faz questão de enfatizar que a Veritone tem os recursos e a experiência para adotar quaisquer novos modelos de aprendizado de máquina que surjam nos próximos anos. Onde isso vai se diferenciar, diz ele, é gerenciar a experiência de clientes e clientes para realmente implantar a fala sintética em grande escala.

Um problema que Steelberg oferece é como a fala sintética pode diluir o poder dos endossos. Afinal, a atração do endosso do produto depende da crença (embora delirante) de que esta ou aquela celebridade realmente gosta dessa marca específica de cereal / pasta de dente / seguro de vida. Se a celebridade não se dá ao trabalho de expressar o endosso, isso não diminui o poder de venda do anúncio?

A solução da Steelberg é criar um padrão da indústria para divulgação – algum tipo de tom audível que toca antes da fala sintética para a) permitir que os ouvintes saibam que não é uma voz real eb) tranquilizá-los de que o proprietário da voz endossa esse uso. “Não se trata apenas de evitar as conotações negativas de enganar o consumidor, mas também querer que eles tenham certeza de que (esta ou aquela celebridade) realmente aprovou este conteúdo sintético”, diz ele.

São questões como essas que serão cada vez mais importantes à medida que o conteúdo sintético se torna mais comum, e está claro que a Veritone tem pensado muito sobre essas questões. Agora, a empresa só precisa convencer os influenciadores, atletas, atores, podcasters e celebridades do mundo a emprestar suas vozes.

Fonte: The Verge