Filmes e programas de TV poderão ser dublados em qualquer idioma

Graças ao aprendizado de máquina e Inteligência Artificial (IA), escolher os idiomas para 'Squid Game' e outros conteúdos estrangeiros pode ser tão fácil quanto mudar de canal. Mas muito mais também poderia ser transformado ao longo do caminho.

Por Steven Zeitchik do Washington Post

Poucas experiências culturais são tão surreais quanto dar de encontro com um filme apelidado de Hollywood. Há os movimentos labiais de desenho animado. A ação mal planejada. O estranho barítono que não soa como você se lembra de Tom Hanks soando.

Acontece que depois de todas essas décadas, uma nova classe de startups espera abordar essa arte performática não intencional. Usando inteligência artificial (IA) e aprendizado de máquina, elas visam tornar o processo de dublagem mais eficiente e mais natural, como parte de um movimento emergente conhecido como "dublagem automática".

As implicações podem ser abrangentes. Na grande visão dos dubladores automáticos, qualquer conteúdo de vídeo, de “Squid Game” em diante, um dia estará disponível em um idioma personalizado com o toque de um botão. Ainda mais importante, seria totalmente parecido com o original.

O mundo resultante seria de uma intercambialidade perfeita: uma peça de entretenimento não emanaria de um lugar específico, mas surgiria inesperadamente como a criação aparente de qualquer linguagem que o espectador desejasse assisti-la. Como Forrest Gump disse, "das Leben war wie eine Schachtel Schokoladen". (A vida era como uma caixa de chocolates)

“O potencial aqui é tão grande”, disse Scott Mann, um diretor de Hollywood que cofundou a Flawless, uma dessas startups. “A maioria de nós nem mesmo tem consciência de quanto conteúdo excelente existe no mundo. Agora podemos assistir.”

No entanto, apesar de todo o seu transculturalismo cintilante, existem muitas implicações sociais ocultas e muitas vezes sombrias. O entretenimento em uma hora de dublagem fácil pode perder todo o sabor local. Enquanto isso, consumidores em todo o mundo podem nunca ser expostos aos sons de uma língua estrangeira.

A dublagem sempre foi um exercício árduo, e isso antes mesmo de alguém assistir. Em sua forma tradicional, a dublagem geralmente funciona assim: um estúdio ou distribuidor local, tendo decidido que quer um lançamento no idioma local, paga para traduzir um roteiro, contrata um conjunto de dubladores para interpretar os personagens, aluga equipamento de engenharia, coloca os atores em várias tomadas de voz, grava as falas e então une suas leituras de volta ao vídeo original — uma luta poderosa para alcançar um produto final suave. Todo o processo pode levar meses.

A dublagem automática pode funcionar assim. O ator original registra cinco minutos de texto aleatório em seu próprio idioma. Em seguida, as máquinas assumem o controle: uma rede neural aprende a voz do ator, um programa digere essas informações vocais e as aplica a uma tradução digital do roteiro, então a IA cospe linhas perfeitamente cronometradas do filme na língua estrangeira e as coloca em a acção. Todo o processo pode levar semanas.

“Temos a tecnologia para preencher uma grande lacuna”, disse Oz Krakowski, diretor de marketing da Deepdub, uma startup com sede em Dallas e Tel Aviv que emprega essencialmente esse processo. “Podemos dar aos estúdios o que eles desejam e proporcionar aos consumidores uma experiência totalmente única.” A empresa está prestes a colocar sua alegação à prova. Está lançando “Every Time I Die”, thriller de 2019 cuja versão em inglês está na Netflix, nas versões em espanhol e português dublado inteiramente por Inteligência Artificial (IA).

As empresas de dublagem automática adotam uma variedade de abordagens. Deepdub se concentra no áudio, reimplantando digitalmente a voz do ator original a partir de uma tradução automática, mas deixando o vídeo inalterado. Outra firma, a Papercup, com sede em Londres, também utiliza essa técnica, usando as chamadas vozes sintéticas.

Flawless vai para o outro lado, contando com dubladores ao vivo (e trabalhoso), mas editando lábios e rostos na tela para que pareçam estar realmente falando a língua. Todas as três empresas trazem humanos para o processo em vários pontos para controle de qualidade. (Há algumas pesquisas de gigantes da tecnologia como a Amazon , mas nenhum produto comercial ainda.

Várias outras empresas, como a Synthesia com foco em vídeo e a Respeecher centrada na voz , também estão trabalhando em tecnologias relacionadas.

Embora todos os serviços usem alguma forma de manipulação, a maioria diz que não está se envolvendo em deepfakes, temendo tanto tornar seu material vulnerável à manipulação política ou, pelo menos, à polêmica enfrentada por um recente documentário da CNN sobre o falecido Anthony Bourdain que usou sua voz IA. Claro, o deepfake de um homem é o aprimoramento digital de outro.

Firmas de capital de risco começaram a apostar na dublagem automática. Os executivos da Papercup disseram que em dezembro levantaram US$ 10,5 milhões de um grupo de investidores que incluía a Arlington, a Sands Capital Ventures. E empresas de mídia como The Guardian, além de vários milhões levantados anteriormente. A Flawless concluiu recentemente seu financiamento não divulgado da Série A. Deepdub está no meio de uma rodada.


É fácil entender o interesse deles. O conteúdo em idioma estrangeiro é uma vasta fronteira não explorada para Hollywood. O “Squid Game” da Netflix se tornou o programa número 1 do serviço em muitos países, incluindo os Estados Unidos. Se o drama de sobrevivência coreano puder fazer isso em grande parte com legendas, dizem os dubladores, imagine o que aconteceria com o diálogo sob demanda? Um desfile interminável de sucessos nos Estados Unidos em língua estrangeira não é difícil de conceber. (Já existem algumas versões apelidadas de “Jogo de Lula”, mas elas não são tão bem recebidas.)

Como uma espécie de novo giro na Torre de Babel — todos falam línguas diferentes, mas ainda se entendem — a dublagem automática também significa que quem não fala inglês não precisará aprender inglês para entender o diálogo em um filme de Hollywood. (As legendas, provavelmente, desapareceriam.)

Mas essas ricas possibilidades também trazem preocupações. Um mundo sem diálogo estrangeiro em seu entretenimento significa um mundo no qual milhões de telespectadores, tanto nos Estados Unidos quanto no exterior, podem nunca ser expostos a um idioma diferente do seu.

“Se tudo que você ouve é dublado, você perde toda a fonética, todas as informações, toda a empatia”, disse Siva Reddy, professora assistente de linguística e ciência da computação na Universidade McGill. “Você pode ter uma maneira monolítica de olhar para todos.”

A ideia de um diálogo citável também pode ser questionada. Algumas das linhas de filme mais famosas da história — como a “vida é como uma caixa de chocolates” de Gump — se desenvolveram porque foram ouvidas, e eventualmente repetidas infinitamente, daquela maneira singular. Um discurso perfeito na tela que chega em 30 idiomas diferentes desde o início pode nunca se tornar um clássico.


O cofundador da Papercup, Jesse Shemen, cuja empresa trabalhou com a Discovery e a Sky, diz que os benefícios superariam essas preocupações.

“Acredito que ouvir pensamentos e filosofias que nunca teríamos ouvido é muito mais cumulativo e aditivo do que ser limitado por sua própria língua”, disse ele, citando tudo, desde um especialista financeiro na Nigéria a um comentarista da NBA na América do Sul.

Assistir à dublagem automática pode ser perturbador. É quase como se os pequenos variações sonoras da dublagem normal servissem ao propósito de nos lembrar que um filme veio de outro lugar. Um pouco chocante, por exemplo, é ver Jack Nicholson explodir no banco das testemunhas em um "A Few Good Men" enquanto sua boca enuncia um francês perfeito.

Não que todas as bolhas de ar técnicas tenham sido eliminadas. Fazer com que as vozes digitais soem humanas, com os muitos ritmos e inflexões exigidos, é algo que ainda está fora do alcance da IA. E as traduções automáticas tendem a ser literais, sem contexto chave.

“Temos que ser honestos sobre onde está a tecnologia”, observou Shemen. “Combinar o nível de desempenho dos humanos não é uma tarefa simples. E esqueça a imitação de um artista de voz de alta qualidade.”

Outros, no movimento de dublagem automática, no entanto, dizem que isso pode levar a novas oportunidades, como vozes sintéticas com estilos exclusivos.

“Não precisamos repetir o que Hollywood fez até agora”, disse o cofundador da Flawless Mann. “Acho que podemos criar um monte de novas regras para como os filmes estrangeiros vão soar”, acrescentou ele, é claro, aludindo à linha icônica de Doc Brown para Marty McFly de que “para onde estamos indo, nous n'avons pas besoin de routes (“Nós não temos necessidade de estradas”)

Deixar seu comentário

0
termos e condições.
  • Nenhum comentário encontrado

newsletter buton