# Novas tecnologias de Inteligência Artificial
## A revolução da clonagem de voz
## Como funciona a nova IA de clonagem de voz
## Os benefícios da tecnologia de clonagem de voz
## Como gerar leads orgânicos para o seu negócio
## O que são leads orgânicos e como eles diferem de leads pagos
## A importância da otimização do seu site para os mecanismos de busca
## Como criar conteúdo engajador e relevante para os leads orgânicos
## Utilizando as redes sociais para atrair leads orgânicos
## Construindo uma lista de e-mails para capturar leads orgânicos
## Como nutrir e converter leads orgânicos em clientes fiéis
## Dicas práticas para otimizar sua estratégia de lead generation
## Utilize a inteligência artificial a seu favor
## A relação entre as novas tecnologias de inteligência artificial e as estratégias de marketing
## Conclusão: O futuro é agora
# Perguntas Frequentes
1. Como funciona a tecnologia de clonagem de voz?
2. Quais são os principais benefícios da nova IA de clonagem de voz?
3. Como posso otimizar meu site para gerar leads orgânicos?
4. Quais são as principais redes sociais para atrair leads orgânicos?
5. Como posso nutrir e converter meus leads orgânicos em clientes fiéis?
br>- ✅ – Aplique Inteligência Artificial e Programação nos seus projetos, estudando com 10% de desconto:
– ✅ – Conheça os cursos de Machine Learning e Data Science da Alura:
—————————————————————————–
Seja muito bem vindo ao Universo Programado!
Neste vídeo você verá como funciona um novo algoritmo desenvolvido por pesquisadores da área de Inteligência Artificial que consegue clonar vozes de pessoas em apenas 5 segundos. Os resultados são bizarros!
🔹 – Fontes:
Artigo mencionado no vídeo:
Resultados exibidos no vídeo:
Wavenet:
You Won’t Believe What Obama Says In This Video!:
A Deeper Look Into The Life of An Impressionist by Jim Meskimen:
🔹 – Alguns outros vídeos interessantes sobre esse assunto:
Código Fonte TV:
Deep Learning // Dicionário do Programador –
Filipe Deschamps:
Nova I.A. Cria Qualquer Imagem… e é assustador! –
Discovery Brasil:
Discovery Brasil | Inteligência Artificial – IBM –
🤖 – Outros vídeos do canal que talvez te interessem:
Inteligência Artificial jogando o jogo da cobrinha (SNAKE):
Como treinar sua própria Inteligência Artificial?:
Essa Rede Neural consegue PINTAR imagens!:
📌 – Redes Sociais do Canal:
Instagram:
Discord:
📌- Minhas Redes Sociais:
Github:
LinkedIn:
❤️- Um grande abraço e um ótimo estudo pra você!
#inteligenciaartificial #programação #cienciadacomputacao #machinelearning
Este vídeo foi indexado através do Youtube link da fonte
nova inteligencia artificial ,
#inteligenciaartificial,ai,ia,clonar vozes,clonando vozes,IA clonando vozes,algoritmo para clonar vozes,wavenet,inteligencia artificial clonando voz,deep fake,redes neurais,machine learning,programação,tecnologia,inteligencia artificial,ciencia da computação,rede neural clonando vozes,clonagem de voz,robos,fake news,inteligencia artificial imitando vozes,inteligencia artificial aprendendo,text to speech ,
https://www.youtubepp.com/watch?v=8QROMPtPekw ,
Seja muito bem vindo ao universo programado eu sou o Victor Dias, programador e um alvo fácil para a clonagem de voz no video de hoje a gente vai dar uma olhada num algoritmo que consegue clonar a voz de uma pessoa usando um audio de apenas 5 segundos
Dela falando, bizarro e voce ja deve ter percebido que a programação tá crescendo absurdamente né, no futuro todo mundo vai ter que entender um pouco de programação pra conseguir lidar com as maquinas que tão por vir, e é claro que a Alura, a patrocinadora desse video, vai te ajudar com isso
A alura é uma plataforma de cursos online sobre tecnologia, com aulas 100% em portugues no momento ela tem mais de 1200 cursos sobre tecnologia, em varias areas diferentes, que vai desde jogos, python e machine learning até design, edição de vídeos e empreendedorismo digital mano se vc tá estudando tecnologia pra se preparar
Pro futuro como eu, essa plataforma tem tudo pra vc e se vc ta começando agora é importantíssimo ter isso tudo estruturado e de forma didatica. entao aproveita o link que eu to deixando aqui na descrição com 10% desconto e nao
Perde tempo não, acessa www.alura.com.br/promocao/universoprogramado e se prepara, que o futuro é doido demais bicho agora pera ai, sara, solta o video. voce alguma vez ja deve ter ouvido falar no termo deepfake, esse termo é usado quando a gente treina uma rede neural com o objetivo de falsificar rostos humanos
Existem tipos diferentes de deep fake como por exemplo esse, que troca apenas a face das pessoas, mas o resto da cabeça e do corpo continuam iguais… ele é muito usado pra fazer filtros engraçados e brincadeiras nas redes sociais e esse, que é ainda mais avançado e sintetiza absolutamente tudo,
Esse vídeo que voce tá vendo não é de uma pessoa sendo filmada enquanto fala, ele foi 100% criado por um algoritmo e o que ele tá falando foi escolhido pela pessoa que configurou o algoritmo só que o termo deepfake não é limitado apenas a clonagem de faces, ele inclui vozes também.
Existem várias iniciativas nessa área de pesquisa, que tentam clonar o timbre da voz de uma pessoa e até mesmo o jeito dela de falar. Uma delas se chama WaveNet, do grupo DeepMind da Google. A wavenet é uma rede neural convolucional causal dilatada que nome é esse bicho!
Nao nao pera ai victor, rede neural convolucional pra processar sons? achei que esse tipo de rede fosse só pra imagens. É meu amigo, elas estão em todos os lugares quando o assunto é processamento de sons, geralmente são usadas as redes neurais recorrentes, porque elas são melhores em processar informações
Sequenciais, informações que variam ao longo do tempo eles tão usando uma convolucional aqui justamente por causa desse ‘dilatada’ que tem no nome, Essa dilatação é uma adaptação que deixa a rede neural convolucional com um comportamento um pouco mais parecido com o de uma rede neural recorrente, só que a
Convolucional é bem mais fácil de treinar. o treinamento é daquele jeitão padrão mesmo, que a gente já tá acostumado, dando toneladas e mais toneladas de áudios pra ela conseguir extrair o padrão deles. daí depois do treino, ela consegue pegar
Um texto e falar ele e se você não der nenhum texto pra ela falar, ela consegue inventar palavras por conta propria. misturando o que ela aprendeu no treinamento e como ela trabalha com a onda sonora bruta, se voce treinar ela com sons de piano, ela consegue criar musica também
E é claro que os caras não se contentaram com esses resultados e continuaram as pesquisas em 2019 esse artigo foi publicado. nele os pesquisadores conseguiram criar uma arquitetura de redes neurais que consegue clonar as vozes das pessoas usando um audio
De apenas 5 segundos dela falando 5 segundos mano, é um audio no zap e já era, alguem pode fazer um assistente virtual com sua voz, alias, pausa, eu to sentindo que no futuro as pessoas famosas vão vender os direitos de uso das suas vozes por pequenas fortunas, fica de olho
E se liga nos resultados que eles conseguiram a ideia aqui é que vc tenha um texto escrito e um audio de 5 segundos da pessoa falando qualquer coisa, dai o algoritmo vai gerar outro audio dessa mesma voz só que falando aquilo que tá no texto escrito
Cada coluna colorida dessa é uma pessoa diferente e a primeira linha são os audios originais das pessoas falando os outros são os audios gerados pelo algoritmo, com o que tá sendo falado escrito em cima repara que nesses audios existem fonemas que não existem no audio original,
Então o algoritmo tá inferindo o resultado, ele está supondo como esse fonema seria falado nesse novo timbre de voz, usando o conhecimento que ele conseguiu durante o treinamento Isso é o coração do Machine Learning e das Redes Neurais, a generalização para
Novos casos que não estão nos dados, sem isso o algoritmo não serve pra nada. beleza, mas como esse algoritmo funciona? a arquitetura dele tem 3 elementos principais que podem e devem ser treinados independentemente. o codificador de falas, que tá pintado de verde
O sintetizador, que é tudo isso de roxo e o decodificador de falas, que é o vermelho o codificador de falas é o responsavel por extrair e codificar o timbre da voz que tá no audio de 5 segundos o sintetizador é o cara que recebe uma frase
Em formato de texto e transforma em um espectograma. espectograma é basicamente uma forma visual de representar sons. repara que aqui no meio o resultado do codificador de falas é inserido no sintetizador, justamente pro espectograma final sair com o timbre da
Voz que tá no audio de 5 segundos e aqui no final tem o codificador de voz, que é o responsavel por pegar o espectograma que saiu do sintetizador e transformar no audio final. inclusive esse codificador de voz é baseado justamente no wavenet
E o melhor de tudo é que você só precisa treinar esses elementos uma unica vez, depois de treinados, eles são capazes de clonar qualquer voz. teoricamente né, porque na pratica a gente sabe que sempre vão ter aqueles casos que a clonagem nao vai ficar perfeita
E vai precisar melhorar o algoritmo um pouco mais e ai voce me pergunta, po victor? só funciona em ingles? tudo sempre em ingles, os artigos, as vozes, os resultados. ai tu me complica pois é meu amigo, nosso pais nao investe em ciencia, quando se der conta, vai ser tarde
Demais. mas calma, que nesse caso específico nós temos uma iniciativa brasileira que fez umas paradas bem interessantes eu to falando do projeto Mr.Falante, uma iniciativa da Universidade Federal de Goias em parceria com a CyberLabs se liga nos resultados dos caras.
Atenção, as falas que voce vai ouvir agora foram geradas pelo algoritmo, não foram os donos das vozes que falaram isso que será ouvido. repetindo essas falas nao são verdadeiras, elas foram criadas artificialmente bizarro né mano, até a intonação da voz e o jeito de falar.
E ta ficando cada vez mais dificil distinguir o que é verdadeiro e o que é falso com esses nossos sentidos limitados de ser humano, vou fazer um teste contigo, se liga vou te mostrar 2 videos e vc vai ter que adivinhar qual deles foi gerado ou modificado por uma
IA, e qual deles é 100% verdadeiro e ai, o que tu acha? Se voce chutou que o segundo é fake e o primeiro é verdadeiro, erroooooou os dois foram modificados por uma IA, o segundo é 100% gerado e o primeiro só trocou o rosto inclusive esse primeiro video ficou famoso recentemente,
Ele foi usado por uma empresa pra enganar os clientes e roubar criptomoedas. quem aparece no vídeo é o suposto CEO da empresa fazendo um comunicado, mas na verdade, o rosto tá trocado a empresa sumiu levando em torno de 17 milhões
De reais em criptomoedas e por causa do deep fake, ninguem sabe quem é que tá por trás dessa mascara a ideia foi usar o video pra passar credibilidade e fazer os clientes confiarem na empresa, e eu chutaria que a voz dele tambem tá trocada
Juntar a clonagem de voz com a clonagem de faces é uma verdadeira bomba geradora de fake news e crimes ciberticos, mas esse assunto a gente deixa pra um proximo video por enquanto, tenham muito cuidado, se informem o maximo que der e nao confiem em nada que voces veem e ouvem.
Nós entramos na era do virtual, e a partir de agora, tudo é virtualmente possível. e o agradecimento especial de hoje vai pro nosso super membro André Neidert Muito obrigado por apoiar o canal André, são voces os responsaveis por fazer o Universo Programado continuar girando! Tamo junto!
E por hoje é isso galera, cuidado com seus audios no zap, e até a proxima
,00:04 Seja muito bem vindo ao universo programado eu sou o Victor Dias, programador e um alvo
00:09 fácil para a clonagem de voz no video de hoje a gente vai dar uma olhada
00:13 num algoritmo que consegue clonar a voz de uma pessoa usando um audio de apenas 5 segundos
00:18 dela falando, bizarro e voce ja deve ter percebido que a programação
00:25 tá crescendo absurdamente né, no futuro todo mundo vai ter que entender um pouco de
00:28 programação pra conseguir lidar com as maquinas que tão por vir, e é claro que a Alura,
00:33 a patrocinadora desse video, vai te ajudar com isso
00:36 A alura é uma plataforma de cursos online sobre tecnologia, com aulas 100% em portugues
00:41 no momento ela tem mais de 1200 cursos sobre tecnologia, em varias areas diferentes, que
00:47 vai desde jogos, python e machine learning até design, edição de vídeos e empreendedorismo
00:53 digital mano se vc tá estudando tecnologia pra se preparar
00:56 pro futuro como eu, essa plataforma tem tudo pra vc
00:59 e se vc ta começando agora é importantíssimo ter isso tudo estruturado e de forma didatica.
01:05 entao aproveita o link que eu to deixando aqui na descrição com 10% desconto e nao
01:09 perde tempo não, acessa www.alura.com.br/promocao/universoprogramado e se prepara, que o futuro é doido demais
01:18 bicho agora pera ai, sara, solta o video.
01:24 voce alguma vez ja deve ter ouvido falar no termo deepfake, esse termo é usado quando
01:28 a gente treina uma rede neural com o objetivo de falsificar rostos humanos
01:33 existem tipos diferentes de deep fake como por exemplo esse, que troca apenas a
01:37 face das pessoas, mas o resto da cabeça e do corpo continuam iguais… ele é muito
01:42 usado pra fazer filtros engraçados e brincadeiras nas redes sociais
01:46 e esse, que é ainda mais avançado e sintetiza absolutamente tudo,
01:51 esse vídeo que voce tá vendo não é de uma pessoa sendo filmada enquanto fala, ele
01:55 foi 100% criado por um algoritmo e o que ele tá falando foi escolhido pela pessoa que
02:00 configurou o algoritmo só que o termo deepfake não é limitado
02:04 apenas a clonagem de faces, ele inclui vozes também.
02:07 Existem várias iniciativas nessa área de pesquisa, que tentam clonar o timbre da voz
02:12 de uma pessoa e até mesmo o jeito dela de falar.
02:15 Uma delas se chama WaveNet, do grupo DeepMind da Google.
02:18 A wavenet é uma rede neural convolucional causal dilatada
02:23 que nome é esse bicho!
02:25 nao nao pera ai victor, rede neural convolucional pra processar sons? achei que esse tipo de rede fosse só pra imagens.
02:32 É meu amigo, elas estão em todos os lugares quando o assunto é processamento de sons,
02:37 geralmente são usadas as redes neurais recorrentes, porque elas são melhores em processar informações
02:42 sequenciais, informações que variam ao longo do tempo
02:45 eles tão usando uma convolucional aqui justamente por causa desse ‘dilatada’ que tem no
02:51 nome, Essa dilatação é uma adaptação que deixa
02:54 a rede neural convolucional com um comportamento um pouco mais parecido com o de uma rede neural recorrente, só que a
03:00 convolucional é bem mais fácil de treinar. o treinamento é daquele jeitão padrão mesmo,
03:04 que a gente já tá acostumado, dando toneladas e mais toneladas de áudios pra ela conseguir
03:09 extrair o padrão deles. daí depois do treino, ela consegue pegar
03:12 um texto e falar ele e se você não der nenhum texto pra ela falar,
03:28 ela consegue inventar palavras por conta propria. misturando o que ela aprendeu no treinamento
03:45 e como ela trabalha com a onda sonora bruta, se voce treinar ela com sons de piano, ela
03:49 consegue criar musica também
04:13 e é claro que os caras não se contentaram com esses resultados e continuaram as pesquisas
04:17 em 2019 esse artigo foi publicado. nele os pesquisadores conseguiram criar uma
04:23 arquitetura de redes neurais que consegue clonar as vozes das pessoas usando um audio
04:27 de apenas 5 segundos dela falando 5 segundos mano, é um audio no zap e já
04:33 era, alguem pode fazer um assistente virtual com sua voz,
04:36 alias, pausa, eu to sentindo que no futuro as pessoas famosas vão vender os direitos
04:40 de uso das suas vozes por pequenas fortunas, fica de olho
04:45 e se liga nos resultados que eles conseguiram a ideia aqui é que vc tenha um texto escrito
04:50 e um audio de 5 segundos da pessoa falando qualquer coisa, dai o algoritmo vai gerar
04:54 outro audio dessa mesma voz só que falando aquilo que tá no texto escrito
05:00 cada coluna colorida dessa é uma pessoa diferente e a primeira linha são os audios originais
05:05 das pessoas falando
05:23 os outros são os audios gerados pelo algoritmo, com o que tá sendo falado escrito em cima
05:44 repara que nesses audios existem fonemas que não existem no audio original,
05:48 então o algoritmo tá inferindo o resultado, ele está supondo como esse fonema seria falado
05:54 nesse novo timbre de voz, usando o conhecimento que ele conseguiu durante o treinamento
05:59 Isso é o coração do Machine Learning e das Redes Neurais, a generalização para
06:03 novos casos que não estão nos dados, sem isso o algoritmo não serve pra nada.
06:07 beleza, mas como esse algoritmo funciona?
06:10 a arquitetura dele tem 3 elementos principais que podem e devem ser treinados independentemente.
06:17 o codificador de falas, que tá pintado de verde
06:20 o sintetizador, que é tudo isso de roxo e o decodificador de falas, que é o vermelho
06:25 o codificador de falas é o responsavel por extrair e codificar o timbre da voz que tá
06:30 no audio de 5 segundos o sintetizador é o cara que recebe uma frase
06:34 em formato de texto e transforma em um espectograma. espectograma é basicamente uma forma visual
06:40 de representar sons. repara que aqui no meio o resultado do codificador
06:45 de falas é inserido no sintetizador, justamente pro espectograma final sair com o timbre da
06:50 voz que tá no audio de 5 segundos e aqui no final tem o codificador de voz,
06:55 que é o responsavel por pegar o espectograma que saiu do sintetizador e transformar no
07:00 audio final. inclusive esse codificador de voz é baseado justamente no wavenet
07:05 e o melhor de tudo é que você só precisa treinar esses elementos uma unica vez, depois
07:09 de treinados, eles são capazes de clonar qualquer voz. teoricamente né, porque na
07:13 pratica a gente sabe que sempre vão ter aqueles casos que a clonagem nao vai ficar perfeita
07:18 e vai precisar melhorar o algoritmo um pouco mais
07:20 e ai voce me pergunta, po victor?
07:22 só funciona em ingles?
07:24 tudo sempre em ingles, os artigos, as vozes, os resultados. ai tu me complica
07:29 pois é meu amigo, nosso pais nao investe em ciencia, quando se der conta, vai ser tarde
07:33 demais. mas calma, que nesse caso específico nós
07:36 temos uma iniciativa brasileira que fez umas paradas bem interessantes
07:40 eu to falando do projeto Mr.Falante, uma iniciativa da Universidade Federal de Goias em parceria
07:45 com a CyberLabs se liga nos resultados dos caras.
07:49 atenção, as falas que voce vai ouvir agora foram geradas pelo algoritmo, não foram os
07:55 donos das vozes que falaram isso que será ouvido.
07:58 repetindo essas falas nao são verdadeiras,
08:01 elas foram criadas artificialmente
09:13 bizarro né mano, até a intonação da voz e o jeito de falar.
09:18 e ta ficando cada vez mais dificil distinguir o que é verdadeiro e o que é falso com esses
09:23 nossos sentidos limitados de ser humano, vou fazer um teste contigo, se liga
09:27 vou te mostrar 2 videos e vc vai ter que adivinhar qual deles foi gerado ou modificado por uma
09:32 IA, e qual deles é 100% verdadeiro e ai, o que tu acha?
09:59 Se voce chutou que o segundo é fake e o primeiro é verdadeiro, erroooooou
10:03 os dois foram modificados por uma IA, o segundo é 100% gerado e o primeiro só trocou o rosto
10:10 inclusive esse primeiro video ficou famoso recentemente,
10:13 ele foi usado por uma empresa pra enganar os clientes e roubar criptomoedas.
10:17 quem aparece no vídeo é o suposto CEO da empresa fazendo um comunicado, mas na verdade,
10:23 o rosto tá trocado a empresa sumiu levando em torno de 17 milhões
10:27 de reais em criptomoedas e por causa do deep fake, ninguem sabe quem é que tá por trás
10:31 dessa mascara a ideia foi usar o video pra passar credibilidade
10:34 e fazer os clientes confiarem na empresa, e eu chutaria que a voz dele tambem tá trocada
10:39 juntar a clonagem de voz com a clonagem de faces é uma verdadeira bomba geradora de
10:44 fake news e crimes ciberticos, mas esse assunto a gente deixa pra um proximo video
10:48 por enquanto, tenham muito cuidado, se informem o maximo que der e nao confiem
10:52 em nada que voces veem e ouvem.
10:55 Nós entramos na era do virtual, e a partir de agora, tudo é virtualmente possível.
10:59 e o agradecimento especial de hoje vai pro nosso super membro André Neidert
11:03 Muito obrigado por apoiar o canal André, são voces os responsaveis por fazer o Universo
11:07 Programado continuar girando!
11:09 Tamo junto!
11:10 e por hoje é isso galera, cuidado com seus audios no zap, e até a proxima
, , , #Inteligência #Artificial #CLONA #sua #voz #apenas #segundos , [agora]