Recentemente, o Google apresentou durante a sua conferência, o Google I/O 2018, apresentou a Google Duplex. A tecnologia permite resolver algumas tarefas com apenas uma ligação.

Este recurso, que representa um passo largo relacionado à inteligência artificial, vem para facilitar a vida do usuário. Inclusive é possivel que o item seja incluído no Google Assistente a partir da versão 9.0 do SO.

Para entender um pouco como funciona é preciso relacionar com os chats que são respondidos por bots. Ou seja, a maior parte apresenta respostas a quase todas as perguntas. No caso da Duplex, é possível ter uma conversa simples com as pessoas e ter suas questões respondidas.

No caso do Duplex a função é um pouco similar, mas utiliza os recursos de voz para efetuar as ligações.

Contato natural

Durante a apresentação da Google Duplex, o Google simulou uma ligação para agendar um horário em um salão de cabeleireiro. Na demonstração, pode-se perceber que o contato é natural e parece que uma pessoa real está ali. Confira a apresentação no vídeo em inglês abaixo (a partir do 35:20).

Como vemos a máquina se comporta como um humano, quando para em uma dúvida ou quando outro a interrompe.

O objetivo é que esta tecnologia seja aplicada em pequenas empresas que não podem contratar uma pessoa para chamadas telefônicas. Como consequência uma máquina pode ser a solução e forma de responder estas questões.

Base da tecnologia do Google Duplex

O Google Duplex utiliza como base a Rede Neural Recorrente (RNN – Recurrent Neural Network). Ou seja, ela tem bastante relação com a estrutura que permite o funcionamento do nosso cérebro.

Além disso, ela usa a tecnologia do Google chamada ASR (Authomatic Speech Recognition), que tem ahabilidade de reconhecer o que o usuário fala. O sistema precisou ser treinado com diferentes tipos de ligações, até ter um resultado satisfatório.

O destaque também fica pelas pausas, inclusive momentos que a máquina faz sons como “aham”, “umm”, entre outros. Para ajudar na naturalidade, a entonação é controlada por mecanismos de conversão de texto para fala (TTS). Com estes detalhes fica mais próximo de uma pessoa do que que um computador.

Ainda, a rede neural da Duplex usou como treino um banco de conversas telefônicas anônimas. Ela utiliza o resultado da tecnologia de reconhecimento automático de fala (ASR) do Google, assim como as habilidades do áudio, o histórico da conversa e seus parâmetros.

Para diálogos sofisticados ela também se sai bem, porém, caso a tarefa seja mais complicada o sistema repassa para um operador humano. Para melhora do software e também para funcionar em novas áreas de atuação os instrutores supervisionam o trabalho. Ou seja, eles guiam todos os procedimentos e o IA acaba evoluindo.

Esta nova tecnologia permite que o usuário faça um pedido a qualquer momento, mesmo com conexão ruim ou local fechado. A ferramenta pode ser uma alternativa para pessoas com deficiência auditiva e viajantes que não falam o idioma do país que estão visitando.

Relação ética do Google Duplex

Apesar do anúncio do Google Duplex ter sido bem recebido, muitos usuários levantaram a questão da ética do recurso. Ou seja, às vezes o humano pode não saber que está falando com um robô. Entretanto, a companhia avisa que o assistente virtual vai se identificar.

Sem previsão de lançamento, a tecnologia ainda está em fase de testes. Logo que mais novidades estiverem disponíveis vamos apresentar. E você o que achou? Conta pra gente nos comentários.