A Alexa está entrando no campo da inteligência artificial (IA) generativa e agora está “conversando como um humano”. Essa novidade foi revelada durante o evento global de dispositivos da Amazon realizado nesta quarta-feira (20).
Dave Limp, vice-presidente sênior de dispositivos e serviços da Amazon, explicou que a “IA generativa está voltada para os criadores, não para os consumidores”, e isso está gerando grandes expectativas em relação à atualização.
A ideia é bastante simples: quando você iniciar uma conversa com a Alexa, ela responderá de forma mais rápida e natural. A Amazon chama seu modelo de linguagem de Speech-to-Speech. Com essa atualização, a Alexa também será capaz de aprender diretamente com as conversas e interações dos usuários individuais.
Esse novo modelo de linguagem (LLM) unifica as interações de texto para fala e, em seguida, converte essas respostas em áudio, conforme explicado por Rohit Prasad, vice-presidente e chefe de ciência da Amazon Artificial General Intelligence.
Com essa atualização, a Alexa também deverá parecer mais humana em suas interações. Por exemplo, a assistente poderá rir, expressar surpresa e até mesmo incluir pausas com “hum…” durante uma conversa.
Um recurso demonstrado pela empresa é a capacidade da “nova Alexa” de continuar uma conversa de maneira mais fluida. Será possível iniciar uma conversa, parar de falar por um tempo e depois retomar o mesmo tópico. Também será possível interromper uma resposta para adicionar mais contexto ou fazer perguntas adicionais durante uma interação.
A proposta inclui a ideia de eliminar a necessidade de repetir a palavra de ativação “Alexa” o tempo todo sempre que você quiser falar com a assistente. Para isso, existe um novo recurso relacionado ao Visual ID, que permite iniciar uma conversa simplesmente aproximando-se da tela, pois a Alexa será capaz de reconhecer rostos. No entanto, essa função é compatível apenas com modelos de dispositivos Echo que possuem tela e câmera.
A Alexa baseada nesse novo modelo de linguagem estará disponível para todos os modelos Echo, incluindo o modelo original lançado em 2014. Entretanto, inicialmente, estará disponível apenas para usuários nos Estados Unidos.
Dave Limp enfatiza que a “nova Alexa” foi projetada com base em cinco princípios:
1. Conversação: Leva em consideração palavras, linguagem corporal, contato visual, gestos, entre outros elementos.
2. Aplicações do mundo real: Torna os LLMs (modelos de linguagem) mais relevantes para os usuários em situações do cotidiano, não apenas em navegadores de internet.
3. Personalização: Permite que as conversas sejam específicas para diferentes usuários, como em ambientes familiares.
4. Personalidade: A Alexa baseada no novo LLM terá mais personalidade e poderá expressar opiniões.
5. Confiabilidade: Garante a proteção da privacidade dos usuários e suas famílias, além de fornecer informações confiáveis.
A Amazon também permitirá que desenvolvedores explorem e integrem suas APIs com o LLM da Alexa. A adaptação a essas mudanças, segundo a empresa, será simples e rápida, e essa novidade estará disponível a partir do próximo ano.