
O assistente de pesquisa e escrita com Inteligência Artificial do Google Labs NotebookLM anunciou esta quarta-feira uma expansão global significativa, tornando-se agora acessível em mais de 200 países e com suporte para mais 76 línguas, incluindo português de Portugal. O grande destaque desta atualização é a funcionalidade Audio Overviews, que transforma os materiais carregados em discussões de áudio envolventes, um verdadeiro podcast realista feito a duas vozes.
Michael Chen e Usama Bin-Shavkat, engenheiros de software do Google Labs - espaço onde a empresa explora e demonstra novas tecnologias e funcionalidades - que trabalham no NotebookLM, apresentaram as novidades numa mesa redonda virtual internacional com jornalistas, em que o DN/Dinheiro Vivo esteve presente. Os especialistas salientaram que o NotebookLM é projetado “como um assistente de pesquisa e escrita com IA”, criado para ajudar os utilizadores a compreenderem e explorarem materiais complexos. Funciona como um perito de IA personalizado que age exclusivamente tendo em conta os documentos, notas ou conteúdos fornecidos (suporta formatos como Google Docs, Google Slides, PDF, URL, vídeos do YouTube ou ficheiros de áudio). É possível carregar até 50 fontes e 25 milhões de palavras num único projeto.
As respostas dadas pela IA são exclusivamente “baseadas nas fontes que a forneceu”, como disse Michael Chen, o que ”reduz significativamente o risco de imprecisões factuais”.
A funcionalidade Audio Overviews é a grande novidade desta expansão. A ferramenta transforma os materiais carregados em “discussões de áudio envolventes e aprofundadas com apenas um clique”, diz aquele especialista.
Usama Bin-Shavkat descreve: “São dois anfitriões de IA [que] iniciam uma conversa baseada nesses conteúdos. Resumem as suas fontes, fazem conexões e até participam numa certa brincadeira, muito parecido com um talk show explicativo.”
Esta abordagem é “fantástica para utilizadores que aprendem melhor a ouvir ou que precisam de processar informação em movimento”, acrescenta, sendo possível “descarregar a conversa para ouvir a qualquer hora, em qualquer lugar”, exatamente como se fosse um podcast ‘verdadeiro’ (ouça como um recente artigo de opinião do autor sobre a IA e a crise de habitação ficou transformada em talk show).
A expansão para “mais de 76 línguas”, como anunciado por Michael Chen, tem por base o “suporte de áudio nativo do Gemini”, o grande modelo de linguagem (LLM) da Google. O objetivo é “expandir a poderosa ferramenta de aprendizagem a um público internacional mais vasto”, explica o especialista. O suporte de áudio alinha-se inicialmente com a “língua definida na conta Google” do utilizador, mas é possível alterá-la nas definições.
A equipa colaborou com diversas equipas da Google, incluindo a Google DeepMind, para que as vozes soassem “o mais natural possível”, descreve o engenheiro informático. E foram feitos esforços para garantir que a IA tivesse “uma boa compreensão do que o coloquialismo significa para diferentes línguas”, tendo em conta as diferenças culturais
De momento é apenas possível ter os podcasts com duas vozes, uma masculina e outra feminina, mas a equipa quer evoluir este sistema para o tornar ainda mais específico, passando a incluir “regiões e sotaques e coisas do género” no futuro, disse Usama Bin-Shavkat em resposta ao DN/DInheiro Vivo.
É possível “personalizar a forma como o conteúdo do áudio é apresentado” fornecendo “instruções aos anfitriões de IA para se concentrarem numa área específica ou ajustarem o seu nível de especialização”, disse ainda ao DN/Dinheiro Vivo Michael Chen.
Outra novidade agora incluída no NotebookLM é o Mind Map, que visa ajudar os utilizadores a visualizarem e ligarem ideias dentro das suas fontes.
A ferramenta “gera diagramas visuais interativos baseados nas fontes e notas carregadas”, como disse Michael Chen. Ao transformar os seus materiais num mapa visual, o My Maps oferece uma forma inovadora de interagir com a informação, organizando-a de maneira gráfica e intuitiva.
A principal utilidade dos Mind Maps é “ajudar a compreender rapidamente a estrutura geral do material e descobrir ligações entre conceitos que a IA encontra nos documentos”, descreve Usama Bin-Shavkat. Utilizámos a ferramenta para escrever este artigo (ver foto em cima) e a sua eficácia foi evidente.