Esta semana gravámos na Web Summit este episódio do podcast "No limite da inteligência artificial". No nosso estúdio dentro de um dos eventos tecnológicos mais importantes da Europa estiveram à conversa, desta vez, apenas o jornalista Bruno Contreiras Mateus com Paulo Dimas, vice-presidente de Inovação de Produto da Unbabel e CEO do centro para a IA responsável..Além dos destaques da Web Summit que chamaram mais a atenção, Paulo Dimas explica ainda o que é um LLM e qual a importância do anúncio do primeiro-ministro, Luís Montenegro, logo no arranque da Web Summit, de um ‘chatGPT português’..Quatro perguntas a Paulo Dimas:.O que é um LLM?.Um LLM, na prática, é o chatGPT. Para simplificar e toda a gente entender, quem já usou o chatGPT, no fundo, está a usar um LLM com aquela interface onde podemos colocar as perguntas. Conseguimos escrever a pergunta, enviamos e depois ele responde. Isso é um LLM, que de forma mais formal, é um Large Language Model. É um modelo de linguagem de grande escala, ao nível de ter 175 mil milhões de parâmetros. Na prática, o que este grande modelo faz, que é um modelo probabilístico, é simplesmente prever a próxima palavra. Hoje em dia, temos startups em Portugal que estão a treinar LLMs, estão a usar supercomputação em Barcelona para treinar LLMs. Estamos a desenvolver esta tecnologia em Portugal, temos o talento para criar um chatGPT, só não existe a capacidade computacional. Mas isto praticamente não existe em nenhuma parte do mundo, só nas grandes empresas. Portanto, este talento com computação e com muitos dados – neste caso estamos a falar de três biliões de palavras para treinar. Essas palavras de onde vêm? Estes modelos aprenderam ao ler livros..Por que é importante ser em português?.É absolutamente fundamental. Se não formos nós a preservar a soberania sobre a nossa língua, não vai ser nenhum país do mundo a fazê-lo. Por muito boas intenções que a OpenAI tenha, no sentido da representatividade linguística, eles não o vão fazer, não existe nenhuma vantagem económica para que o chatGPT, por exemplo, consiga diferenciar entre a variante portuguesa falada em Portugal e a variante portuguesa falada no Brasil. E o que acontece é que estamos a trabalhar em cima destes modelos em que, muitas vezes, sai algo abrasileirado, porque o modelo foi treinado com muitos mais dados de português do Brasil. O primeiro ponto é este: temos de ser soberanos em relação à nossa língua. O segundo ponto tem a ver com a nossa cultura. Estes modelos são, muitas vezes, usados para “explorarmos” a nossa cultura, a nossa literatura, os nossos autores. As nossas crianças, nas escolas, não vão poder fazer perguntas com respostas corretas sobre a nossa cultura. Por isso é um imperativo nacional..E que implicações isto tem para os cidadãos? .Começaria pela educação. Vai ser um recurso tecnológico que pode ser usado para construir em cima dele muitas aplicações de inteligência artificial na área da educação. As nossas crianças vão poder, e o primeiro-ministro também falou nisso, ter um tutor personalizado que conheça a nossa cultura, conheça a nossa história, conheça o português falado em Portugal. Isso é uma área completamente transformadora a nível de acesso ao conhecimento. A inteligência artificial generativa consegue ser altamente personalizada, ela consegue saber ou seguir um caminho tendo em conta o que nós não sabemos e isso é difícil de alcançar com uma aprendizagem mais generalizada, que é a aprendizagem na sala de aulas, em que todas as crianças são tratadas da mesma maneira. Depois, também pode ser um recurso transversal a toda a administração pública que não tenha apenas em conta, por exemplo, toda a legislação portuguesa, todos os processos portugueses, mas também, e esse também é um aspeto importante, que preserva os nossos dados. Não faz sentido os nossos dados, que são muitas vezes confidenciais, estarem a ser enviados para empresas como a OpenAI, ou como a Google, ou a Microsoft. Até por uma questão de garantia de toda a privacidade dos nossos cidadãos e isto é uma forma de garantir que os dados ficam no nosso território..As empresas vão poder utilizar este LLM?.Sim, pelo que sabemos. A informação vai ser comunicada agora brevemente. Esta iniciativa está a ser liderada pelo Ministério da Juventude e da Modernização, da ministra Margarida Balseiro Lopes. O que nos foi dado a entender é que será sempre um modelo aberto, será um recurso que qualquer empresa, qualquer organismo do Estado vai poder usar sem quaisquer custos, desde que não seja para fins comerciais, obviamente. Será um modelo aberto, com toda a transparência, seguindo todos os princípios da regulação europeia..Pode assistir a este programa nas plataformas habituais de streaming de podcasts:.Spotify - https://open.spotify.com/show/25ZciZ2mQhB9IskW3Q5HYj.Apple Podcasts - https://podcasts.apple.com/us/podcast/dinheiro-vivo-no-limite-da-inteligência-artificial-podcast/id1774783832