Our Self: Um blogue desalinhado, desconforme, herético e heterodoxo. Em suma, fora do baralho e (im)pertinente.
Lema: A verdade é como o azeite, precisa de um pouco de vinagre.
Pensamento em curso: «Em Portugal, a liberdade é muito difícil, sobretudo porque não temos liberais. Temos libertinos, demagogos ou ultramontanos de todas as cores, mas pessoas que compreendam a dimensão profunda da liberdade já reparei que há muito poucas.» (António Alçada Baptista, em carta a Marcelo Caetano)
The Second Coming: «The best lack all conviction, while the worst; Are full of passionate intensity» (W. B. Yeats)

15/11/2024

DEIXAR DE DAR GRAXA PARA MUDAR DE VIDA: Web Summit - as 200 mil dormidas já ninguém nos tira (11) - Talvez chegue para pagar o LLM português

Uma sequela de (1), (2), (3), (4), (5), (6), (7), (8), (9) e (10)

Desde 2016 pela mão do Dr. Costa primeiro e, depois, do Dr. Medina, e actualmente do Dr. Moedas, a Web Summit da iniciativa do Paddy em Dublin de 2009 a 2015 foi movida para Lisboa graças a um generoso subsídio de 11 milhões por ano, reduzido mais tarde para 7 milhões, que a câmara de Lisboa paga ao Paddy (a que acrescem a venda de entradas e o trabalho voluntário) para os alfacinhas terem o privilégio de receber umas dezenas de milhares de participantes estrangeiros.

A fantasia das startups está cada vez mais distante. Apesar de tudo, este ano disse a organização ainda estiveram umas 3 mil de 90 países. Segundo um estudo da Crunchbase as startups que cá vêm captam, em média, 5,5 milhões de dólares de novos investimentos por ano o que são peanuts neste negócio e são a consequência do pouco interesse que os investidores e venture capitalists manifestam por esta «Exponoivos para startups» como lhe chamou o fundador da Remote. Esse pouco interesse reflecte-se na queda de 3 lugares de Portugal no ranking da “Global Startup Ecosystem Index 2024”, da StartupBlink e na felicidade com que 400 startups brasileiras declaram esperar pelo menos 22 milhões de dólares em investimentos, o que seria até um montante modesto para meia dúzia. 

Para fechar o capítulo das fantasias e do pensamento milagroso, evoco o Dr. Luís Montenegro, primeiro-ministro em exercício do Portugal dos Pequeninos, que foi à Web Summit anunciar urbi et orbi o lançamento de «um LLM português - Large Language Model - para inovarmos em português, preservando o nosso idioma e utilizando a nossa cultura ao serviço da inovação». Esquecendo o facto que dada a língua portuguesa e dados os exemplos citados (um "tutor educativo" e "acesso aos serviços da administração pública de forma mais simples»), possivelmente não estamos a falar de um LLM, dos quais em todo o caso já existem por aí umas cinco dezenas, mas de um ou vários domain-specific models dos quais já existem milhares, permito-me manter dúvidas sobre se algum dia veremos tal modelo.

Dúvidas que, para ser curto, se fundam no investimento necessário que para um mid-scale LLM  pode atingir 50 milhões e para um Large-Scale LLM pode ir até mil milhões e no seu desenvolvimento sair da iniciativa de quatro instituições públicas, a saber Faculdade de Ciências e Tecnologia da Nova e Instituto Superior Técnico em articulação com a Fundação para a Ciência e a Tecnologia e o Centro para a IA Responsável (sublinho a palavra-chave "articulação"). 

Contudo, não me interpretem mal imaginando que considero a Web Summit uma inutilidade. Longe disso, considero uma excelente iniciativa para promover o turismo alfacinha, o que já é não nada mau, dada a carência de grana para pagar as importações de bens de consumo duradouro e popós e a partir de  agora um LLM português.
_____________________
Post scriptum:
Já depois de ter escrito este post, tomei conhecimento que afinal o LLM português previsto para estar pronto no primeiro trimestre de 2025 «parte de uma base em open source já existente, o Tower LLM, da Unbabel». A Unbabel foi uma startup portuguesa e é hoje uma empresa madura dedicada à tradução sobre a qual escrevi em 2015. Estranhamento nunca excitou os mídia portugueses, sempre muito dados ao wishful thinking. O investimento previsto é de 20 a 30 milhões e aplicando o coeficiente nacional de derrapagem a coisa vai parar a uns 7 ou 8 anos de royalties pagos pelo Paddy. Ou seja, estamos perante não de um desenvolvimento de raiz mas de uma adaptação de um modelo existente, adaptação que com as competências da Unbabel pode ser que algum dia fique concluída.

Sem comentários: