Partindo dos dados que gerem de forma fechada, os modelos de linguagem desenvolvidos por essas grandes tecnológicas, detentoras da tecnologia, traduzem e veiculam padrões, sistemas, serviços e aplicações próprios, que não refletem necessariamente nem convocam as realidades e a diversidade que o mundo encerra, sem que, pelas exigências financeiras que os recursos computacionais nos quais assentam exigem, o panorama se possa alterar com facilidade.
Juntando a esse facto o de privilegiarem uma determinada língua na construção desses modelos, os padrões linguísticos, as sequências discursivas e os conteúdos gerados (codificados nos dados) veiculam também eles uma forma própria e específica de se estruturar e de representar a realidade, assim tornada hegemónica.
A construção de uma internet socialmente justa, que respeite a diversidade, o multilinguismo, assente numa visão multissetorial e multilateral, surge, por tal, entre os desígnios que o Fórum inscreveu no que nomeou “Carta de São Paulo”, realçando a importância de diminuir a assimetria computacional, abrir a tecnologia a um maior número possível de atores e advogar uma política de acesso aberto aos dados.
A dimensão da tarefa de criar bases de dados específicas (datasets) que constituam amostras para treino de algoritmos de IA e desenvolver modelos de computação (em língua portuguesa - LP) é enorme e apenas, ao nível da CPLP, uma forte cooperação entre os Estados (mobilizando empresas e a academia) facilitará avanços nessa maior autonomização, vista também como uma questão de soberania.
Todas estas questões são também decisivas para uma presença forte da LP na internet e no digital, ao mesmo tempo que a ciência construída nesse embasamento linguístico e simbólico estará mais próxima dos valores e das realidades daqueles que a usam.
Sendo, assim, fundamentais, outras, porém, se lhe acrescentam onde focámos a intervenção.
No referido estudo sobre a PPI, focado no uso das línguas em contexto digital e aplicando uma metodologia que toma por referência os dados relativos a falantes de L1 e L2 (língua materna e não materna), a LP ocupa a 6ª posição mundial, com a possibilidade de reforçar a sua presença, mas também com o risco de perder até 4 posições.
Para além das condicionantes estratégicas sinalizadas, em termos da LP e dos espaços onde circula, a assunção da internet (do digital) como um bem público e um direito fundamental dos cidadãos afigura-se também como um vetor central.
O relevo que a incorporação da dimensão tecnológica digital detém hoje no empoderamento dos cidadãos, no exercício da sua cidadania, no acesso ao conhecimento, na criação e na expressão de informação e de conteúdos e na proteção de outros direitos humanos acentua a necessidade da sua consideração como um bem comum, humano e público, importando, por tal, que as agendas digitais dos países confiram às pessoas uma relevância idêntica à que merecem a economia e a modernização do Estado.
Os dados da International Communication Unit ajudam a compreender essa necessidade. Considerando a população, o acesso à internet em metade dos países de LP situa-se ainda bem abaixo da média mundial (64,4%), variando entre os 17,4% e os 85,1%. Tal poderá significar cerca de 70 milhões de pessoas excluídas, sendo que, se se associar a taxa de acesso ao peso que a faixa dos 0-14 anos tem na estrutura demográfica (representando o maior peso precisamente nos países com menor conectividade), tudo indica que parte importante desses excluídos serão jovens em formação e em processo de aquisição da própria LP, L2 em muitos contextos sociolinguísticos destes países. Num outro dado relevante, o custo de acesso pesa quatro vezes mais no rendimento mensal (6%) nos países menos desenvolvidos do que no resto do mundo, o que indiciará também níveis elevados de precariedade no acesso.
Entendendo o acesso ao digital e às suas tecnologias como forma de reforçar a cidadania e a participação nas dinâmicas sociais, económicas, culturais e académicas, o cenário aponta para uma brecha digital dos países relativamente a outros na mesma região e, sobretudo, para desigualdades e diferenças de oportunidade dentro de cada país, a afastarem muitos das novas formas de participar. E tudo isto de forma significativa (que não exclusiva) em português, que é também uma forma de construir e exercer cidadania.
O alargamento da acessibilidade e a aposta na literacia digital (o acesso não significa o uso ou o bom uso, dependendo isso das competências digitais que o indivíduo possua, das condições de que disponha para que as possa desenvolver e da adequação dessas competências a um princípio de bem comum) constituem, por isso, outro nível de cooperação e de articulação no âmbito da governação da internet nos países de LP.
Caberá à ARME - Agência Reguladora Multissectorial da Economia organizar o 2ª Fórum, em 2024. Boas notícias serão aí a mitigação das brechas e das desigualdades digitais, o investimento no património informacional (“digitização”), na coleção de dados (“dataficação”) e no reforço dos bens públicos e da inovação (“digitalização), o que aumentará os 3,7% do tráfego linguístico na internet que agora decorre em LP.

