sexta-feira, 25 de agosto de 2023

A guerra em curso entre os autores e as empresas de IA generativa


Um recente artigo publicado na revista The Economist afirma que existe uma "guerra" em curso por dados (com vista ao treino dos modelos de IA, que necessitam de 1 trilião de palavras, valor esse que é muito superior ao tamanho Wikipedia que possui "apenas" quase 4 biliões de palavras). O artigo refere que a procura por esses dados cresce de forma tão rápida que o stock de texto de elevada qualidade irá esgotar-se em 2026 https://www.economist.com/business/2023/08/13/ai-is-setting-off-a-great-scramble-for-data

A parte (muito) positiva, do referido artigo, ocorre quando aquele lembra que por exemplo a Microsoft pagou 7,5 biliões de dólares por um repositório de software e ainda que existe um aumento do número de criadores de conteúdos (que foram utilizados no treino dos modelos de AI) que decidiram intentar acções judiciais para serem compensados financeiramente por essa utilização não autorizada e a frase chave é "Holders of information are taking advantage of their greater bargaining power"

O artigo refere que as firmas de IA também recolhem dados das interacções dos utilizadores com os seus modelos, nesse contexto, é pertinente revisitar um post de 26 de Julho, onde divulguei o facto de ao longo de 7 meses ter feito 624 solicitações ao ChatGPT (quase 100 por mês) de que resultou um histórico de texto que totalizou 550 páginas (Arial 11). https://19-pacheco-torgal-19.blogspot.com/2023/07/chatgpt-psychological-profile-of-users.html 

Tendo porém em conta que o novo histórico por mim hoje solicitado ao ChatGPT, refere um total de 884 solicitações, que representam 1034 páginas, então isso significa que durante o mês de Agosto, fiz 260 novas solicitações ao ChatGPT que se traduziram em 484 novas páginas de texto (Arial 11).  Em termos comparativos, as mais de 300 publicações académicas que sou autor e co-autor, representam quase 5000 páginas de texto, mas a essas falta somar mais outras mil páginas, correspondentes a pareceres sobre centenas de artigos científicos, sobre teses de doutoramento e sobre propostas de projectos de investigação. 

PS - Já para nem falar de mais outras mil páginas de texto que desde o final de 2019 produzi para a blogosfera, que foram lidas por visitantes de 150 países em particular da Finlândia e da Noruega https://pachecotorgal.com/2023/08/03/os-cientistas-finlandeses-e-noruegueses-que-andam-obcecados-com-um-portugues-coriaceo-e-os-cientistas-que-nao-sabem-que-nao-existem/