Celulares em mãos: dados de usuários são bens valiosos na mão de empresas como a OpenAI (Getty Images/Getty Images)
Repórter
Publicado em 28 de fevereiro de 2024 às 10h35.
Última atualização em 28 de fevereiro de 2024 às 10h36.
Nem toda empresa consegue se jogar no mercado de IA generativa com uma nova ferramenta. Enquanto Microsoft e Google correm com seus próprios produtos e aprofundam parcerias, players menores do mercado de redes sociais tentam conseguir alguma fatia com possivelmente a única carta que eles têm na manga: dados de usuários.
Ambas pertencentes a americana Automattic, a rede social Tumblr e o publicador WordPress estariam prestes a fechar acordos com as empresas de IA generativa OpenAI e MidJourney para ajudar no treinamento de modelos de linguagem.
Já o Reddit, que acaba de registrar pedido de IPO, está negociando um contrato de US$ 60 milhões com o Google para alimentar ferramentas como o Gemini enquanto busca "novas formas de gerar receita".
As informações não foram confirmadas pelas empresas, mas foram divulgadas pelos portais 404 Media e Reuters, que conversaram com fontes internas das companhias.
É importante entender o contexto no qual essas parcerias surgem.
Empresas que desenvolvem ferramentas de IA têm buscado companhias de mídia para treinar e diversificar os modelos de linguagem, mas também para escapar de um eventual processo por direitos autorais.
O jornal americano New York Times, por exemplo, está processando a OpenAI e a Microsoft por treinar seus modelos ChatGPT e Copilot através da "cópia e uso de milhões" de seus artigos.
A OpenAI também já fechou contrato com a Shutterstock, por exemplo, uma provedora de bancos de imagens e vídeos, provavelmente para treinar ferramentas como a Sora.