Repórter
Publicado em 13 de maio de 2024 às 14h59.
Última atualização em 13 de maio de 2024 às 16h25.
Se uma nova versão de um produto está para ser lançada, é esperado que a empresa diga aos clientes ou usuários que a próxima experiência será melhor e mais rápida. É o básico. Mas, quando se trata de inteligência artificial (IA), os limites parecem estar ampliados, e as entregas chegam a uma velocidade, por vezes, surpreendente. Qual é o limite para os modelos de linguagem em larga escala (LLMs, na sigla em inglês)?
A OpenAI, nesta segunda-feira, 13, esticou a corda e apresentou o GPT-4 o, uma atualização bastante robusta do antecessor GPT-4 Turbo, apresentado em novembro de 2023. O “o” nesse caso vem do latim “omni”, que significa “tudo”. Em uma transmissão descontraída, a CTO da empresa, Mira Murati, testou ao vivo — formato em desuso na indústria justamente para evitar constrangimentos quando a tecnologia falha — e exibiu uma IA mais humana no tom de voz, adaptável e agora capaz de interpretar o mundo real por meio da câmera do smartphone.
Entre os destaques do upgrade, está a interação mais natural e aparentemente continua, eliminando a necessidade de chats novos e separados para quando a conversa muda do texto para voz.
Digamos que agora tudo acontece em tempo real. Fale, escreva, mande arquivos e imagens para o GPT e haverá continuidade na conversa.
Durante o evento, os desenvolvedores interagiram com o modelo GPT-4 o, que mostrou a habilidade de detectar variações na respiração, como quando o desenvolvedor Mark Chan simulou que estava nervoso por fazer uma transmissão ao vivo.
A apresentação destacou ainda melhorias no reconhecimento de imagens. Um exemplo prático foi a identificação de uma equação matemática simples, onde o ChatGPT auxiliou na resolução de uma equação de primeiro grau (3X + 1 = 4).
"O novo ChatGPT estará disponível para desenvolvedores com o dobro da velocidade, 50% mais barato e com limites de taxa cinco vezes maiores em comparação ao GPT-4 Turbo", disse Mira, ao comentar como será a versão para empresas do ChatGPT, hoje usado para como base para milhares de chatbots de atendimento.
Também foram mencionadas melhorias na qualidade e velocidade em 50 idiomas diferentes, visando alcançar o maior número possível de pessoas. A equipe destacou o desafio de garantir a segurança dessas tecnologias e mencionou a colaboração com diversos setores para mitigar possíveis abusos por pessoas mal-intencionadas.
A escolha da OpenAI de exibir seus avanços não foi por acaso. Amanhã, terça-feira, 14, o Google fará o evento I/O, uma data tradicional da empresa para o anúncio de novos projetos.
Mas a empresa comandada por Sam Altman quis antecipar sua posição na corrida da IA, levando tudo à mesa um dia antes. Sobre o que o Google fará, apenas especulações por meio do que a empresa vem apresentando.
Entre elas, há a de que o Gemini, o equivalente do Google para o ChatGPT, trará mais integração com o buscador e se valerá mais da função Google Lens, ao moldes do que hoje está disponível apenas por meio do smartphone da Samsung, na linha Galaxy S24.
Mas será do jeito Google. Espera-se testes gravados e ensaiados, condizentes com uma empresa de US$ 2 trilhões em de valor de mercado.
Muito diferente da descontraída OpenAI, que ainda é vista pelas gigantes 'antigas' do Vale do Silício como uma startup barulhenta — mas que cada vez mais incomoda.