Correio Paulista: O Mistério se aprofunda à medida que uma superpoderosa IA aparece e depois desaparece

1 de mai. de 2024

O Mistério se aprofunda à medida que uma superpoderosa IA aparece e depois desaparece

TB, 01/05/2024

Entrando e Saindo

Os círculos de IA estavam agitados durante o fim de semana, depois que os usuários descobriram um novo modelo misterioso de IA no site LMSYS Chatbot Arena, que parece rivalizar com as capacidades de - ou talvez até mesmo superar em alguns aspectos, de acordo com alguns relatos entusiasmados – o GPT-4 da OpenAI.

Mas após apenas alguns dias de frenesi e testes frenéticos, o modelo de IA, conhecido apenas como "gpt2-chatbot", desapareceu na terça-feira. O LMSYS confirmou posteriormente no X antigo-Twitter que o modelo de IA foi retirado devido ao "tráfego inesperadamente alto".

Isso pouco pôde esfriar a especulação selvagem. Muitos acreditam que "gpt-2" seja uma prévia secreta antecipada do próximo modelo de uma grande empresa de IA como a OpenAI. Alimentando o hype, Sam Altman, CEO da startup apoiada pela Microsoft, postou enigmaticamente sobre o modelo misterioso na segunda-feira.

"Eu tenho um carinho por gpt2," Altman escreveu no X. (A OpenAI já lançou um modelo chamado GPT-2 em 2019, que foi impressionante na época, mas agora está consideravelmente ultrapassado em comparação com ofertas mais recentes.)

Não fica para trás

Após a janela limitada de testes, aqueles que tiveram acesso ao modelo de IA parecem concordar que suas capacidades são impressionantes, especialmente para algo que poderia ter sido criado fora das grandes empresas de IA.

Ethan Mollick, da Universidade da Pensilvânia, escreveu no X que "parece estar no mesmo nível de habilidade aproximado que o GPT-4," e depois sugeriu que poderia ser ainda melhor. Alguns pesquisadores de IA destacaram a capacidade do gpt2 de resolver problemas matemáticos difíceis, que ainda confundem outros modelos de IA líderes.

O que está em debate, no entanto, é se representa um avanço em relação aos atuais LLMs como o GPT-4.5 ou o Claude 3 Opus da Anthropic. Depois de realizar seus próprios testes, a Ars Technica concluiu que "seja lá o que for, provavelmente não é o GPT-5," o modelo muito rumorado da OpenAI.

Segredo Aberto

Este modelo é obra de alguma novata tentando se destacar no cenário mundial? Possivelmente. Mas se você adotar uma visão mais cínica, cheira a um golpe de marketing.

"Eu acho que pode muito bem ser uma prévia furtiva da OpenAI de algo," afirmou o aclamado programador e pesquisador de IA Simon Willison à Ars Technica.

Willison lamentou que, se fosse um golpe, iria contra o ethos "neutro" da plataforma onde apareceu: LMSYS, uma organização dedicada ao desenvolvimento aberto de grandes modelos de linguagem cuja "Arena de Chatbots" serve como um centro para avaliar e testar esses modelos. Em resposta à investigação de Willison, o LMSYS confirmou que havia "parceirizado com vários desenvolvedores de modelos" para trazer seus novos modelos para a plataforma no passado.

"Toda a situação é tão irritantemente representativa da pesquisa de LLM," disse Willison à Ars. "Um lançamento completamente não anunciado e opaco e agora toda a Internet está realizando 'checks de vibe' não científicos em paralelo."

Artigos recomendados: AGI e Modelos

Fonte:https://futurism.com/the-byte/mystery-powerful-ai-appears-then-disappears

Páginas

1 de mai. de 2024

O Mistério se aprofunda à medida que uma superpoderosa IA aparece e depois desaparece

Nenhum comentário:

Postar um comentário

Publicações recentes

Páginas

1 de mai. de 2024

O Mistério se aprofunda à medida que uma superpoderosa IA aparece e depois desaparece

Nenhum comentário:

Postar um comentário

Inscrever-se

Publicações recentes