O especialista Matheus Ferreira, do Projeto Strawberry, fez um teste de 120 questões sobre cirurgia, clínica, ginecologia e pediatria
O novo modelo de inteligência artificial da OpenAI, chamado o1, obteve um desempenho impressionante em dois testes de alta complexidade, conforme noticiado pela Folha de S.Paulo no dia 17. Em um experimento simulado, a IA acertou 82% das questões da prova de residência da Faculdade de Medicina da USP, resultado que lhe garantiria acesso direto ao programa, caso fosse um candidato humano.
O teste, conduzido pelo especialista Matheus Ferreira, do Projeto Strawberry, envolveu 120 questões sobre disciplinas como cirurgia, clínica, ginecologia e pediatria. O o1 acertou 98 perguntas, mesmo sem a capacidade de analisar imagens, recurso que ainda não está disponível no modelo. Para comparação, o GPT-4, da mesma OpenAI, acertou 91 questões, apesar de poder interpretar imagens.
Em outro experimento, o o1 também se destacou na prova de matemática do Instituto Tecnológico de Aeronáutica (ITA), respondendo corretamente a todas as 10 perguntas enviadas, que incluíam temas como geometria e trigonometria. Segundo a OpenAI, a nova IA é seis vezes mais precisa que o GPT-4 na solução de problemas matemáticos.
Esses resultados posicionam o o1 como uma das tecnologias mais avançadas da atualidade, mostrando seu potencial em áreas que exigem elevado nível de conhecimento.
Comments