Each language version is independently generated for its own context, not a direct translation.
Imagine que você é um professor de física e, em vez de corrigir as provas dos seus alunos, você convida quatro "super-inteligências" de computador (Inteligências Artificiais) para fazerem a mesma prova. A pergunta é: elas conseguem pensar como um humano ou apenas "chutar" as respostas certas?
Este artigo científico é como um grande experimento de laboratório onde os autores testaram quatro IAs famosas (ChatGPT, Gemini, Claude e DeepSeek) em questões reais de física do ensino médio americano (os exames AP Physics), que vão de 2015 a 2025.
Aqui está o resumo da história, explicado de forma simples:
1. O Cenário: Uma Prova de Física "Real"
Os pesquisadores pegaram questões abertas (onde o aluno precisa escrever a resposta, não apenas marcar A, B, C ou D) que exigem cálculos, desenhos e explicações. Eles pediram para as IAs agirem como se fossem estudantes reais, sem ajuda extra. Depois, três professores de física experientes corrigiram as respostas das IAs usando a mesma régua que usariam para corrigir um aluno humano.
2. O Resultado Geral: Elas são "Boas Alunas", mas não "Geniais"
De modo geral, as IAs foram muito bem! Elas tiraram notas médias entre 82% e 92%.
- A Analogia: Imagine que você tem quatro alunos que conseguem resolver perfeitamente equações matemáticas e aplicar fórmulas. Se a prova fosse apenas "resolver X = Y", eles tirariam nota 10. Elas são ótimas em seguir regras e fazer contas.
3. O Grande Problema: A "Cegueira" Visual e Espacial
Aqui é onde a coisa fica interessante. As IAs falharam feio em tarefas que exigem ver e imaginar coisas no espaço 3D.
- O que elas erraram:
- Interpretar desenhos: Se o desenho mostrava um bloco escorregando em uma rampa, a IA às vezes não entendia a inclinação ou a direção do movimento. Era como se elas olhassem para um mapa e não soubessem para onde o norte aponta.
- Gráficos: Elas tinham dificuldade em ler números diretamente de um gráfico ou desenhar um gráfico correto. Era como pedir para alguém desenhar um gráfico de temperatura baseado em uma foto de um termômetro, e a IA desenhava algo totalmente fora da realidade.
- Regra da Mão Direita: Em física, usamos a mão direita para imaginar como campos magnéticos funcionam no espaço 3D. As IAs frequentemente "esqueciam" de usar a mão direita corretamente, confundindo para onde a força empurrava.
- Circuitos Elétricos: Elas se confundiam ao dizer se fios estavam ligados em série ou paralelo, como se não conseguissem "enxergar" o caminho da eletricidade.
4. Quem foi o melhor aluno?
- No Física 1 (Mecânica básica): Foi um empate técnico. As quatro IAs oscilavam muito. Em um ano, uma era a melhor; no ano seguinte, outra tomava o lugar. Não havia um "campeão" claro.
- No Física 2 (Tópicos mais avançados como eletricidade e óptica): Aqui, o Gemini e o DeepSeek se destacaram. Eles foram mais consistentes e tiraram notas melhores do que o Claude e o ChatGPT.
- A Analogia: Pense no ChatGPT como um aluno que às vezes acerta tudo por sorte, mas em outros dias esquece o caderno em casa (muito instável). Já o DeepSeek e o Gemini são como alunos que estudam todo dia e têm um desempenho mais estável, mesmo quando a prova é difícil.
5. O Veredito Final: O que aprendemos?
O estudo conclui que as IAs atuais são excelentes assistentes para cálculos e revisão de fórmulas, mas ainda não são substitutas para o raciocínio humano em situações complexas que exigem visualização.
- Para Professores: Podem usar as IAs para ajudar os alunos a praticar contas, mas devem alertar: "Não confie na IA para desenhar gráficos ou interpretar diagramas complexos, pois ela pode alucinar e inventar fatos."
- Para os Desenvolvedores de IA: O próximo passo não é fazer a IA calcular mais rápido, mas sim ensiná-la a "ver" melhor os desenhos e a entender o espaço 3D.
Em resumo: As IAs são como calculadoras superpoderosas que conseguem escrever textos lindos, mas ainda precisam de um professor humano para garantir que elas não estão "sonhando" com a física enquanto resolvem os problemas. Elas são ferramentas incríveis, mas ainda não são os mestres da matéria.