Benchmarking Political Persuasion Risks Across Frontier Large Language Models

Este estudo avalia sete modelos de linguagem de ponta em dois experimentos com mais de 19 mil participantes, descobrindo que eles superam anúncios de campanha tradicionais em persuasão política, com o Claude apresentando o maior impacto e o Grok o menor, além de revelar que o uso de prompts baseados em informações afeta a eficácia persuasiva de forma dependente do modelo específico.

Zhongren Chen, Joshua Kalla, Quan LeWed, 11 Ma💬 cs.CL

Survey of Computerized Adaptive Testing: A Machine Learning Perspective

Este artigo apresenta uma revisão abrangente da Avaliação Adaptativa Computadorizada (CAT) sob uma perspectiva de aprendizado de máquina, explorando como técnicas modernas podem otimizar modelos de medição, seleção de questões e controle de testes para criar sistemas mais robustos, justos e eficientes.

Yan Zhuang, Qi Liu, Haoyang Bi, Zhenya Huang, Weizhe Huang, Jiatong Li, Junhao Yu, Zirui Liu, Zirui Hu, Yuting Hong, Zachary A. Pardos, Haiping Ma, Mengxiao Zhu, Shijin Wang, Enhong ChenTue, 10 Ma🤖 cs.LG

Estimating Item Difficulty Using Large Language Models and Tree-Based Machine Learning Algorithms

Este estudo demonstra que, embora a estimativa direta de dificuldade de itens educacionais por modelos de linguagem grandes (LLMs) seja promissora, a abordagem que combina a extração de características cognitivas e linguísticas via LLM com algoritmos de aprendizado de máquina baseados em árvores (como florestas aleatórias e gradient boosting) alcança maior precisão preditiva para itens de matemática e leitura do ensino fundamental, oferecendo um fluxo de trabalho eficiente para reduzir a dependência de testes de campo extensivos.

Pooya Razavi, Sonya PowersTue, 10 Ma🤖 cs.LG

SPOT: An Annotated French Corpus and Benchmark for Detecting Critical Interventions in Online Conversations

O artigo apresenta o SPOT, o primeiro corpus anotado em francês e benchmark para detectar "pontos de parada" (intervenções críticas sutis) em conversas online, demonstrando que modelos codificadores supervisionados superam grandes modelos de linguagem em tarefas de classificação de comentários em redes sociais.

Manon Berriche, Célia Nouri, Chloée Clavel, Jean-Philippe CointetTue, 10 Ma💬 cs.CL

XInsight: Integrative Stage-Consistent Psychological Counseling Support Agents for Digital Well-Being

O artigo apresenta o XInsight, um framework multiagente inspirado em aconselhamento psicológico que integra o paradigma de Exploração-Insight-Ação com um ciclo de Raciocínio-Intervenção-Reflexão para fornecer suporte digital estruturado e interpretável, validado por meio do novo benchmark XInsight-Bench.

Fei Wang, Jiangnan Yang, Junjie Chen, Yuxin Liu, Kun Li, Yanyan Wei, Dan Guo, Meng WangTue, 10 Ma🤖 cs.LG

The Potential for an Innovation Winter: Estimating Impact of Federal Research Reductions on Faculty Activity

O artigo utiliza modelagem estocástica e dados de universidades de pesquisa para prever que as reduções propostas de 40% no financiamento federal de pesquisa resultarão em um aumento significativo de instituições onde a maioria dos professores terá recursos insuficientes, ameaçando a qualidade dos programas de doutorado e a atividade científica nos campos de STEMM.

Robert A. BrownTue, 10 Ma🔬 physics

Causal Analysis of Author Demographics in Academic Peer Review

Este estudo emprega inferência causal para demonstrar que autores de grupos raciais minoritários, mulheres e instituições do Sul Global enfrentam desvantagens estatisticamente significativas nos rankings de aceitação de artigos acadêmicos, evidenciando a necessidade urgente de intervenções para mitigar vieses nos processos de revisão tradicionais e baseados em IA.

Uttamasha Anjally Oyshi, Gibson Nkhata, Susan GauchTue, 10 Ma💻 cs

Science Literacy: Generative AI as Enabler of Coherence in the Teaching, Learning, and Assessment of Scientific Knowledge and Reasoning

Este capítulo examina o potencial da inteligência artificial generativa para promover a coerência no ensino, aprendizagem e avaliação da alfabetização científica nos níveis K-16+, abordando seus benefícios, desafios e a arquitetura necessária para sua implementação.

Xiaoming Zhai, James W. Pellegrino, Matias Rojas, Jongchan Park, Matthew Nyaaba, Clayton Cohn, Gautam BiswasTue, 10 Ma💻 cs

SuperSkillsStack: Agency, Domain Knowledge, Imagination, and Taste in Human-AI Design Education

Este estudo analisa como estudantes de design integram a inteligência artificial generativa em seus projetos, revelando que, embora a ferramenta acelere fases iniciais como brainstorming e síntese, a colaboração eficaz depende fundamentalmente de competências humanas superiores — como agência, conhecimento de domínio, imaginação e bom gosto — para validar, refinar e selecionar soluções criativas.

Qian Huang, King Wang PoonTue, 10 Ma💻 cs

The Third Ambition: Artificial Intelligence and the Science of Human Behavior

Este artigo propõe uma terceira ambição para a inteligência artificial, posicionando os grandes modelos de linguagem como instrumentos científicos para estudar o comportamento humano, a cultura e o raciocínio moral ao analisar padrões de discurso coletivo, ao mesmo tempo em que delineia métodos metodológicos e advertências epistemológicas sobre o uso desses modelos na pesquisa social.

W. Russell Neuman, Chad ColemanTue, 10 Ma💬 cs.CL

Brexit Means Brexit: Selection Bias, Echo Chambers, and Entrenched Opinion on Reddit

Este estudo analisa a polarização política no subreddit r/Brexit do Reddit, revelando que a exposição a opiniões cruzadas é mínima e que a polarização é sustentada principalmente pela seleção de usuários já entranhados em suas posições e pela formação de câmaras de eco, em vez de ser atenuada por interações diversificadas.

Marian-Andrei Rizoiu, Duy Khuu, Andrew Law, Christine LargeronTue, 10 Ma💻 cs

Dual-Metric Evaluation of Social Bias in Large Language Models: Evidence from an Underrepresented Nepali Cultural Context

Este estudo avalia sistematicamente os vieses sociais em sete modelos de linguagem de última geração no contexto cultural nepalês, revelando que métricas de concordância explícita falham em capturar a tendência de geração implícita, a qual apresenta uma relação não linear com a temperatura e varia significativamente entre domínios como raça e gênero.

Ashish Pandey, Tek Raj ChhetriTue, 10 Ma💬 cs.CL

Governance of AI-Generated Content: A Case Study on Social Media Platforms

Este estudo analisa a governança de conteúdo gerado por IA em 40 plataformas de mídia social, constatando que a maioria foca apenas na moderação de violações e na divulgação da origem do conteúdo, enquanto sugere que stakeholders e formuladores de políticas desenvolvam estruturas mais abrangentes, diretas e orientadas para o futuro, incluindo ferramentas e educação para os usuários.

Lan Gao, Abani Ahmed, Oscar Chen, Margaux Reyl, Zayna Cheema, Nick Feamster, Chenhao Tan, Kurt Thomas, Marshini ChettyTue, 10 Ma💻 cs