cs.CY artigos | Gist.Science

AI Misuse in Education Is a Measurement Problem: Toward a Learning Visibility Framework

Este artigo propõe o "Learning Visibility Framework" para redefinir o uso indevido de IA na educação não como um problema de detecção, mas como uma questão de medição, focando na transparência do processo de aprendizagem e na reconstrução de linhas do tempo multimodais para preservar a integridade acadêmica e a confiança entre estudantes e educadores.

Eduardo Davalos, Yike ZhangTue, 10 Ma💻 cs

Social Proof is in the Pudding: The (Non)-Impact of Social Proof on Software Downloads

Este estudo de campo no GitHub demonstra que a manipulação de métricas de prova social, como estrelas e downloads, não tem impacto mensurável nas baixas subsequentes de pacotes de software ou no engajamento dos desenvolvedores.

Lucas Shen, Gaurav SoodTue, 10 Ma💻 cs

Semantic Risk Scoring of Aggregated Metrics: An AI-Driven Approach for Healthcare Data Governance

Este artigo propõe um framework de IA modular que utiliza análise semântica e sintética de consultas SQL para atribuir pontuações de risco a métricas agregadas em instituições de saúde, permitindo a governança de dados proativa e a prevenção de violações de privacidade antes da execução das consultas.

Mohammed Omer Shakeel AhmedTue, 10 Ma🤖 cs.LG

Evaluating LLM-Based Grant Proposal Review via Structured Perturbations

Este artigo avalia a capacidade de modelos de linguagem (LLMs) de revisar propostas de financiamento do EPSRC através de perturbações estruturadas, descobrindo que a abordagem de análise seção por seção supera outras arquiteturas, embora os sistemas atuais ainda apresentem variabilidade significativa e priorizem a verificação de conformidade em detrimento de uma avaliação holística.

William Thorne, Joseph James, Yang Wang, Chenghua Lin, Diana MaynardTue, 10 Ma💬 cs.CL

Improving Fairness with Ensemble Combination: Margin-Dependent Bounds

Este artigo propõe uma nova métrica de qualidade de justiça chamada "risco discriminativo" e estabelece limites teóricos de margem-dependente que demonstram como a combinação de ensembles pode melhorar simultaneamente a justiça de grupo e individual, validando a eficácia do método através de técnicas de poda de ensembles e experimentos abrangentes.

Yijun BianThu, 12 Ma🤖 cs.LG

Personalizing explanations of AI-driven hints to users' characteristics: an empirical evaluation

Este estudo avalia empiricamente que personalizar as explicações de dicas geradas por IA em um Sistema de Tutoria Inteligente, adaptando-as a alunos com baixo Necessidade de Cognição e Baixo Conscienciosidade, aumenta sua interação com as explicações, compreensão e aprendizado, validando assim o valor da IA Explicável Personalizada na educação.

Vedant Bahel, Harshinee Sriram, Cristina ConatiThu, 12 Ma🤖 cs.AI

Shiksha Copilot: Teacher-AI Collaboration for Curating and Customizing Lesson Plans in Low-Resource Schools

Este estudo analisa o "Shiksha Copilot", uma ferramenta de IA implementada em escolas governamentais de Karnataka, Índia, que, ao facilitar a co-criação e personalização de planos de aula bilíngues por professores e curadores, demonstrou reduzir a carga burocrática e o estresse docente enquanto promove uma transição para pedagogias baseadas em atividades, apesar das limitações sistêmicas enfrentadas em ambientes de recursos escassos.

Deepak Varuvel Dennison, Bakhtawar Ahtisham, Kavyansh Chourasia, Nirmit Arora, Rahul Singh, Rene F. Kizilcec, Akshay Nambi, Tanuja Ganu, Aditya VashisthaThu, 12 Ma💻 cs

Recommender systems, representativeness, and online music: a psychosocial analysis of Italian listeners

Este estudo analisa as narrativas de ouvintes italianos sobre sistemas de recomendação musical, revelando que, embora reconheçam distinções culturais e linguísticas, eles carecem de compreensão crítica sobre o funcionamento dos algoritmos e têm consciência limitada das questões de representação de gênero, destacando a necessidade de integrar perspectivas psicossociais no design desses sistemas.

Lorenzo Porcaro, Chiara MonaldiThu, 12 Ma💻 cs

R v F (2025): Addressing the Defence of Hacking

Este artigo apresenta um estudo de caso pioneiro sobre o caso R v F (2025), demonstrando como investigadores de forense digital podem refutar a defesa de "hacking" (ou "SODDI") através de evidências empíricas para auxiliar o sistema de justiça criminal na distinção entre inocentes e culpados.

Junade AliThu, 12 Ma💻 cs

Intuition First or Reflection Before Judgment? The Impact of Evaluation Sequence on Consumer Ratings

Este estudo demonstra que a sequência de avaliação ("Avaliar Primeiro" versus "Escrever a Análise Primeiro") polariza as classificações dos consumidores, aumentando-as em serviços de alta qualidade e diminuindo-as em serviços de baixa qualidade, um efeito mediado por heurísticas afetivas e esforço cognitivo que é amplificado em produtos hedônicos e confirmado por dados reais de plataformas como Yelp e Letterboxd.

He Wang, Yueheng Wang, Ziyu Zhou, Hanxiang LiuThu, 12 Ma💻 cs

Empathy Is Not What Changed: Clinical Assessment of Psychological Safety Across GPT Model Generations

Este estudo clínico demonstra que a percepção de perda de empatia nos modelos GPT mais recentes não reflete uma queda real na empatia, mas sim uma mudança na postura de segurança que melhorou a detecção de crises enquanto reduziu a segurança dos conselhos, criando um trade-off crítico para usuários vulneráveis.

Michael Keeman, Anastasia KeemanThu, 12 Ma💬 cs.CL

Adaptive Engram Memory System for Indonesian Language Model: Generative AI Based on TOBA LM for Batak and Minang Language

Este estudo apresenta o TOBA-LM, um modelo de linguagem trilíngue baseado em GPT-2 que integra um mecanismo de Memória Engrama adaptativa para otimizar o processamento morfológico e reduzir drasticamente o tempo de treinamento ao lidar com as línguas indonésia, batak e minangkabau.

Hokky Situngkir, Kevin Siringoringo, Andhika Bernard LumbantobingThu, 12 Ma💬 cs.CL

Open Educational Resources: Barriers and Open Issues

Este artigo identifica e valida 26 barreiras sociais, econômicas e técnicas que impedem a adoção e o uso sustentado de Recursos Educacionais Abertos (REA), propondo um modelo conceitual e ações de mitigação para fomentar ecossistemas educacionais mais inclusivos e equitativos.

Pedro Henrique Dias Valle, Rafael Capilla, Vinicius dos Santos, Daniel Feitosa, Elisa Yumi NakagawaThu, 12 Ma💻 cs

$\mu$ Ed API: Towards A Shared API for EdTech Microservices

O artigo propõe o $\mu$ Ed, uma API padronizada e independente de plataforma para microserviços educacionais, que visa criar um ecossistema interoperável capaz de automatizar tarefas como feedback, avaliação e chatbots, superando as limitações de plataformas de aprendizado monolíticas.

Maximillan Sölch, Alexandra Neagu, Marcus Messer, Peter Johnson, Gerd Kortemeyer, Samuel S. H. Ng, Fun Siong Lim, Stephan KruscheThu, 12 Ma💻 cs

The coordination gap in frontier AI safety policies

O artigo argumenta que as políticas de segurança da IA de fronteira negligenciam a capacidade institucional de coordenar respostas quando a prevenção falha, propondo a adoção de mecanismos como pré-comprometimento e protocolos compartilhados, inspirados em regimes de segurança nuclear e preparação para pandemias, para preencher essa lacuna estrutural.

Isaak MengeshaThu, 12 Ma📈 econ

Assessing Cognitive Biases in LLMs for Judicial Decision Support: Virtuous Victim and Halo Effects

Este estudo avalia se modelos de linguagem de grande escala (LLMs) exibem vieses cognitivos humanos, como o efeito de vítima virtuosa e o efeito de halo, ao analisar seu impacto em decisões judiciais de sentença, descobrindo que, embora apresentem variações entre si e ainda não sejam adequados para uso judicial direto, demonstram melhorias modestas em relação a benchmarks humanos, com uma redução significativa no viés baseado em credenciais.

Sierra S. LiuThu, 12 Ma💻 cs

The science and practice of proportionality in AI risk evaluations

Este artigo examina como o princípio da proporcionalidade, exigido pela legislação da União Europeia, pode orientar o desenvolvimento de métodos científicos para calibrar as avaliações de riscos sistêmicos de modelos de IA de propósito geral, equilibrando a gestão eficaz de riscos com a inovação técnica sob o Regulamento de IA.

Carlos Mougan, Lauritz Morlock, Jair Aguirre, James R. M. Black, Jan Brauner, Simeon Campos, Sunishchal Dev, David Fernández Llorca, Alberto Franzin, Mario Fritz, Emilia Gómez, Friederike Grosse-Holz, Eloise Hamilton, Max Hasin, Jose Hernandez-Orallo, Dan Lahav, Luca Massarelli, Vasilios Mavroudis, Malcolm Murray, Patricia Paskov, Jaime Raldua, Wout SchellaertThu, 12 Ma💻 cs

DeliberationBench: A Normative Benchmark for the Influence of Large Language Models on Users' Views

O artigo apresenta o DeliberationBench, um benchmark normativo que avalia a influência de modelos de linguagem de grande escala (LLMs) nas opiniões dos usuários, demonstrando por meio de um experimento com milhares de participantes que esses modelos tendem a promover mudanças de opinião alinhadas com os padrões de legitimidade democrática e autonomia.

Luke Hewitt, Maximilian Kroner Dale, Paul de Font-ReaulxThu, 12 Ma💻 cs

Prompts and Prayers: the Rise of GPTheology

Este artigo examina o surgimento da "GPTheologia", um fenômeno em que a inteligência artificial é tratada como uma entidade divina ou oráculo, analisando como narrativas online e projetos práticos transformam a interação com IA em rituais religiosos e criam novos sistemas de crenças com profundas implicações éticas e sociotécnicas.

Ioana Cheres, Adrian Groza, Ioana Moldovan, Mick O'Hara, Connell VaughanThu, 12 Ma💻 cs

Dark Patterns and Consumer Protection Law for App Makers

Este artigo analisa como os padrões obscuros em aplicativos podem comprometer a autonomia do consumidor e gerar responsabilidade legal, propondo estratégias de design transparente para que desenvolvedores evitem infrações e construam confiança.

Gregory M. DickinsonThu, 12 Ma💻 cs

← Anterior Próximo →

cs.CY