cs.CY artigos | Gist.Science

Towards Viewpoint-centric Artifact-based Regulatory Requirements Engineering for Compliance by Design

Este artigo relata a síntese e busca feedback sobre o Modelo de Artefatos para Engenharia de Requisitos Regulatórios (AM4RRE), uma abordagem proposta para integrar a conformidade por projeto ao ciclo de vida de desenvolvimento de software, superando os desafios de coordenação entre múltiplas perspectivas e a falta de processos sistemáticos na indústria.

Oleksandr KosenkovWed, 11 Ma💻 cs

Benchmarking Political Persuasion Risks Across Frontier Large Language Models

Este estudo avalia sete modelos de linguagem de ponta em dois experimentos com mais de 19 mil participantes, descobrindo que eles superam anúncios de campanha tradicionais em persuasão política, com o Claude apresentando o maior impacto e o Grok o menor, além de revelar que o uso de prompts baseados em informações afeta a eficácia persuasiva de forma dependente do modelo específico.

Zhongren Chen, Joshua Kalla, Quan LeWed, 11 Ma💬 cs.CL

Survey of Computerized Adaptive Testing: A Machine Learning Perspective

Este artigo apresenta uma revisão abrangente da Avaliação Adaptativa Computadorizada (CAT) sob uma perspectiva de aprendizado de máquina, explorando como técnicas modernas podem otimizar modelos de medição, seleção de questões e controle de testes para criar sistemas mais robustos, justos e eficientes.

Yan Zhuang, Qi Liu, Haoyang Bi, Zhenya Huang, Weizhe Huang, Jiatong Li, Junhao Yu, Zirui Liu, Zirui Hu, Yuting Hong, Zachary A. Pardos, Haiping Ma, Mengxiao Zhu, Shijin Wang, Enhong ChenTue, 10 Ma🤖 cs.LG

Life Histories of Taboo Knowledge Artifacts

Este estudo misto analisa a criação e sustentação de artigos sobre temas tabu na Wikipedia, identificando seis temas que revelam como a liderança resiliente, o engajamento organizacional e a governança emergente permitem a construção de conhecimento público sob condições de conflito e anonimato.

Kaylea Champion, Benjamin Mako HillTue, 10 Ma💻 cs

Llama-Mob: Instruction-Tuning Llama-3-8B Excels in City-Scale Mobility Prediction

O artigo apresenta o Llama-Mob, um modelo de linguagem grande (Llama-3-8B) ajustado via instrução que supera os métodos atuais na previsão de mobilidade humana em larga escala e a longo prazo, demonstrando também notáveis capacidades de generalização zero-shot entre diferentes cidades.

Peizhi Tang, Chuang Yang, Tong Xing, Xiaohang Xu, Jiayi Xu, Renhe Jiang, Kaoru SezakiTue, 10 Ma💬 cs.CL

MediTools -- Medical Education Powered by LLMs

O projeto MediTools apresenta uma aplicação baseada em modelos de linguagem (LLMs) que revoluciona a educação médica através de ferramentas interativas para simulação de casos clínicos, análise de literatura científica e resumo de notícias, validando seu potencial por meio de pesquisas com profissionais e estudantes da área.

Amr Alshatnawi, Remi Sampaleanu, David LiebovitzTue, 10 Ma💻 cs

Estimating Item Difficulty Using Large Language Models and Tree-Based Machine Learning Algorithms

Este estudo demonstra que, embora a estimativa direta de dificuldade de itens educacionais por modelos de linguagem grandes (LLMs) seja promissora, a abordagem que combina a extração de características cognitivas e linguísticas via LLM com algoritmos de aprendizado de máquina baseados em árvores (como florestas aleatórias e gradient boosting) alcança maior precisão preditiva para itens de matemática e leitura do ensino fundamental, oferecendo um fluxo de trabalho eficiente para reduzir a dependência de testes de campo extensivos.

Pooya Razavi, Sonya PowersTue, 10 Ma🤖 cs.LG

SPOT: An Annotated French Corpus and Benchmark for Detecting Critical Interventions in Online Conversations

O artigo apresenta o SPOT, o primeiro corpus anotado em francês e benchmark para detectar "pontos de parada" (intervenções críticas sutis) em conversas online, demonstrando que modelos codificadores supervisionados superam grandes modelos de linguagem em tarefas de classificação de comentários em redes sociais.

Manon Berriche, Célia Nouri, Chloée Clavel, Jean-Philippe CointetTue, 10 Ma💬 cs.CL

XInsight: Integrative Stage-Consistent Psychological Counseling Support Agents for Digital Well-Being

O artigo apresenta o XInsight, um framework multiagente inspirado em aconselhamento psicológico que integra o paradigma de Exploração-Insight-Ação com um ciclo de Raciocínio-Intervenção-Reflexão para fornecer suporte digital estruturado e interpretável, validado por meio do novo benchmark XInsight-Bench.

Fei Wang, Jiangnan Yang, Junjie Chen, Yuxin Liu, Kun Li, Yanyan Wei, Dan Guo, Meng WangTue, 10 Ma🤖 cs.LG

Evaluating AI-Enabled deception vulnerability amongst Sub-Saharan-Africa migrants

Este estudo avalia a vulnerabilidade de migrantes da África Subsaariana à fraude impulsionada por IA, concluindo que a exposição prévia a alvos é o principal fator de risco, enquanto a confiança na identificação de conteúdo gerado por IA e o esforço comportamental de verificação atuam como fatores protetores significativos.

Deborah OluwasanyaTue, 10 Ma💻 cs

Building the ethical AI framework of the future: from philosophy to practice

Este artigo apresenta uma arquitetura de controle de ética por design que integra raciocínios éticos em mecanismos de aplicação ao longo do ciclo de vida da IA, utilizando uma estrutura de três portões (métricos, de governança e ecológicos) para traduzir compromissos normativos em controles operacionais testáveis e integráveis aos pipelines de MLOps.

Jasper Kyle CatapangTue, 10 Ma💻 cs

A Novel Approach for Testing Water Safety Using Deep Learning Inference of Microscopic Images of Unincubated Water Samples

O artigo apresenta o DeepScope, uma solução baseada em aprendizado profundo que analisa imagens microscópicas de amostras de água não incubadas para detectar contaminação fecal em segundos com custo de US$ 0,44 e alta precisão, superando os requisitos da UNICEF e eliminando a necessidade de longos períodos de incubação.

Sanjay SrinivasanTue, 10 Ma🤖 cs.LG

The Potential for an Innovation Winter: Estimating Impact of Federal Research Reductions on Faculty Activity

O artigo utiliza modelagem estocástica e dados de universidades de pesquisa para prever que as reduções propostas de 40% no financiamento federal de pesquisa resultarão em um aumento significativo de instituições onde a maioria dos professores terá recursos insuficientes, ameaçando a qualidade dos programas de doutorado e a atividade científica nos campos de STEMM.

Robert A. BrownTue, 10 Ma🔬 physics

Causal Analysis of Author Demographics in Academic Peer Review

Este estudo emprega inferência causal para demonstrar que autores de grupos raciais minoritários, mulheres e instituições do Sul Global enfrentam desvantagens estatisticamente significativas nos rankings de aceitação de artigos acadêmicos, evidenciando a necessidade urgente de intervenções para mitigar vieses nos processos de revisão tradicionais e baseados em IA.

Uttamasha Anjally Oyshi, Gibson Nkhata, Susan GauchTue, 10 Ma💻 cs

Science Literacy: Generative AI as Enabler of Coherence in the Teaching, Learning, and Assessment of Scientific Knowledge and Reasoning

Este capítulo examina o potencial da inteligência artificial generativa para promover a coerência no ensino, aprendizagem e avaliação da alfabetização científica nos níveis K-16+, abordando seus benefícios, desafios e a arquitetura necessária para sua implementação.

Xiaoming Zhai, James W. Pellegrino, Matias Rojas, Jongchan Park, Matthew Nyaaba, Clayton Cohn, Gautam BiswasTue, 10 Ma💻 cs

SuperSkillsStack: Agency, Domain Knowledge, Imagination, and Taste in Human-AI Design Education

Este estudo analisa como estudantes de design integram a inteligência artificial generativa em seus projetos, revelando que, embora a ferramenta acelere fases iniciais como brainstorming e síntese, a colaboração eficaz depende fundamentalmente de competências humanas superiores — como agência, conhecimento de domínio, imaginação e bom gosto — para validar, refinar e selecionar soluções criativas.

Qian Huang, King Wang PoonTue, 10 Ma💻 cs

The Third Ambition: Artificial Intelligence and the Science of Human Behavior

Este artigo propõe uma terceira ambição para a inteligência artificial, posicionando os grandes modelos de linguagem como instrumentos científicos para estudar o comportamento humano, a cultura e o raciocínio moral ao analisar padrões de discurso coletivo, ao mesmo tempo em que delineia métodos metodológicos e advertências epistemológicas sobre o uso desses modelos na pesquisa social.

W. Russell Neuman, Chad ColemanTue, 10 Ma💬 cs.CL

Brexit Means Brexit: Selection Bias, Echo Chambers, and Entrenched Opinion on Reddit

Este estudo analisa a polarização política no subreddit r/Brexit do Reddit, revelando que a exposição a opiniões cruzadas é mínima e que a polarização é sustentada principalmente pela seleção de usuários já entranhados em suas posições e pela formação de câmaras de eco, em vez de ser atenuada por interações diversificadas.

Marian-Andrei Rizoiu, Duy Khuu, Andrew Law, Christine LargeronTue, 10 Ma💻 cs

Dual-Metric Evaluation of Social Bias in Large Language Models: Evidence from an Underrepresented Nepali Cultural Context

Este estudo avalia sistematicamente os vieses sociais em sete modelos de linguagem de última geração no contexto cultural nepalês, revelando que métricas de concordância explícita falham em capturar a tendência de geração implícita, a qual apresenta uma relação não linear com a temperatura e varia significativamente entre domínios como raça e gênero.

Ashish Pandey, Tek Raj ChhetriTue, 10 Ma💬 cs.CL

Governance of AI-Generated Content: A Case Study on Social Media Platforms

Este estudo analisa a governança de conteúdo gerado por IA em 40 plataformas de mídia social, constatando que a maioria foca apenas na moderação de violações e na divulgação da origem do conteúdo, enquanto sugere que stakeholders e formuladores de políticas desenvolvam estruturas mais abrangentes, diretas e orientadas para o futuro, incluindo ferramentas e educação para os usuários.

Lan Gao, Abani Ahmed, Oscar Chen, Margaux Reyl, Zayna Cheema, Nick Feamster, Chenhao Tan, Kurt Thomas, Marshini ChettyTue, 10 Ma💻 cs

← Anterior Próximo →