cs.CY articles | Gist.Science

Towards Viewpoint-centric Artifact-based Regulatory Requirements Engineering for Compliance by Design

Cet article présente la synthèse et sollicite des retours sur le modèle d'artefacts pour l'ingénierie des exigences réglementaires (AM4RRE), conçu pour faciliter une intégration systématique de la conformité dès la conception dans le cycle de développement logiciel en surmontant les défis de coordination entre les différentes perspectives.

Oleksandr KosenkovWed, 11 Ma💻 cs

Benchmarking Political Persuasion Risks Across Frontier Large Language Models

Cette étude démontre que sept modèles de langage de pointe, en particulier Claude, surpassent les publicités politiques traditionnelles en matière de persuasion, tout en révélant que l'efficacité des stratégies de prompt dépend fortement du modèle spécifique utilisé.

Zhongren Chen, Joshua Kalla, Quan LeWed, 11 Ma💬 cs.CL

Survey of Computerized Adaptive Testing: A Machine Learning Perspective

Cet article propose une revue de la littérature sur les tests adaptatifs informatisés sous l'angle de l'apprentissage automatique, en examinant comment ces techniques peuvent optimiser les modèles de mesure, la sélection des questions et le contrôle des tests pour créer des systèmes d'évaluation plus robustes, équitables et efficaces.

Yan Zhuang, Qi Liu, Haoyang Bi, Zhenya Huang, Weizhe Huang, Jiatong Li, Junhao Yu, Zirui Liu, Zirui Hu, Yuting Hong, Zachary A. Pardos, Haiping Ma, Mengxiao Zhu, Shijin Wang, Enhong ChenTue, 10 Ma🤖 cs.LG

Life Histories of Taboo Knowledge Artifacts

Cette étude mixte examine comment les articles Wikipédia sur des sujets tabous émergent et se maintiennent grâce à des styles collaboratifs variés, un leadership résilient et une gouvernance émergente, malgré les conflits inhérents à ces thèmes.

Kaylea Champion, Benjamin Mako HillTue, 10 Ma💻 cs

Llama-Mob: Instruction-Tuning Llama-3-8B Excels in City-Scale Mobility Prediction

L'article présente Llama-Mob, un modèle de langage Llama-3-8B affiné par instruction qui surpasse les méthodes existantes pour la prédiction de la mobilité humaine à long terme à l'échelle d'une ville et démontre une forte capacité de généralisation zéro-shot.

Peizhi Tang, Chuang Yang, Tong Xing, Xiaohang Xu, Jiayi Xu, Renhe Jiang, Kaoru SezakiTue, 10 Ma💬 cs.CL

MediTools -- Medical Education Powered by LLMs

Ce projet présente MediTools, une application prototype exploitant les grands modèles de langage pour révolutionner l'éducation médicale via des simulations cliniques interactives, l'analyse assistée d'articles de recherche et des résumés d'actualités, dont l'efficacité est évaluée par une enquête auprès de professionnels et d'étudiants.

Amr Alshatnawi, Remi Sampaleanu, David LiebovitzTue, 10 Ma💻 cs

Estimating Item Difficulty Using Large Language Models and Tree-Based Machine Learning Algorithms

Cette étude démontre que l'extraction de caractéristiques linguistiques et cognitives par des modèles de langage de grande taille (LLM) pour alimenter des algorithmes d'apprentissage automatique en arbre permet de prédire la difficulté des items d'évaluation avec une précision supérieure à celle des estimations directes par LLM, offrant ainsi une alternative efficace aux tests de terrain coûteux.

Pooya Razavi, Sonya PowersTue, 10 Ma🤖 cs.LG

SPOT: An Annotated French Corpus and Benchmark for Detecting Critical Interventions in Online Conversations

Cet article présente SPOT, le premier corpus annoté et benchmark en français permettant d'identifier les « points d'arrêt » dans les conversations en ligne, et démontre que les modèles encodeurs finement ajustés surpassent les grands modèles de langage pour cette tâche de détection de critiques subtiles.

Manon Berriche, Célia Nouri, Chloée Clavel, Jean-Philippe CointetTue, 10 Ma💬 cs.CL

XInsight: Integrative Stage-Consistent Psychological Counseling Support Agents for Digital Well-Being

Ce papier présente XInsight, un cadre multi-agents inspiré par le counseling qui structure le soutien psychologique selon le paradigme « Exploration-Insight-Action » pour améliorer l'interprétabilité, la continuité et l'efficacité des applications de bien-être numérique, validé par une nouvelle plateforme d'évaluation appelée XInsight-Bench.

Fei Wang, Jiangnan Yang, Junjie Chen, Yuxin Liu, Kun Li, Yanyan Wei, Dan Guo, Meng WangTue, 10 Ma🤖 cs.LG

Evaluating AI-Enabled deception vulnerability amongst Sub-Saharan-Africa migrants

Cette étude évalue la vulnérabilité des migrants d'Afrique subsaharienne face aux arnaques alimentées par l'intelligence artificielle et révèle que l'exposition antérieure au ciblage est le principal facteur de risque, tandis que la confiance dans la détection du contenu IA et les efforts de vérification comportementale agissent comme des facteurs protecteurs significatifs.

Deborah OluwasanyaTue, 10 Ma💻 cs

Building the ethical AI framework of the future: from philosophy to practice

Cet article propose une architecture de contrôle éthique par conception intégrant des raisonnements normatifs dans un système à triple portail (métrique, gouvernance et écologique) pour opérationnaliser la gouvernance de l'IA tout au long de son cycle de vie, en alignement avec des cadres réglementaires comme l'Acte sur l'IA de l'UE et le cadre de gestion des risques du NIST.

Jasper Kyle CatapangTue, 10 Ma💻 cs

A Novel Approach for Testing Water Safety Using Deep Learning Inference of Microscopic Images of Unincubated Water Samples

Ce papier présente DeepScope, une solution innovante basée sur l'apprentissage profond qui analyse instantanément des images microscopiques d'échantillons d'eau non incubés pour détecter la contamination fécale avec une précision de 93 % et un coût réduit à 0,44 $ par test, surpassant ainsi les exigences de l'UNICEF.

Sanjay SrinivasanTue, 10 Ma🤖 cs.LG

The Potential for an Innovation Winter: Estimating Impact of Federal Research Reductions on Faculty Activity

Cette étude modélise l'impact potentiel des réductions proposées par l'administration Trump sur le financement de la recherche fédérale en 2026, prévoyant que cela entraînerait une augmentation significative du nombre d'universités de recherche où plus de la moitié des professeurs disposeraient de ressources insuffisantes, menaçant ainsi la viabilité des programmes doctoraux et de la recherche de qualité aux États-Unis.

Robert A. BrownTue, 10 Ma🔬 physics

Causal Analysis of Author Demographics in Academic Peer Review

Cette étude utilise l'inférence causale pour démontrer que les auteurs issus de groupes raciaux minoritaires, les femmes et ceux affiliés à des institutions du Sud global subissent des désavantages statistiques significatifs dans les processus d'évaluation par les pairs, soulignant ainsi la nécessité urgente d'interventions pour garantir l'équité dans les revues académiques traditionnelles et celles assistées par l'intelligence artificielle.

Uttamasha Anjally Oyshi, Gibson Nkhata, Susan GauchTue, 10 Ma💻 cs

Science Literacy: Generative AI as Enabler of Coherence in the Teaching, Learning, and Assessment of Scientific Knowledge and Reasoning

Ce chapitre examine comment l'intelligence artificielle générative peut servir d'outil de cohérence pour améliorer l'alphabétisation scientifique dans les programmes K-16+, en définissant les nouveaux enjeux, en proposant une architecture technique pour intégrer l'IA dans l'enseignement et l'évaluation, et en identifiant les défis de recherche et de développement nécessaires.

Xiaoming Zhai, James W. Pellegrino, Matias Rojas, Jongchan Park, Matthew Nyaaba, Clayton Cohn, Gautam BiswasTue, 10 Ma💻 cs

SuperSkillsStack: Agency, Domain Knowledge, Imagination, and Taste in Human-AI Design Education

Cette étude montre que, dans l'éducation au design, l'intelligence artificielle générative agit principalement comme un accélérateur cognitif utilisé aux étapes initiales, tandis que les compétences humaines fondamentales (agence, connaissances disciplinaires, imagination et goût) restent indispensables pour interpréter, valider et affiner les solutions créatives.

Qian Huang, King Wang PoonTue, 10 Ma💻 cs

The Third Ambition: Artificial Intelligence and the Science of Human Behavior

Cet article propose une troisième ambition pour la recherche en intelligence artificielle, consistant à utiliser les grands modèles de langage comme instruments scientifiques pour étudier le comportement humain, la culture et le raisonnement moral en exploitant les régularités symboliques qu'ils ont apprises, tout en clarifiant leurs limites épistémiques et en adaptant les méthodologies des sciences sociales à cette nouvelle échelle.

W. Russell Neuman, Chad ColemanTue, 10 Ma💬 cs.CL

Brexit Means Brexit: Selection Bias, Echo Chambers, and Entrenched Opinion on Reddit

En analysant les dynamiques de polarisation sur le subreddit r/Brexit, cette étude démontre que les opinions y sont renforcées par la sélection de survivants et les chambres d'écho, plutôt que par l'exposition à des points de vue divergents.

Marian-Andrei Rizoiu, Duy Khuu, Andrew Law, Christine LargeronTue, 10 Ma💻 cs

Dual-Metric Evaluation of Social Bias in Large Language Models: Evidence from an Underrepresented Nepali Cultural Context

Cette étude évalue les biais sociaux de sept grands modèles de langage dans le contexte culturel népalais sous-représenté, révélant que les biais implicites de génération, qui suivent une relation en U avec la température, sont mal capturés par les métriques d'accord explicite et varient selon les domaines culturels.

Ashish Pandey, Tek Raj ChhetriTue, 10 Ma💬 cs.CL

Governance of AI-Generated Content: A Case Study on Social Media Platforms

Cette étude examine les cadres de gouvernance de 40 plateformes de médias sociaux face à la prolifération du contenu généré par l'IA, révélant que la majorité se concentre sur la modération des violations et la divulgation, tandis que les questions de propriété et de monétisation sont moins abordées, ce qui appelle à des politiques plus complètes et à des outils éducatifs pour les utilisateurs.

Lan Gao, Abani Ahmed, Oscar Chen, Margaux Reyl, Zayna Cheema, Nick Feamster, Chenhao Tan, Kurt Thomas, Marshini ChettyTue, 10 Ma💻 cs

← Précédent Suivant →