StarWhisper Telescope: An AI framework for automating end-to-end astronomical observations

Le système StarWhisper Telescope est un cadre d'agents intelligents qui automatise l'ensemble du processus d'observation astronomique, de la planification à l'analyse des données et au déclenchement de suivis, démontrant son efficacité sur un réseau de télescopes amateurs et offrant une architecture évolutive pour les futurs grands projets astronomiques.

Cunshi Wang, Yu Zhang, Yuyang Li + 25 more2026-03-04🔭 astro-ph

Evaluating Spoken Language as a Biomarker for Automated Screening of Cognitive Impairment

Cette étude démontre que l'utilisation de modèles d'apprentissage automatique interprétables sur des biomarqueurs linguistiques permet un dépistage automatisé et une stratification des risques de troubles neurocognitifs, offrant ainsi une solution évolutive et non invasive pour le suivi de la santé cognitive à domicile.

Maria R. Lima, Alexander Capstick, Fatemeh Geranmayeh + 4 more2026-03-04💬 cs.CL

Talk to Your Slides: High-Efficiency Slide Editing via Language-Driven Structured Data Manipulation

Ce papier présente Talk-to-Your-Slides, un agent d'édition de diapositives haute efficacité qui, contrairement aux approches visuelles coûteuses, manipule directement les données structurées via le langage pour offrir une précision accrue, une fidélité aux instructions améliorée et des coûts réduits, le tout validé par le nouveau benchmark TSBench.

Kyudan Jung, Hojun Cho, Jooyeol Yun + 3 more2026-03-04💬 cs.CL

REFLEX: Metacognitive Reasoning for Reflective Zero-Shot Robotic Planning with Large Language Models

Le papier présente REFLEX, un cadre intégrant l'apprentissage métacognitif dans les modèles de langage pour permettre à des agents robotiques de décomposer les compétences, de réfléchir sur leurs échecs et de générer de nouvelles solutions créatives en situation zéro-shot, surpassant ainsi les méthodes existantes.

Wenjie Lin, Jin Wei-Kocsis, Jiansong Zhang + 4 more2026-03-04💬 cs.CL

BitBypass: A New Direction in Jailbreaking Aligned Large Language Models with Bitstream Camouflage

Ce papier présente BitBypass, une nouvelle attaque de contournement en boîte noire qui exploite le camouflage de flux de bits pour contourner les mécanismes de sécurité des grands modèles de langage alignés et les amener à générer du contenu nuisible, surpassant ainsi les méthodes d'attaque existantes en termes de furtivité et de taux de réussite.

Kalyan Nakka, Nitesh Saxena2026-03-04💬 cs.CL

HSSBench: Benchmarking Humanities and Social Sciences Ability for Multimodal Large Language Models

Cet article présente HSSBench, un benchmark multilingue de plus de 13 000 échantillons conçu pour évaluer et stimuler les capacités de raisonnement interdisciplinaire des modèles de langage multimodaux dans le domaine des sciences humaines et sociales, comblant ainsi une lacune majeure des évaluations actuelles axées sur les STEM.

Zhaolu Kang, Junhao Gong, Jiaxu Yan + 15 more2026-03-04🤖 cs.AI

Search Arena: Analyzing Search-Augmented LLMs

Ce travail présente Search Arena, un jeu de données à grande échelle et crowdsourcé de plus de 24 000 interactions multi-tours avec des modèles de langage augmentés par la recherche, qui révèle les biais des utilisateurs envers les citations et les sources, tout en démontrant que l'intégration de la recherche web améliore les performances sans les dégrader dans des contextes non dédiés.

Mihran Miroyan, Tsung-Han Wu, Logan King + 8 more2026-03-04💬 cs.CL