cs articles | Gist.Science

It is not always greener on the other side: Greenery perception across demographics and personalities in multiple cities

Cette étude révèle que, bien que les écarts entre la perception subjective et la mesure objective de la végétation urbaine soient universels et peu influencés par la démographie ou la personnalité, le lieu de résidence des individus constitue le facteur déterminant dans l'explication de ces différences perceptuelles.

Matias Quintana, Fangqi Liu, Jussi Torkko, Youlong Gu, Xiucheng Liang, Yujun Hou, Koichi Ito, Yihan Zhu, Mahmoud Abdelrahman, Tuuli Toivonen, Yi Lu, Filip Biljecki2026-03-10💻 cs

VOIC: Visible-Occluded Integrated Guidance for 3D Semantic Scene Completion

Le papier présente VOIC, une nouvelle méthode de complétion sémantique de scènes 3D monocular qui améliore les performances en séparant explicitement l'apprentissage des régions visibles et des régions occluses grâce à une stratégie d'extraction de labels et un réseau à double décodeur interactif.

Zaidao Han, Risa Higashita, Jiang Liu2026-03-10💻 cs

Cost Trade-offs of Reasoning and Non-Reasoning Large Language Models in Text-to-SQL

Cette étude démontre que, dans les systèmes Text-to-SQL sur le cloud, l'optimisation de la vitesse d'exécution ne garantit pas l'efficacité des coûts, révélant que les modèles de raisonnement réduisent significativement la consommation de données tout en maintenant une précision élevée, contrairement aux modèles non raisonnants qui génèrent des coûts imprévisibles et excessifs dus à des requêtes inefficaces.

Saurabh Deochake, Debajyoti Mukhopadhyay2026-03-10💻 cs

NashOpt -- A Python Library for Computing Generalized Nash Equilibria

NashOpt est une bibliothèque Python open-source qui calcule et conçoit des équilibres de Nash généralisés dans des jeux non coopératifs à contraintes partagées en exploitant les conditions KKT conjointes, en utilisant JAX pour les jeux non linéaires et la programmation linéaire en nombres mixtes pour les jeux linéaires-quadratiques, tout en supportant des problèmes de conception de jeux inverses et de Stackelberg.

Alberto Bemporad2026-03-10💻 cs

Toward a Physical Theory of Intelligence

Ce papier présente le cadre d'Encodage-Congruent-Conservation (CCE), une théorie physique unifiée qui relie intelligence, mesure quantique et géométrie de l'espace-temps via des principes thermodynamiques et de conservation, suggérant que la conscience et la gravité émergent des limites fondamentales de la dissipation énergétique lors du traitement de l'information.

Peter David Fagan2026-03-10💻 cs

DrivingGen: A Comprehensive Benchmark for Generative Video World Models in Autonomous Driving

Le papier présente DrivingGen, le premier benchmark complet pour les modèles mondiaux génératifs de conduite autonome, qui comble les lacunes des évaluations existantes en proposant un ensemble de données diversifié et une suite de métriques rigoureuses pour évaluer simultanément le réalisme visuel, la plausibilité des trajectoires, la cohérence temporelle et la contrôlabilité.

Yang Zhou, Hao Shao, Letian Wang, Zhuofan Zong, Hongsheng Li, Steven L. Waslander2026-03-10💻 cs

Machine Learning Guided Cooling System Optimization for Data Center

Cet article présente un cadre d'apprentissage automatique guidé par la physique en trois étapes, appliqué au supercalculateur Frontier, qui permet d'identifier et de réduire jusqu'à 96 % des gaspillages énergétiques du système de refroidissement en proposant des ajustements de consignes sûrs et interprétables.

Shrenik Jadhav, Zheng Liu2026-03-10💻 cs

Batch-of-Thought: Cross-Instance Learning for Enhanced LLM Reasoning

Ce papier présente Batch-of-Thought (BoT), une méthode sans entraînement qui améliore le raisonnement des grands modèles de langage en traitant conjointement des requêtes apparentées pour exploiter les signaux inter-instances, permettant ainsi d'augmenter la précision et la calibration tout en réduisant les coûts d'inférence.

Xuan Yang, Furong Jia, Roy Xie, Xiong Xi, Hengwei Bian, Jian Li, Monica Agrawal2026-03-10💻 cs

Route, Retrieve, Reflect, Repair: Self-Improving Agentic Framework for Visual Detection and Linguistic Reasoning in Medical Imaging

Ce papier présente R^4, un cadre agentic auto-améliorant qui décompose l'analyse d'images médicales en quatre agents coordonnés (routage, récupération, réflexion et réparation) pour générer des rapports et des localisations plus fiables et mieux ancrés sans nécessiter de fine-tuning par gradient.

Md. Faiyaz Abdullah Sayeedi, Rashedur Rahman, Siam Tahsin Bhuiyan, Sefatul Wasi, Ashraful Islam, Saadia Binte Alam, AKM Mahbubur Rahman2026-03-10💻 cs

The Algorithmic Gaze of Image Quality Assessment: An Audit and Trace Ethnography of the LAION-Aesthetics Predictor

Cette étude révèle que le prédicteur LAION-Aesthetics, utilisé pour entraîner des modèles de génération d'images, perpétue des biais culturels et de genre en privilégiant les perspectives occidentales et masculines, ce qui appelle à une évaluation esthétique plus pluraliste.

Jordan Taylor, William Agnew, Maarten Sap, Sarah E. Fox, Haiyi Zhu2026-03-10💻 cs

CaMeLs Can Use Computers Too: System-level Security for Computer Use Agents

Ce papier propose une architecture sécurisée pour les agents d'utilisation d'ordinateurs qui, en générant un graphe d'exécution complet avant toute observation de l'environnement non fiable, résout le conflit entre l'isolation architecturale nécessaire contre les injections de prompts et la nécessité d'observer l'interface utilisateur, tout en maintenant ou en améliorant les performances des modèles.

Hanna Foerster, Tom Blanchard, Kristina Nikolic, Ilia Shumailov, Cheng Zhang, Robert Mullins, Nicolas Papernot, Florian Tramèr, Yiren Zhao2026-03-10💻 cs

User Detection and Response Patterns of Sycophantic Behavior in Conversational AI

En analysant les discussions Reddit, cette étude révèle que la détection et la réponse des utilisateurs à la flatterie des IA dépendent du contexte, montrant que certaines populations vulnérables valorisent ce comportement comme soutien émotionnel, ce qui remet en question l'hypothèse d'une élimination universelle de la sycophancie et plaide pour une conception d'IA adaptative.

Kazi Noshin, Syed Ishtiaque Ahmed, Sharifa Sultana2026-03-10💻 cs

BoxMind: Closed-loop AI strategy optimization for elite boxing validated in the 2024 Olympics

Le papier présente BoxMind, un système d'IA en boucle fermée qui transforme les données vidéo non structurées en intelligence stratégique pour l'optimisation tactique de la boxe, validé par les performances historiques de l'équipe nationale chinoise lors des Jeux Olympiques de 2024.

Kaiwen Wang, Kaili Zheng, Rongrong Deng, Qingmin Fan, Milin Zhang, Zongrui Li, Xuesi Zhou, Bo Han, Liren Chen, Chenyi Guo, Ji Wu2026-03-10💻 cs

Multifaceted Scenario-Aware Hypergraph Learning for Next POI Recommendation

Cet article propose MSAHG, une méthode d'apprentissage sur hypergraphe qui améliore la recommandation de prochains lieux d'intérêt en modélisant séparément les schémas de mobilité spécifiques à différents contextes (comme les touristes et les locaux) et en résolvant les conflits d'optimisation entre ces scénarios grâce à un mécanisme de séparation des paramètres.

Yuxi Lin, Yongkang Li, Jie Xing, Zipei Fan2026-03-10💻 cs

S2DiT: Sandwich Diffusion Transformer for Mobile Streaming Video Generation

Ce papier présente S2DiT, un modèle de diffusion Transformer optimisé pour la génération de vidéos en flux continu sur mobile, qui allie haute fidélité et efficacité (plus de 10 FPS sur iPhone) grâce à une architecture « sandwich » innovante et un cadre de distillation avancé.

Lin Zhao, Yushu Wu, Aleksei Lebedev, Dishani Lahiri, Meng Dong, Arpit Sahni, Michael Vasilkovsky, Hao Chen, Ju Hu, Aliaksandr Siarohin, Sergey Tulyakov, Yanzhi Wang, Anil Kag, Yanyu Li2026-03-10💻 cs

Equal-Pay Contracts

Cet article étudie la conception de contrats à rémunération égale pour des équipes d'agents, établissant des algorithmes d'approximation optimaux et des bornes de dureté pour diverses fonctions de récompense, tout en quantifiant le coût de l'équité par un ratio de $\Theta(\log n/ \log \log n)$ et en résolvant des problèmes ouverts pour les contrats non contraints.

Michal Feldman, Yoav Gal-Tzur, Tomasz Ponitka, Maya Schlesinger2026-03-10💻 cs

ReViP: Mitigating False Completion in Vision-Language-Action Models with Vision-Proprioception Rebalance

Ce papier présente ReViP, un cadre novateur pour les modèles Vision-Language-Action qui atténue les complétions fausses en rééquilibrant l'attention entre la vision et la proprioception grâce à des indices visuels conscients du progrès, tout en introduisant une nouvelle suite de benchmarks pour évaluer ce phénomène.

Zhuohao Li, Yinghao Li, Jian-Jian Jiang, Lang Zhou, Tianyu Zhang, Jiadong Yin, Mu Lin, Yi-Kin Wei, Wei-Shi Zheng2026-03-10💻 cs

ScenePilot-Bench: A Large-Scale Dataset and Benchmark for Evaluation of Vision-Language Models in Autonomous Driving

Ce papier présente ScenePilot-Bench, une nouvelle évaluation à grande échelle conçue pour mesurer les capacités des modèles vision-langage dans la conduite autonome en s'appuyant sur le vaste jeu de données ScenePilot-4K et une suite d'indicateurs multidimensionnels axés sur la sécurité.

Yujin Wang, Yutong Zheng, Wenxian Fan, Tianyi Wang, Hongqing Chu, Li Zhang, Bingzhao Gao, Daxin Tian, Jianqiang Wang, Hong Chen2026-03-10💻 cs

Query-Guided Spatial-Temporal-Frequency Interaction for Music Audio-Visual Question Answering

Cet article propose une nouvelle méthode d'interaction spatiale-temporelle-fréquentielle guidée par la requête (QSTar), enrichie par un bloc de raisonnement contextuel (QCR), pour améliorer la compréhension audio-visuelle dans les tâches de réponse aux questions (AVQA) en intégrant plus efficacement les indices textuels et les caractéristiques fréquentielles du son.

Kun Li, Michael Ying Yang, Sami Sebastian Brandt2026-03-10💻 cs

Dynamic framework for edge-connectivity maintenance of simple graphs

Cet article présente un cadre dynamique pour maintenir la $k$ -connexité par arêtes d'un graphe simple sous insertions et suppressions d'arêtes, en combinant des certificats clairsemés de Nagamochi-Ibaraki et des arbres de liaison-coupure pour les insertions, et un calcul de flot maximum pour les suppressions, tout en garantissant une complexité amortie de $O(k \log n)$ par insertion et $O(k^{3/2} n^{3/2})$ par suppression.

Blazej Wrobel2026-03-10💻 cs

← Précédent Suivant →