cs articles | Gist.Science

MM-CondChain: A Programmatically Verified Benchmark for Visually Grounded Deep Compositional Reasoning

Ce papier présente MM-CondChain, un nouveau benchmark vérifiable programmatically conçu pour évaluer la capacité des modèles de langage multimodaux à effectuer un raisonnement compositionnel profond et enchaîné basé sur des preuves visuelles, révélant ainsi des lacunes significatives des modèles actuels face à cette complexité.

Haozhan Shen, Shilin Yan, Hongwei Xue + 5 more2026-03-13💻 cs

EVATok: Adaptive Length Video Tokenization for Efficient Visual Autoregressive Generation

Ce papier présente EVATok, un cadre de tokenisation vidéo adaptative qui optimise dynamiquement l'assignation des tokens pour chaque séquence, permettant ainsi d'atteindre un meilleur compromis entre qualité de reconstruction et coût computationnel pour la génération vidéo autoregressive, tout en réduisant significativement l'utilisation des tokens par rapport aux méthodes existantes.

Tianwei Xiong, Jun Hao Liew, Zilong Huang + 3 more2026-03-13💻 cs

Keep Ballots Secret: On the Futility of Social Learning in Decision Making by Voting

Cet article démontre que, dans un cadre de prise de décision collective par vote binaire avec fusion L-sur-N, l'apprentissage social est inutile et que l'optimalité de la performance de l'équipe est atteinte lorsque les agents ignorent les décisions précédentes pour ne se fier qu'à leurs signaux privés, rendant ainsi le vote secret la stratégie optimale.

Joong Bum Rhim, Vivek K. Goyal2026-03-12💻 cs

Social Teaching: Being Informative vs. Being Right in Sequential Decision Making

Cette étude démontre que, dans un apprentissage social séquentiel bayésien, il est parfois optimal pour les agents d'utiliser des croyances a priori inexactes afin de maximiser l'information transmise aux agents suivants, créant ainsi un compromis entre la justesse de la décision immédiate et l'utilité de l'information pour le groupe.

Joong Bum Rhim, Vivek K Goyal2026-03-12💻 cs

Beyond Binomial and Negative Binomial: Adaptation in Bernoulli Parameter Estimation

Cet article propose un cadre basé sur un treillis pour optimiser l'allocation adaptative des essais dans l'estimation de paramètres de Bernoulli, démontrant par des simulations que cette approche améliore significativement la précision de l'estimation par rapport aux méthodes binomiales classiques, en particulier dans des scénarios d'imagerie active.

Safa C. Medin, John Murray-Bruce, David Castañón + 1 more2026-03-12💻 cs

In Pursuit of Many: A Review of Modern Multiple Object Tracking Systems

Ce document de synthèse examine les avancées récentes en matière de suivi multi-objets, en retraçant l'évolution des paradigmes algorithmiques, en analysant les tendances des benchmarks et des métriques d'évaluation, et en identifiant les orientations futures telles que l'intégration des modèles de fondation pour relever les défis du déploiement réel.

Mk Bashar, Samia Islam, Kashifa Kawaakib Hussain, Md. Bakhtiar Hasan, A. B. M. Ashikur Rahman, Md. Hasanul Kabir2026-03-12💻 cs

Homotopy type theory as a language for diagrams of $\infty$ -logoses

Cet article démontre que l'homotopie type theory étendue par des modalités lex et accessibles permet de reconstruire certains diagrammes d'∞-logoses, offrant ainsi un cadre pour raisonner sur ces structures et généralisant la computabilité synthétique de Sterling aux relations logiques de dimension supérieure.

Taichi Uemura2026-03-12💻 cs

An Overview about Emerging Technologies of Autonomous Driving

Cet article offre un aperçu des aspects techniques et des problèmes ouverts des technologies de conduite autonome, en examinant des domaines clés tels que la perception et la planification au sein d'une boucle de données fermée pour résoudre les défis à longue traîne.

Yu Huang, Yue Chen, Zijiang Yang2026-03-12💻 cs

MCQUIC - A Multicast Extension for QUIC

Ce papier présente MCQUIC, une extension du protocole QUIC qui permet une diffusion multicast sécurisée et vérifiable pour les événements en direct à grande échelle, tout en offrant une bascule automatique vers l'unicast pour garantir la fiabilité et la transparence vis-à-vis des applications.

Max Franke, Jake Holland, Stefan Schmid2026-03-12💻 cs

Evolution of funding for collaborative health research towards higher-level patient-oriented research. A comparison of the European Union Framework Programmes to the program funding by the United States National Institutes of Health

Cette étude compare l'évolution des financements de la recherche santé collaborative entre l'Union européenne et les États-Unis depuis 2008, révélant que si les programmes européens se sont nettement orientés vers la recherche translationnelle et les systèmes de santé, les publications scientifiques restent dominées par la recherche biomédicale fondamentale, mettant en lumière un décalage entre les attentes stratégiques des financeurs et les trajectoires réelles de la recherche.

David Fajardo-Ortiz, Bart Thijs, Wolfgang Glanzel, Karin R. Sipido2026-03-12💻 cs

Direct Access for Conjunctive Queries with Negations

Cet article généralise les résultats de tractabilité sur l'accès direct aux réponses des requêtes conjonctives en les étendant aux requêtes signées (contenant des atomes négatifs) grâce à une technique basée sur des circuits relationnels, permettant ainsi d'unifier et d'étendre les classes connues de requêtes traitables.

Florent Capelli, Nofar Carmeli, Oliver Irwin, Sylvain Salvati2026-03-12💻 cs

One is all you need: Second-order Unification without First-order Variables

Cet article introduit la unification du second ordre sans variables du premier ordre (SOGU), démontre que sa variante associative (ASOGU) est indécidable par réduction du dixième problème de Hilbert, et établit ainsi une nouvelle borne inférieure pour l'indécidabilité de la unification du second ordre.

David M. Cerna, Julian Parsert2026-03-12💻 cs

Derivatives on Graphs for the Positive Calculus of Relations with Transitive Closure

Les auteurs démontrent que la théorie équationnelle du calcul positif des relations avec fermeture transitive (PCoR*) est EXPSPACE-complète en concevant des dérivées sur les graphes qui permettent de décider cette théorie via une construction d'automates finis sur les décompositions de chemins.

Yoshiki Nakamura2026-03-12💻 cs

ChatSearch: a Dataset and a Generative Retrieval Model for General Conversational Image Retrieval

Cet article présente ChatSearch, un nouveau jeu de données et un modèle de génération nommé ChatSearcher, conçus pour améliorer la recherche d'images par conversation interactive en permettant au système de raisonner sur des contextes multimodaux et d'utiliser des connaissances du monde réel.

Zijia Zhao, Longteng Guo, Tongtian Yue + 5 more2026-03-12💻 cs

Forging the Unforgeable: On the Feasibility of Counterfeit Watermarks in Backdoor-Based Dataset Ownership Verification

Ce papier démontre que les schémas actuels de filigranes par porte dérobée pour la vérification de la propriété des jeux de données sont vulnérables à la contrefaçon, car un attaquant peut générer des filigranes forgés statistiquement indiscernables des originaux pour réfuter des accusations de violation du droit d'auteur.

Zhiying Li, Zhi Liu, Dongjie Liu, Shengda Zhuo, Guanggang Geng, Zhaoxin Fan, Shanxiang Lyu, Xiaobo Jin, Jian Weng2026-03-12💻 cs

Sketch-Guided Stylized Landscape Cinemagraph Synthesis

Le papier présente Sketch2Cinemagraph, un cadre de génération conditionnelle guidé par des croquis qui permet de synthétiser des cinégraphes de paysages stylisés avec un contrôle précis des flux spatiaux et temporels.

Hao Jin, Hengyuan Chang, Xiaoxuan Xie, Zhengyang Wang, Xusheng Du, Shaojun Hu, Haoran Xie2026-03-12💻 cs

vS-Graphs: Tightly Coupling Visual SLAM and 3D Scene Graphs Exploiting Hierarchical Scene Understanding

Le papier présente vS-Graphs, un cadre VSLAM en temps réel qui améliore la précision de la localisation et la richesse sémantique des cartes en intégrant une compréhension hiérarchique de la scène dans des graphes 3D optimisables, surpassant les méthodes de l'état de l'art de 15,22 % en moyenne.

Ali Tourani, Saad Ejaz, Hriday Bavle, Miguel Fernandez-Cortizas, David Morilla-Cabello, Jose Luis Sanchez-Lopez, Holger Voos2026-03-12💻 cs

PromCopilot: Simplifying Prometheus Metric Querying in Cloud Native Online Service Systems via Large Language Models

Cet article présente PromCopilot, un cadre basé sur les grands modèles de langage et les graphes de connaissances qui simplifie l'interrogation de Prometheus en traduisant le langage naturel en requêtes PromQL, et introduit le premier jeu de données de référence pour cette tâche.

Chenxi Zhang, Bicheng Zhang, Dingyu Yang, Xin Peng, Miao Chen, Senyu Xie, Gang Chen, Wei Bi, Wei Li2026-03-12💻 cs

Leveraging Spatial Context for Positive Pair Sampling in Histopathology Image Representation Learning

Cet article propose une stratégie d'échantillonnage de paires positives exploitant le contexte spatial des tissus pour améliorer l'apprentissage auto-supervisé en pathologie numérique, surpassant les méthodes d'augmentation synthétique traditionnelles sur plusieurs jeux de données.

Willmer Rafell Quinones Robles, Sakonporn Noree, Jongwoo Kim, Young Sin Ko, Bryan Wong, Mun Yong Yi2026-03-12💻 cs

Rethinking Two-Stage Referring-by-Tracking in Referring Multi-Object Tracking: Make it Strong Again

Cet article propose FlexHook, un nouveau cadre de suivi d'objets référé en deux étapes qui surpasse les méthodes actuelles de l'état de l'art en résolvant les limitations des constructions de caractéristiques heuristiques et de la modélisation fragile des correspondances grâce à une stratégie d'injection de repères conditionnés par le langage et à un décodeur de correspondance par paires.

Weize Li, Yunhao Du, Qixiang Yin, Zhicheng Zhao, Fei Su2026-03-12💻 cs

← Précédent Suivant →

cs