Self-Supervised Multi-Modal World Model with 4D Space-Time Embedding

Deze paper introduceert DeepEarth, een zelftoezichtend multi-modale wereldmodel dat gebruikmaakt van de innovatieve Earth4D-encoder voor sub-meter en sub-seconde precisie in planetaire ruimtetijd, en dat hiermee state-of-the-art resultaten behaalt op ecologische voorspellingsbeproevingen.

Lance Legel, Qin Huang, Brandon Voelker, Daniel Neamati, Patrick Alan Johnson, Favyen Bastani, Jeff Rose, James Ryan Hennessy, Robert Guralnick, Douglas Soltis, Pamela Soltis, Shaowen Wang2026-03-10💻 cs

Looking Back and Forth: Cross-Image Attention Calibration and Attentive Preference Learning for Multi-Image Hallucination Mitigation

Dit paper introduceert CAPL, een framework dat hallucinaties in multi-image taken van grote vision-language modellen aanpakt door cross-image attentie te kalibreren en voorkeurslering toe te passen om de interactie tussen afbeeldingen te verbeteren en de afhankelijkheid van tekstuele priors te verminderen.

Xiaochen Yang, Hao Fang, Jiawei Kong, Yaoxin Mao, Bin Chen, Shu-Tao Xia2026-03-10💻 cs

Animating Petascale Time-varying Data on Commodity Hardware with LLM-assisted Scripting

Dit artikel introduceert een gebruiksvriendelijk framework dat wetenschappers in staat stelt om met behulp van LLM-gestuurde scripting en een geoptimaliseerde rendering-systeem complexe petascale tijd-variërende data, zoals NASA-klimaatmodellen, op een standaardwerkplek om te zetten in 3D-animaties binnen een zeer korte doorlooptijd.

Ishrat Jahan Eliza, Xuan Huang, Aashish Panta, Alper Sahistan, Zhimin Li, Amy A. Gooch, Valerio Pascucci2026-03-10💻 cs

CoTJudger: A Graph-Driven Framework for Automatic Evaluation of Chain-of-Thought Efficiency and Redundancy in LRMs

Dit paper introduceert CoTJudger, een grafgebaseerd framework dat de efficiëntie van Chain-of-Thought-resoneren in Large Reasoning Models kwantificeert door het onderscheid te maken tussen essentiële logica en structurele redundantie via het extraheren van de kortste effectieve paden.

Siyi Li, Jiajun Shi, Shiwen Ni, Ge Zhang, Shuaimin Li, Shijian Wang, Zhoufutu Wen, Yizhi Li, Hamid Alinejad-Rokny, Jiaheng Liu, Min Yang, Wenhao Huang2026-03-10💬 cs.CL

Grounding Machine Creativity in Game Design Knowledge Representations: Empirical Probing of LLM-Based Executable Synthesis of Goal Playable Patterns under Structural Constraints

Dit onderzoek onderzoekt of grote taalmodellen (LLMs) onder strikte Unity-engine-structuurbeperkingen speelbare spelpatronen kunnen genereren, en concludeert dat hoewel menselijke tussenliggende representaties helpen, structurele 'grounding'-fouten de huidige schaalbaarheid van deze creatieve synthese beperken.

Hugh Xuechen Liu, Kıvanç Tatar2026-03-10💻 cs

Vision Language Models Cannot Reason About Physical Transformation

De studie ConservationBench onthult dat Vision Language Models systematisch falen in het redeneren over fysieke transformaties en het behoud van eigenschappen, omdat hun prestaties dicht bij het toeval blijven en zelfs verslechteren wanneer visuele informatie wordt toegevoegd ondanks sterke tekstuele vooroordelen.

Dezhi Luo, Yijiang Li, Maijunxian Wang, Tianwei Zhao, Bingyang Wang, Siheng Wang, Pinyuan Feng, Pooyan Rahmanzadehgervi, Ziqiao Ma, Hokin Deng2026-03-10💻 cs

Enhancing Consistency of Werewolf AI through Dialogue Summarization and Persona Information

Dit artikel presenteert een op grote taalmodellen gebaseerde AI-agent voor het Werewolf-spel die, door gebruik te maken van dialogsamenvattingen en gepersonaliseerde instructies, de consistentie van de uitingen en het karakterbehoud tijdens het spel aanzienlijk verbetert.

Yoshiki Tanaka, Takumasa Kaneko, Hiroki Onozeki, Natsumi Ezure, Ryuichi Uehara, Zhiyang Qi, Tomoya Higuchi, Ryutaro Asahara, Michimasa Inaba2026-03-10💬 cs.CL

Learning to Rank the Initial Branching Order of SAT Solvers

Dit onderzoek toont aan dat het gebruik van grafische neurale netwerken om de initiële vertakkingsvolgorde van SAT-oplossers te voorspellen aanzienlijke snelheidswinst oplevert voor willekeurige en pseudo-industriële problemen, maar minder effectief is voor complexe industriële instanties doordat de dynamische heuristieken van de solver de initiële voorspelling snel overschrijven.

Arvid Eriksson (KTH Royal Institute of Technology), Gabriel Poesia (Kempner Institute at Harvard University), Roman Bresson (Mohamed Bin Zayed University of Artificial Intelligence), Karl Henrik Johansson (KTH Royal Institute of Technology), David Broman (KTH Royal Institute of Technology)2026-03-10💻 cs