SWE-QA-Pro: A Representative Benchmark and Scalable Training Recipe for Repository-Level Code Understanding

Dit paper introduceert SWE-QA-Pro, een robuust benchmark voor repository-level codebegrip dat gebaseerd is op diverse, lange-staart repositories, en presenteert een schaalbaar trainingsrecept met synthetische data dat kleine open modellen in staat stelt om concurrentie aan te gaan met geavanceerde proprietary modellen.

Songcheng Cai, Zhiheng Lyu, Yuansheng Ni, Xiangchao Chen, Baichuan Zhou, Shenzhe Zhu, Yi Lu, Haozhe Wang, Chi Ruan, Benjamin Schneider, Weixu Zhang, Xiang Li, Andy Zheng, Yuyu Zhang, Ping Nie, Wenhu Chen2026-03-18💬 cs.CL

HIPO: Instruction Hierarchy via Constrained Reinforcement Learning

Dit paper introduceert HIPO, een nieuw uitlijningskader dat hiërarchische instructieopvolging aanpakt door systemprompt-compliance om te vormen tot een strikte algoritmische beperking binnen een Constrained Markov Decision Process, waardoor modellen zowel systeminstructies nauwkeuriger volgen als de nuttigheid voor de gebruiker maximaliseren.

Keru Chen, Jun Luo, Sen Lin, Yingbin Liang, Alvaro Velasquez, Nathaniel Bastian, Shaofeng Zou2026-03-18🤖 cs.LG

DyJR: Preserving Diversity in Reinforcement Learning with Verifiable Rewards via Dynamic Jensen-Shannon Replay

Het artikel introduceert DyJR, een efficiënt framework voor versterkt leren dat de diversiteit van Large Language Models behoudt door een dynamische buffer en Jensen-Shannon-divergentie-regulering te gebruiken, waardoor het de prestaties van bestaande methoden zoals GRPO verbetert zonder in te leveren op trainingsefficiëntie.

Long Li, Zhijian Zhou, Tianyi Wang, Weidi Xu, Zuming Huang, Wei Chu, Zhe Wang, Shirui Pan, Chao Qu, Yuan Qi2026-03-18🤖 cs.LG

SQL-ASTRA: Alleviating Sparse Feedback in Agentic SQL via Column-Set Matching and Trajectory Aggregation

Het paper introduceert SQL-ASTRA, een framework dat het probleem van schaarse feedback in Text-to-SQL verhelpt door een tweelaags beloningssysteem te gebruiken dat trajectaggregatie en kolommen-matching combineert om stabiele multi-turn agenten te realiseren die state-of-the-art prestaties behalen.

Long Li, Zhijian Zhou, Jiangxuan Long, Peiyang Liu, Weidi Xu, Zhe Wang, Shirui Pan, Chao Qu2026-03-18🤖 cs.AI

360{\deg} Image Perception with MLLMs: A Comprehensive Benchmark and a Training-Free Method

Deze paper introduceert 360Bench, een benchmark voor het beoordelen van multimodale taalmodellen op 360-gradenbeelden, en presenteert Free360, een trainingsvrije methode die scene graphs en adaptieve transformaties gebruikt om de prestaties van deze modellen voor visuele vraag-antwoordtaken aanzienlijk te verbeteren.

Huyen T. T. Tran, Van-Quang Nguyen, Farros Alferro, Kang-Jun Liu, Takayuki Okatani2026-03-18🤖 cs.AI

Sample-Efficient Adaptation of Drug-Response Models to Patient Tumors under Strong Biological Domain Shift

Dit artikel presenteert een gefaseerd transfer-learningkader dat door het onafhankelijk leren van representaties uit ongelabelde data en daaropvolgende aanpassing met weinig gelabelde patiëntdata, de benodigde klinische supervisie voor het voorspellen van drugrespons significant verlaagt ondanks sterke biologische domeinverschillen.

Camille Jimenez Cortes, Philippe Lalanda, German Vega2026-03-18🧬 q-bio

Robust Generative Audio Quality Assessment: Disentangling Quality from Spurious Correlations

Deze paper introduceert een robuuste methode voor de beoordeling van de kwaliteit van gegenereerde audio die, door middel van domein-adversariale training en aspect-specifieke domeindefinities, spurious correlaties elimineert en zo de generalisatie en correlatie met menselijke beoordelingen aanzienlijk verbetert.

Kuan-Tang Huang, Chien-Chun Wang, Cheng-Yeh Yang, Hung-Shin Lee, Hsin-Min Wang, Berlin Chen2026-03-18⚡ eess

Proactive Rejection and Grounded Execution: A Dual-Stage Intent Analysis Paradigm for Safe and Efficient AIoT Smart Homes

Dit paper introduceert het Dual-Stage Intent-Aware (DS-IA) framework, dat de betrouwbaarheid en efficiëntie van AIoT-smarthomes verbetert door hoogwaardige intentie-analyse te scheiden van deterministische uitvoeringsverificatie, waardoor hallucinaties worden voorkomen en de interactiefrequentie met gebruikers wordt geoptimaliseerd.

Xinxin Jin, Zhengwei Ni, Zhengguo Sheng, Victor C. M. Leung2026-03-18🤖 cs.AI