Seeing the Context: Rich Visual Context-Aware Speech Recognition via Multimodal Reasoning

Dit paper introduceert VASR, een nieuw model voor contextbewuste spraakherkenning dat gebruikmaakt van Audio-Visual Chain-of-Thought om rijke visuele context te redeneren en zo de prestaties te verbeteren door het probleem van eenzijdige modale dominantie aan te pakken.

Wenjie Tian, Mingchen Shao, Bingshen Mu, Xuelong Geng, Chengyou Wang, Yujie Liao, Zhixian Zhao, Ziyu Zhang, Jingbin Hu, Mengqi Wei, Lei Xie2026-03-10💻 cs

LLM-FK: Multi-Agent LLM Reasoning for Foreign Key Detection in Large-Scale Complex Databases

Dit paper introduceert LLM-FK, een geautomatiseerd multi-agent framework dat de detectie van ontbrekende foreign keys in grote, complexe databases aanzienlijk verbetert door de zoekruimte te optimaliseren en semantische afhankelijkheden nauwkeurig te modelleren, wat resulteert in een F1-score van boven de 93% en een prestatieverbetering van 15% ten opzichte van bestaande methoden.

Zijian Tang, Ying Zhang, Sibo Cai, Ruoxuan Wang2026-03-10💻 cs

TopRank-Based Delivery Rate Optimization for Coded Caching under Non-Uniform Demands

Dit paper introduceert een rangschikking-gebaseerde methode voor het optimaliseren van de leveringsrate in gecodeerde caching onder niet-uniforme vraag, die beter presteert dan eerdere benaderingen door bestanden te groeperen op basis van relatieve vraagverschillen in plaats van exacte populariteitsschattingen, wat vooral voordelig is bij beperkte opslag, weinig gebruikers of verstoord leerproces.

Mohammadsaber Bahadori, Seyed Pooya Shariatpanahi, Behnam Bahrak2026-03-10💻 cs

MAviS: A Multimodal Conversational Assistant For Avian Species

Dit paper introduceert MAviS, een multimodaal conversatie-assistent voor vogelsoorten dat bestaat uit een uitgebreide dataset, een chat-model en een benchmark, en waarmee state-of-the-art resultaten worden behaald voor gedetailleerd begrip en vragenbeantwoording over vogelsoorten in ecologische toepassingen.

Yevheniia Kryklyvets, Mohammed Irfan Kurpath, Sahal Shaji Mullappilly, Jinxing Zhou, Fahad Shabzan Khan, Rao Anwer, Salman Khan, Hisham Cholakkal2026-03-10💻 cs