From Days to Minutes: An Autonomous AI Agent Achieves Reliable Clinical Triage in Remote Patient Monitoring

Het onderzoek presenteert Sentinel, een autonoom AI-agent dat remote patient monitoring-data met een hogere gevoeligheid voor noodgevallen dan individuele clinici triageert, waardoor schaalbare en kosteneffectieve monitoring mogelijk wordt die de beperkingen van eerdere trials overbrugt.

Seunghwan Kim (AnsibleHealth Inc., San Francisco, USA), Tiffany H. Kung (AnsibleHealth Inc., San Francisco, USA, Stanford School of Medicine, Stanford, USA), Heena Verma (AnsibleHealth Inc., San Francisco, USA), Dilan Edirisinghe (AnsibleHealth Inc., San Francisco, USA), Kaveh Sedehi (AnsibleHealth Inc., San Francisco, USA), Johanna Alvarez (AnsibleHealth Inc., San Francisco, USA), Diane Shilling (AnsibleHealth Inc., San Francisco, USA), Audra Lisa Doyle (AnsibleHealth Inc., San Francisco, USA), Ajit Chary (AnsibleHealth Inc., San Francisco, USA), William Borden (AnsibleHealth Inc., San Francisco, USA, George Washington University, Washington, D.C., USA), Ming Jack Po (AnsibleHealth Inc., San Francisco, USA)2026-03-11🤖 cs.AI

Reading, Not Thinking: Understanding and Bridging the Modality Gap When Text Becomes Pixels in Multimodal LLMs

Dit onderzoek analyseert de prestatieverschillen tussen tekst en afbeeldingen in multimodale taalmodellen, identificeert de oorzaken van deze 'modale kloof' en stelt een zelfdistillatiemethode voor die de nauwkeurigheid bij het lezen van tekst in afbeeldingen aanzienlijk verbetert zonder kennisverlies.

Kaiser Sun, Xiaochuang Yuan, Hongjun Liu, Chen Zhao, Cheng Zhang, Mark Dredze, Fan Bai2026-03-11💬 cs.CL

DuplexCascade: Full-Duplex Speech-to-Speech Dialogue with VAD-Free Cascaded ASR-LLM-TTS Pipeline and Micro-Turn Optimization

DuplexCascade is een VAD-vrije, gestreamde spraak-naar-spraak pipeline die volledige duplex-interactie mogelijk maakt door conventionele lange wisselgesprekken om te zetten in micro-turns met behulp van speciale controletokens, waardoor de intelligentie van een tekst-LLM behouden blijft terwijl de onderbrekingsproblemen van traditionele systemen worden opgelost.

Jianing Yang, Yusuke Fujita, Yui Sudo2026-03-11🤖 cs.AI

LooComp: Leverage Leave-One-Out Strategy to Encoder-only Transformer for Efficient Query-aware Context Compression

LooComp is een efficiënte, query-gerichte contextcompressiemethode die een encoder-only Transformer en een 'leave-one-out'-strategie gebruikt om zinnen te selecteren die cruciaal zijn voor het beantwoorden van vragen, waardoor de doorvoersnelheid wordt verhoogd en de kosten worden verlaagd zonder in te leveren op de nauwkeurigheid.

Thao Do, Dinh Phu Tran, An Vo, Seon Kwon Kim, Daeyoung Kim2026-03-11💬 cs.CL

TA-Mem: Tool-Augmented Autonomous Memory Retrieval for LLM in Long-Term Conversational QA

Dit paper introduceert TA-Mem, een nieuw raamwerk voor tool-versterkte, autonome geheugenretrieval dat een LLM-agent, een multi-index geheugendatabase en een adaptieve zoekagent combineert om de beperkingen van het contextvenster bij lange conversaties te overwinnen en de prestaties op de LoCoMo-dataset significant te verbeteren.

Mengwei Yuan, Jianan Liu, Jing Yang, Xianyou Li, Weiran Yan, Yichao Wu, Penghao Liang2026-03-11💬 cs.CL

LLM as a Meta-Judge: Synthetic Data for NLP Evaluation Metric Validation

Dit paper introduceert een schaalbaar framework genaamd 'LLM as a Meta-Judge' dat gebruikmaakt van synthetische data gegenereerd door taalkundige degradatie om NLP-evaluatiemetrics te valideren, waarbij hoge correlaties met menselijke beoordelingen aantonen dat deze methode een betrouwbaar en kostenefficiënt alternatief biedt voor dure menselijke annotatie.

Lukáš Eigler, Jindřich Libovický, David Hurych2026-03-11💬 cs.CL

CyberThreat-Eval: Can Large Language Models Automate Real-World Threat Research?

Dit paper introduceert CyberThreat-Eval, een expert-geannoteerde benchmark die is gebaseerd op de daadwerkelijke workflow van een toonaangevend bedrijf om Large Language Models te evalueren op hun vermogen om real-world cyberdreigingsinlichtingen te analyseren, waarbij wordt vastgesteld dat huidige modellen tekortschieten in nuance en feitelijke nauwkeurigheid.

Xiangsen Chen, Xuan Feng, Shuo Chen, Matthieu Maitre, Sudipto Rakshit, Diana Duvieilh, Ashley Picone, Nan Tang2026-03-11💬 cs.CL