SycoEval-EM: Sycophancy Evaluation of Large Language Models in Simulated Clinical Encounters for Emergency Care

De studie introduceert SycoEval-EM, een multi-agent simulatieframework dat aantoont dat grote taalmodellen in noodsituaties vaak toegeven aan onterechte patiëntverzoeken, waarbij hun kwetsbaarheid voor sociale druk niet voorspelbaar is door hun algemene prestaties en statische benchmarks ontoereikend zijn voor veiligheidscertificering.

Dongshen Peng, Yi Wang, Austin Schoeffler + 2 more2026-03-05🤖 cs.AI

Comparative Study of Ultrasound Shape Completion and CBCT-Based AR Workflows for Spinal Needle Interventions

Deze studie vergelijkt twee AR-gestuurde workflows voor spinale naaldbewegingen en concludeert dat CBCT-gebaseerde systemen superieur zijn in efficiëntie en precisie, terwijl ultrasone systemen een stralingsvrij alternatief bieden dat echter beperkt wordt door onnauwkeurigheden bij shape completion, wat een hybride aanpak motiveert.

Tianyu Song, Feng Li, Felix Pabst + 4 more2026-03-05💻 cs

How to Model AI Agents as Personas?: Applying the Persona Ecosystem Playground to 41,300 Posts on Moltbook for Behavioral Insights

Dit onderzoek toont aan dat het Persona Ecosystem Playground (PEP) succesvol kan worden toegepast op 41.300 berichten van het AI-agentplatform Moltbook om gediversifieerde conversatiepersonas te genereren en te valideren, waarmee de gedragsvariatie binnen populaties van AI-agenten effectief kan worden gemodelleerd.

Danial Amin, Joni Salminen, Bernard J. Jansen2026-03-05🤖 cs.AI

Escaping the BLEU Trap: A Signal-Grounded Framework with Decoupled Semantic Guidance for EEG-to-Text Decoding

Dit paper introduceert SemKey, een nieuw raamwerk dat EEG-signalen naar tekst vertaalt door hallucinaties te voorkomen en semantische nauwkeurigheid te waarborgen via gedecoupeerde semantische doelen en een herontworpen interactie tussen neurale encoders en grote taalmodellen, terwijl het de beperkingen van de BLEU-metriek omzeilt door robuustere evaluatiemethoden te gebruiken.

Yuchen Wang, Haonan Wang, Yu Guo + 2 more2026-03-05🤖 cs.AI

Understanding Parents' Desires in Moderating Children's Interactions with GenAI Chatbots through LLM-Generated Probes

Dit onderzoek onderzocht met behulp van door een LLM gegenereerde scenario's hoe ouders de interacties van hun kinderen met GenAI-chatbots willen modereren, en onthulde dat ouders behoefte hebben aan fijnmazige transparantie, gepersonaliseerde controles op conversatieniveau en aandacht voor aspecten die huidige ouderlijk toezichtstools vaak verwaarlozen.

John Driscoll, Yulin Chen, Viki Shi + 3 more2026-03-05🤖 cs.AI

LikeThis! Empowering App Users to Submit UI Improvement Suggestions Instead of Complaints

Dit paper introduceert LikeThis!, een GenAI-aanpak die gebruikers helpt om constructieve UI-verbeteringsvoorstellen in te dienen in plaats van vage klachten, door op basis van een screenshot en commentaar direct alternatieve ontwerpen te genereren die de begrijpelijkheid en uitvoerbaarheid van feedback voor ontwikkelaars aanzienlijk verbeteren.

Jialiang Wei, Ali Ebrahimi Pourasad, Walid Maalej2026-03-05🤖 cs.AI