Automatic Cardiac Risk Management Classification using large-context Electronic Patients Health Records

Deze studie introduceert een geautomatiseerd classificatiekader voor het beheer van hartklierenrisico bij ouderen, waarbij een aangepaste Transformer-architectie die lange contextuele afhankelijkheden in ongestructureerde patiëntendossiers verwerkt, superieure prestaties levert ten opzichte van traditionele methoden en generatieve grote taalmodellen.

Jacopo Vitale, David Della Morte, Luca Bacco, Mario Merone, Mark de Groot, Saskia Haitjema, Leandro Pecchia, Bram van EsWed, 11 Ma🤖 cs.AI

ESAinsTOD: A Unified End-to-End Schema-Aware Instruction-Tuning Framework for Task-Oriented Dialog Modeling

Dit paper introduceert ESAinsTOD, een uniek end-to-end raamwerk voor taakgericht dialogen dat door middel van instructie- en schema-aanpassing grote taalmodellen in staat stelt om zich flexibel aan te passen aan diverse scenario's, superieure prestaties te leveren op bestaande benchmarks en robuust te zijn in low-resource en ruisige omgevingen.

Dechuan Teng, Chunlin Lu, Libo Qin, Wanxiang CheWed, 11 Ma🤖 cs.AI

ActiveUltraFeedback: Efficient Preference Data Generation using Active Learning

Dit paper introduceert ActiveUltraFeedback, een modulaire actieve leer-pijplijn die onzekerheidsschattingen en nieuwe selectiemethoden gebruikt om het labelen van voorkeursdata voor het uitlijnen van grote taalmodellen aanzienlijk te versnellen en te optimaliseren met slechts een fractie van de benodigde annotatie.

Davit Melikidze, Marian Schneider, Jessica Lam, Martin Wertich, Ido Hakimi, Barna Pásztor, Andreas KrauseWed, 11 Ma🤖 cs.AI

Mousse: Rectifying the Geometry of Muon with Curvature-Aware Preconditioning

Dit paper introduceert Mousse, een nieuwe optimizer die de stabiliteit van Muon combineert met de geometrische aanpassing van Shampoo door spectrale updates uit te voeren in een witgemaakte coördinatenruimte, wat leidt tot een aanzienlijke versnelling van het trainingsproces voor taalmodellen zonder noemenswaardige rekenkosten.

Yechen Zhang, Shuhao Xing, Junhao Huang, Kai Lv, Yunhua Zhou, Xipeng Qiu, Qipeng Guo, Kai ChenWed, 11 Ma🤖 cs.AI

Evaluation of LLMs in retrieving food and nutritional context for RAG systems

Deze studie toont aan dat grote taalmodellen (LLMs) effectief kunnen worden ingezet in RAG-systemen voor het vertalen van natuurlijke taal naar gestructureerde metadata om voedsel- en voedingsgegevens te raadplegen, hoewel hun betrouwbaarheid afneemt bij complexe vragen met beperkingen die niet direct in de metadata-formaat kunnen worden uitgedrukt.

Maks Požarnik Vavken, Matevž Ogrinc, Tome Eftimov, Barbara Koroušic SeljakWed, 11 Ma💬 cs.CL

MUGEN: Evaluating and Improving Multi-audio Understanding of Large Audio-Language Models

Dit paper introduceert MUGEN, een benchmark die de beperkingen van grote audio-taalmodellen bij het verwerken van meerdere simultane audio-invoeren blootlegt en aantoont dat trainingsvrije strategieën zoals Audio-Permutational Self-Consistency de prestaties aanzienlijk verbeteren.

Chih-Kai Yang, Yun-Shao Tsai, Yu-Kai Guo, Ping-Le Tsai, Yen-Ting Piao, Hung-Wei Chen, Ting-Lin Hsiao, Yun-Man Hsu, Ke-Han Lu, Hung-yi LeeWed, 11 Ma🤖 cs.AI

One-Eval: An Agentic System for Automated and Traceable LLM Evaluation

Dit paper introduceert One-Eval, een agentisch systeem dat natuurlijke taalverzoeken omzet in traceerbare en aanpasbare evaluatieworkflows voor grote taalmodellen, waardoor de handmatige inspanning voor benchmarkselectie, dataverwerking en rapportage aanzienlijk wordt verminderd.

Chengyu Shen, Yanheng Hou, Minghui Pan, Runming He, Zhen Hao Wong, Meiyi Qiang, Zhou Liu, Hao Liang, Peichao Lai, Zeang Sheng, Wentao ZhangWed, 11 Ma💬 cs.CL

Chow-Liu Ordering for Long-Context Reasoning in Chain-of-Agents

Dit paper introduceert een Chow-Liu-baas voor het ordenen van tekstchunks in Chain-of-Agents-systemen, waarbij een breedte-eerst-doorloop van de afgeleide afhankelijkheidsboom de informatieverlies minimaliseert en consequent betere prestaties levert dan standaard of semantische ordeningsmethodes op lange-contexttaken.

Naman Gupta, Vaibhav Singh, Arun Iyer, Kirankumar Shiragur, Pratham Grover, Ramakrishna B. Bairi, Ritabrata Maiti, Sankarshan Damle, Shachee Mishra Gupta, Rishikesh Maurya, Vageesh D. CWed, 11 Ma💬 cs.CL