cs.AI papers | Gist.Science

SyncSpeech: Efficient and Low-Latency Text-to-Speech based on Temporal Masked Transformer

Het paper introduceert SyncSpeech, een efficiënt en laag-latentie tekst-naar-spraakmodel dat de Temporal Masked Transformer-paradigma gebruikt om de voordelen van autoregressieve en niet-autoregressieve modellen te combineren, waardoor een aanzienlijke verbetering in snelheid en latentie wordt bereikt zonder in te leveren op spraakkwaliteit.

Zhengyan Sheng, Zhihao Du, Shiliang Zhang + 2 more2026-03-17🤖 cs.AI

Resource Heterogeneity-Aware and Utilization-Enhanced Scheduling for Deep Learning Clusters

Dit paper introduceert Hadar en HadarE, twee nieuwe schedulers voor deep learning-clusters die door middel van taakniveau-heterogeniteitsbewustzijn en het forken van taken de resourcebenutting en trainingssnelheid aanzienlijk verbeteren ten opzichte van bestaande systemen zoals Gavel.

Abeda Sultana, Nabin Pakka, Fei Xu + 3 more2026-03-17🤖 cs.AI

Adaptive Deep Learning for Breast Cancer Subtype Prediction Via Misprediction Risk Analysis

Deze studie introduceert MultiRisk, een adaptief deep learning-framework dat de voorspellingsnauwkeurigheid van borstkanker-subtypes verbetert door misvoorspellingsrisico's te analyseren en modellen dynamisch aan te passen aan datasetkenmerken en domeinverschuivingen.

Gul Sheeraz, Qun Chen, Liu Feiyu + 1 more2026-03-17🤖 cs.AI

RRNCO: Towards Real-World Routing with Neural Combinatorial Optimization

Deze paper introduceert RRNCO, een nieuw architectuur voor neurale combinatorische optimalisatie die de kloof tussen simulatie en de realiteit overbrugt door adaptieve node-embeddings en een neurale adaptieve bias te gebruiken voor realistische, asymmetrische routeplanningsproblemen, ondersteund door een nieuw benchmarkdataset gebaseerd op data uit 100 steden.

Jiwoo Son, Zhikai Zhao, Federico Berto + 4 more2026-03-17🤖 cs.AI

Integrating Personality into Digital Humans: A Review of LLM-Driven Approaches for Virtual Reality

Dit artikel biedt een uitgebreide review van methoden om digitale mensen in virtuele realiteit van persoonlijkheid te voorzien door middel van grote taalmodellen, waarbij het zowel de verschillende aanpassingstechnieken als de uitdagingen rondom prestaties en evaluatie belicht om toepassingen in onderwijs, therapie en gaming te bevorderen.

Iago Alves Brito, Julia Soares Dollis, Fernanda Bufon Färber, Pedro Schindler Freire Brasil Ribeiro, Rafael Teixeira Sousa, Arlindo Rodrigues Galvão Filho2026-03-17💬 cs.CL

Almost Bayesian: The Fractal Dynamics of Stochastic Gradient Descent

Dit artikel toont aan dat Stochastic Gradient Descent kan worden beschouwd als een aangepaste Bayesiaanse steekproefmethode die diffusie op een fractaal landschap simuleert, waarbij de fractale dimensie de toegankelijkheidsbeperkingen van het verlieslandschap in rekening brengt.

Max Hennick, Stijn De Baerdemacker2026-03-17🔢 math

Boosting Large Language Models with Mask Fine-Tuning

Dit paper introduceert Mask Fine-Tuning (MFT), een nieuwe aanpak voor het finetunen van grote taalmodellen die prestaties verbetert door het toepassen van binaire maskers op een bestaand model zonder de gewichten bij te werken, wat de noodzaak van het behoud van de volledige modelintegriteit vooruitstreeft.

Mingyuan Zhang, Yue Bai, Huan Wang, Yizhou Wang, Qihua Dong, Yitian Zhang, Yun Fu2026-03-17💬 cs.CL

Dominated Actions in Imperfect-Information Games

Dit artikel introduceert een polynomiaal-tijdsalgoritme voor het efficiënt identificeren en iteratief verwijderen van gedomineerde acties in imperfecte-informatiespellen met twee spelers en publiek waarneembare acties, waardoor de grootte van de spelboom als voorbewerkingsstap voor het berekenen van een Nash-evenwicht aanzienlijk kan worden gereduceerd.

Sam Ganzfried2026-03-17📈 econ

MegaScale-Data: Scaling Dataloader for Multisource Large Foundation Model Training

Dit paper introduceert MegaScale-Data, een industriële architectuur voor gedistribueerde dataloaders die de trainingsefficiëntie van multimodale foundation modellen aanzienlijk verbetert door werklastonevenwichtigheid op te lossen en het geheugengebruik te verminderen via gedescentraliseerde voorverwerking en een gecentraliseerde data-orkestratie.

Juntao Zhao, Qi Lu, Wei Jia + 13 more2026-03-17🤖 cs.AI

QLLM: Do We Really Need a Mixing Network for Credit Assignment in Multi-Agent Reinforcement Learning?

Het artikel introduceert QLLM, een nieuw kader dat grote taalmodellen gebruikt om trainingsvrije credit assignment-functies te genereren, waardoor de noodzaak van vooraf gedefinieerde mengnetwerken in multi-agent versterkingsleer wordt overbodig gemaakt en tegelijkertijd de interpretatie en prestaties worden verbeterd.

Yuanjun Li, Zhouyang Jiang, Bin Zhang + 3 more2026-03-17🤖 cs.AI

Nemotron-CrossThink: Scaling Self-Learning beyond Math Reasoning

Nemotron-CrossThink is een framework dat door het integreren van multi-domein data en gestructureerde verifieerbare beloningen in Reinforcement Learning, de generalisatie, nauwkeurigheid en efficiëntie van grote taalmodellen voor diverse redeneertaken aanzienlijk verbetert.

Syeda Nahida Akter, Shrimai Prabhumoye, Matvei Novikov + 8 more2026-03-17🤖 cs.AI

Learning Enhanced Structural Representations with Block-Based Uncertainties for Ocean Floor Mapping

Dit artikel introduceert een nieuw, onzekerheidsbewust kader dat blockgebaseerde conformale voorspelling combineert met een VQ-VAE-architectuur om hoogwaardige, fysiek consistente bathymetrische kaarten van de zeebodem te genereren met ruimtelijk adaptieve onzekerheidsschattingen, wat essentieel is voor nauwkeurige klimaatmodellen en kustrisico-analyses.

Jose Marie Antonio Minoza2026-03-17📊 stat

The Big Send-off: Scalable and Performant Collectives for Deep Learning

Deze paper introduceert PCCL, een schaalbare en hoogpresterende bibliotheek voor collectieve communicatie die, door gebruik te maken van een hiërarchisch ontwerp en leergerichte algoritme-selectie, aanzienlijke snelheidswinst boekt ten opzichte van bestaande oplossingen zoals RCCL en NCCL bij het trainen van deep learning-modellen op duizenden GPU's.

Siddharth Singh, Keshav Pradeep, Mahua Singh + 2 more2026-03-17🤖 cs.AI

Predicting Stress in Two-phase Random Materials and Super-Resolution Method for Stress Images by Embedding Physical Information

Deze studie presenteert een nieuw raamwerk voor tweefasenmaterialen dat een MC U-net en een fysiek-informeerde SRPINN-methode combineert om stressverdeling nauwkeurig te voorspellen en super-resolutie stressbeelden te genereren, zelfs bij beperkte beeldkwaliteit en zonder gekoppelde trainingsdata.

Tengfei Xing, Xiaodan Ren, Jie Li2026-03-17🔬 cond-mat.mtrl-sci

A Typology of Synthetic Datasets for Dialogue Processing in Clinical Contexts

Dit artikel biedt een overzicht van de creatie, evaluatie en toepassing van synthetische datasets voor klinische dialogen en introduceert een nieuwe typologie om verschillende gradaties van datasynthese te classificeren en te vergelijken.

Steven Bedrick, A. Seza Do\u{g}ruöz, Sergiu Nisioi2026-03-17💬 cs.CL

Aitomia: Your Intelligent Assistant for AI-Driven Atomistic and Quantum Chemical Simulations

Het artikel introduceert Aitomia, een door AI-aangedreven platform dat experts en niet-experts ondersteunt bij het uitvoeren, analyseren en visualiseren van atomaire en kwantumchemische simulaties via chatbots en multi-agent systemen, waardoor de drempel voor dergelijk onderzoek wordt verlaagd.

Jinming Hu, Hassan Nawaz, Yi-Fan Hou, Yuting Rui, Lijie Chi, Yuxinxin Chen, Arif Ullah, Pavlo O. Dral2026-03-17🔬 physics

Shorten After You're Right: Lazy Length Penalties for Reasoning RL

Dit artikel introduceert een nieuwe beloningsstrategie voor reinforcement learning die de lengte van redeneerpaden in grote modellen aanzienlijk verkort zonder extra trainingsstappen, terwijl de prestaties op logische en wiskundige taken worden behouden of zelfs verbeterd.

Danlong Yuan, Tian Xie, Shaohan Huang, Zhuocheng Gong, Huishuai Zhang, Chong Luo, Furu Wei, Dongyan Zhao2026-03-17💬 cs.CL

Fault-Tolerant Multi-Robot Coordination with Limited Sensing within Confined Environments

Dit onderzoek presenteert de 'Active Contact Response'-methode, die robots in beperkte omgevingen in staat stelt om door fysieke interactie defecte teamleden te verplaatsen en zo de gezamenlijke taakuitvoering te behouden ondanks beperkte sensoren en communicatie.

Kehinde O. Aina, Hosain Bagheri, Daniel I. Goldman2026-03-17🤖 cs.AI

Artificial Intelligence for Direct Prediction of Molecular Dynamics Across Chemical Space

Dit paper introduceert MDtrajNet, een nieuw neurale netwerk dat moleculaire dynamica-trajecten direct voorspelt over het chemische landschap heen, waardoor simulaties tot twee orde van grootte sneller worden dan traditionele methoden terwijl de nauwkeurigheid van ab initio-simulaties wordt behouden.

Fuchun Ge, Yuxinxin Chen, Pavlo O. Dral2026-03-17🤖 cs.AI

Incentivizing Strong Reasoning from Weak Supervision

Dit artikel introduceert een kosteneffectieve methode waarbij grote taalmodellen hun redeneervermogen aanzienlijk verbeteren door supervisie van veel zwakkere modellen, waardoor bijna 94% van de prestaties van dure versterkingsleer wordt behaald.

Yige Yuan, Teng Xiao, Shuchang Tao, Xue Wang, Jinyang Gao, Bolin Ding, Bingbing Xu2026-03-17💬 cs.CL

← Vorige Volgende →