cs.CL papers | Gist.Science

Understanding and Mitigating Dataset Corruption in LLM Steering

Dit onderzoek toont aan dat contrastieve sturing van grote taalmodellen kwetsbaar is voor kwaadwillende datasetcorruptie, maar dat deze kwetsbaarheid effectief kan worden gemitigeerd door het gebruik van robuuste schatters voor het berekenen van het gemiddelde.

Cullen Anderson, Narmeen Oozeer, Foad Namjoo + 3 more2026-03-04💬 cs.CL

Density-Guided Response Optimization: Community-Grounded Alignment via Implicit Acceptance Signals

Deze paper introduceert Density-Guided Response Optimization (DGRO), een methode die taalmodellen aanpast aan gemeenschapsnormen door gebruik te maken van impliciete acceptatiesignalen en de geometrische dichtheid in representatieruimtes, waardoor effectieve uitlijning mogelijk wordt zonder expliciete voorkeurslabels.

Patrick Gerard, Svitlana Volkova2026-03-04💬 cs.CL

Using Learning Progressions to Guide AI Feedback for Science Learning

Deze studie toont aan dat feedback gegenereerd door AI op basis van automatisch afgeleide leervorderingen (learning progressions) even kwalitatief hoogwaardig is als feedback gebaseerd op door experts ontworpen rubrieken voor middelbare scholieren in de scheikunde.

Xin Xia, Nejla Yuruk, Yun Wang + 1 more2026-03-04💬 cs.CL

Factuality Challenges in the Era of Large Language Models

Dit artikel onderzoekt de uitdagingen van hallucinaties en misinformatie door grote taalmodellen en schetst de noodzakelijke technologische, regelgevende en educatieve maatregelen om de waarheidsvinding in het tijdperk van generatieve AI te waarborgen.

Isabelle Augenstein, Timothy Baldwin, Meeyoung Cha + 15 more2026-03-03💬 cs.CL

Using ChatGPT for Data Science Analyses

Dit artikel evalueert het potentieel van ChatGPT als kwantitatieve co-pilot voor data science-werkstromen, waarbij de mogelijkheden voor exploratie, visualisatie en modellering worden geïllustreerd en de noodzaak van zorgvuldige overweging van de beperkingen wordt benadrukt.

Ozan Evkaya, Miguel de Carvalho2026-03-03📊 stat

Large Language Model Agent in Financial Trading: A Survey

Dit survey biedt een uitgebreide analyse van het gebruik van Large Language Model-agenten in financiële trading, waarbij het de huidige architecturen, data-inputs, prestaties en uitdagingen samenvat en toekomstige onderzoeksrichtingen schetst.

Han Ding, Yinheng Li, Junhao Wang + 3 more2026-03-03💬 cs.CL

Scaling Knowledge Graph Construction through Synthetic Data Generation and Distillation

Dit paper introduceert SynthKG en Distill-SynthKG, een pipeline die synthetische document-KG-paren genereert om een kleiner model te trainen dat niet alleen superieure kennisgrafiek-kwaliteit levert ten opzichte van grotere baselines, maar ook de prestaties verbetert in zoekopdrachten en vraagbeantwoording via een nieuw grafiekgebaseerd ophaalframework.

Prafulla Kumar Choubey, Xin Su, Man Luo + 9 more2026-03-03💬 cs.CL

Polynomial, trigonometric, and tropical activations

Dit artikel introduceert en valideert een nieuwe familie van activeringsfuncties gebaseerd op orthonormale bases, waaronder polynomen en trigonometrische functies, die door middel van eenvoudige initialisatie stabiel kunnen worden getraind in diepe modellen zoals GPT-2 en ConvNeXt zonder explosie of verdwijning van gradiënten, terwijl ze tevens nauwkeurige benaderingen bieden voor klassieke activeringen die nuttig zijn voor fine-tuning.

Ismail Khalfaoui-Hassani, Stefan Kesselheim2026-03-03💬 cs.CL

AStar: Boosting Multimodal Reasoning with Automated Structured Thinking

Het paper introduceert AStar, een trainingsvrije methode voor multimodaal redeneren die door het gebruik van aanpasbare 'thought cards' complexe visuele taken efficiënter oplost dan bestaande zoek- of post-trainingstechnieken, zoals blijkt uit de verbeterde prestaties op wiskundige benchmarks ten opzichte van GPT-4o.

Jinyang Wu, Mingkuan Feng, Guocheng Zhai + 7 more2026-03-03💬 cs.CL

Enhancing Hallucination Detection through Noise Injection

Deze paper introduceert een trainingsvrije methode die hallucinatiedetectie bij grote taalmodellen aanzienlijk verbetert door tijdens het bemonsteren ruis toe te voegen aan modelparameters of activaties om Bayesiaanse onzekerheid beter te benutten dan standaard token-bemonstering.

Litian Liu, Reza Pourreza, Sunny Panchal + 4 more2026-03-03💬 cs.CL

LLM-ProS: Analyzing Large Language Models' Performance in Competitive Problem Solving

Dit paper introduceert LLM-ProS, een nieuwe evaluatiemethode die de prestaties van toonaangevende grote taalmodellen analyseert op ICPC-wedstrijdproblemen om hun redeneervermogen, nauwkeurigheid en efficiëntie te benchmarken.

Md Sifat Hossain, Anika Tabassum, Md. Fahim Arefin + 1 more2026-03-03💬 cs.CL

Robust Adaptation of Large Multimodal Models for Retrieval Augmented Hateful Meme Detection

Deze paper introduceert een robuust adaptatiekader voor grote multimodale modellen dat de prestaties en generalisatie bij het detecteren van hatelijke memes verbetert, terwijl het tegelijkertijd de interpretatievermogen en weerstand tegen adversariale aanvallen versterkt.

Jingbiao Mei, Jinghong Chen, Guangyu Yang + 2 more2026-03-03💬 cs.CL

MemeIntel: Explainable Detection of Propagandistic and Hateful Memes

Deze paper introduceert MemeXplain, een nieuw dataset en een multi-stap optimalisatiestrategie voor Vision-Language Models, die de detectie van propagandistische en hatelijke memes in het Arabisch en Engels aanzienlijk verbetert door gelijktijdig labels te voorspellen en uitleg te genereren.

Mohamed Bayan Kmainasi, Abul Hasnat, Md Arid Hasan + 2 more2026-03-03💬 cs.CL

Rewarding Doubt: A Reinforcement Learning Approach to Calibrated Confidence Expression of Large Language Models

Deze paper introduceert een nieuwe reinforcement learning-methode die grote taalmodellen direct fine-tuned om hun antwoorden op feitelijke vragen te koppelen aan nauwkeurig gekalibreerde betrouwbaarheidsinschattingen, waardoor zowel over- als ondervertrouwen wordt gestraft en de modellen een algemeen bewustzijn van hun eigen zekerheid ontwikkelen.

David Bani-Harouni, Chantal Pellegrini, Paul Stangel + 4 more2026-03-03💬 cs.CL

Not-Just-Scaling Laws: Towards a Better Understanding of the Downstream Impact of Language Model Design Decisions

Deze studie analyseert 92 open-source taalmodellen en toont aan dat het meenemen van ontwerpfactoren zoals data-samenstelling en architecturale keuzes, naast modelgrootte, de voorspelling van downstream-prestaties aanzienlijk verbetert en inzicht biedt in hoe specifieke ontwerpbeslissingen de eindcapaciteiten vormen.

Emmy Liu, Amanda Bertsch, Lintang Sutawika + 9 more2026-03-03💬 cs.CL

Large Language Models in Bioinformatics: A Survey

Dit survey biedt een systematische review van de transformatieve rol van grote taalmodellen in de bio-informatica, waarbij recente vooruitgang, uitdagingen en toekomstige richtingen worden belicht om innovaties in de precisiegeneeskunde te stimuleren.

Zhenyu Wang, Zikang Wang, Jiyue Jiang + 3 more2026-03-03🧬 q-bio

LLaVE: Large Language and Vision Embedding Models with Hardness-Weighted Contrastive Learning

Dit paper introduceert LLaVE, een reeks multimodale embedding-modellen die gebruikmaken van hardheid-gewogen contrastief leren om de discriminatie van moeilijke negatieve paren te verbeteren, waardoor state-of-the-art prestaties worden bereikt op de MMEB-benchmark met een opmerkelijke schaalbaarheid en generalisatie naar videotaak.

Zhibin Lan, Liqiang Niu, Fandong Meng + 2 more2026-03-03💬 cs.CL

Vision-R1: Incentivizing Reasoning Capability in Multimodal Large Language Models

Het paper introduceert Vision-R1, een multimodaal groot taalmodel dat door middel van een zelfgeconstrueerde dataset en een geavanceerde trainingsstrategie met versterkende leer (RL) de redeneerprestaties aanzienlijk verbetert en daarmee bijna gelijk komt aan de prestaties van OpenAI O1 op wiskundige benchmarks.

Wenxuan Huang, Bohan Jia, Zijie Zhai + 7 more2026-03-03💬 cs.CL

I Predict Therefore I Am: Is Next Token Prediction Enough to Learn Human-Interpretable Concepts from Data?

Dit paper introduceert een nieuw generatief model en bewijst dat next-token prediction leidt tot representaties die de logaritmen van de posterieure kansen op latente, mensinterpreteerbare concepten benaderen, wat de lineaire representatiehypothese theoretisch onderbouwt en empirisch wordt gevalideerd op verschillende LLM-families.

Yuhang Liu, Dong Gong, Yichao Cai + 6 more2026-03-03💬 cs.CL

A Foundational Individual Mobility Prediction Model based on Open-Source Large Language Models

Dit paper introduceert MoBLLM, een kostenefficiënt fundamenteel model op basis van open-source grote taalmodellen dat door middel van parameter-efficiënt fijnafstemmen superieure prestaties, robuustheid en overdraagbaarheid bereikt bij het voorspellen van individuele mobiliteit in diverse real-world scenario's.

Zhenlin Qin, Leizhen Wang, Yancheng Ling + 2 more2026-03-03💬 cs.CL

← Vorige Volgende →