Pour chaque article de cette page, au moins un des auteurs originaux a examiné notre explication accessible — soit en confirmant sa précision, soit en demandant des corrections que nous avons ensuite appliquées. Une validation ne signifie pas que les auteurs approuvent formellement chaque phrase, mais que l'explication a été revue par les personnes qui ont écrit l'article.

607 articles vérifiés par les auteurs · 351–360 / 607

Key-Value Means

Le papier présente les Moyennes Clé-Valeur (KVM), un nouveau mécanisme de récurrence par blocs pour l'attention qui unifie les avantages des transformateurs et des RNN linéaires en permettant un entraînement efficace et parallélisable par blocs avec une croissance flexible de l'état et un temps de préremplissage sous-quadratique, le tout en utilisant des opérations standard et un nombre minimal de paramètres supplémentaires.

Daniel Goldstein, Eugene Cheah2026-05-12✓ Author reviewed 🤖 cs.LG

DP-LAC: Lightweight Adaptive Clipping for Differentially Private Federated Fine-tuning of Language Models

L'article présente DP-LAC, une méthode légère pour le fine-tuning fédéré et différentiellement privé des modèles de langage, qui estime et adapte efficacement le seuil de clipping sans coûts de confidentialité supplémentaires ni réglage d'hyperparamètres, permettant d'obtenir une amélioration de 6,6 % de la précision par rapport aux approches existantes.

Haaris Mehmood, Jie Xu, Karthikeyan Saravanan, Rogier Van Dalen, Mete Ozay2026-05-12✓ Author reviewed 🤖 cs.LG

Test-Time Speculation

Ce papier présente la spéculation au moment du test (TTS), une méthode de distillation en ligne qui adapte continuellement un modèle de brouillon pendant l'inférence en utilisant les signaux de vérification du modèle cible, surmontant ainsi la dégradation des performances des spéculateurs existants sur les séquences longues et améliorant considérablement les longueurs d'acceptation.

Avinash Kumar, Sujay Sanghavi, Poulami Das2026-05-12✓ Author reviewed 🤖 cs.LG

Building Korean linguistic resource for NLU data generation of banking app CS dialog system

Ce papier présente la construction du Jeu de Données Financières Annotées (FIAD), une ressource linguistique coréenne dérivée d'avis d'applications bancaires et de Graphes de Grammaire Locale, utilisée pour générer des données d'entraînement annotées qui améliorent significativement les performances de divers modèles de compréhension du langage naturel dans les systèmes de dialogue pour le service client bancaire.

Jeongwoo Yoon, On-yu Park, Changhoe Hwang, Gwanghoon Yoo, Eric Laporte, Jeesun Nam2026-05-12✓ Author reviewed 🤖 cs.LG

NEO: No-Optimization Test-Time Adaptation through Latent Re-Centering

NEO est une méthode d'adaptation au moment du test sans hyperparamètre et économisant les ressources de calcul qui améliore la robustesse et l'étalonnage des modèles sous des décalages de distribution en recentrant les embeddings des données cibles à l'origine, atteignant une précision supérieure sur plusieurs jeux de données et appareils avec une surcharge de calcul minimale.

Alexander Murphy, Michal Danilowski, Soumyajit Chatterjee, Abhirup Ghosh2026-05-12✓ Author reviewed 🤖 cs.LG

Scam2Prompt: A Scalable Framework for Auditing Malicious Scam Endpoints in Production LLMs

L'article présente Scam2Prompt, un cadre évolutif qui révèle une vulnérabilité de sécurité critique et aggravante dans les modèles de langage de grande taille en production, où des invites automatisées dérivées de sites d'arnaque malveillants déclenchent avec succès la génération de code nuisible dans jusqu'à 47,3 % des cas sur plusieurs modèles, rendant les mesures de sécurité actuelles telles que les garde-fous et la RAG insuffisantes.

Zhiyang Chen, Tara Saba, Xun Deng, Xujie Si, Fan Long2026-05-12✓ Author reviewed 🤖 cs.AI

Distributional Learning of Context-Free Languages under Fixed Finite-Monoid Typing

Ce papier établit que les langages hors contexte substituables sous un typage à monoïde fini fixe peuvent être identifiés à la limite à partir de données positives, avec une construction et une mise à jour de l'hypothèse s'exécutant en temps polynomial par rapport à la taille de l'échantillon pour la classe générale à h fixe, et une garantie complète de temps et de données polynomiale (incluant une borne polynomiale sur la taille de l'échantillon caractéristique) pour la sous-classe linéaire, via une théorie de reconstruction typée finie fondée sur une grammaire d'hypothèse canonique dérivée d'un ensemble d'observations fini.

Takayuki Kuriyama2026-05-12✓ Author reviewed 💻 cs

Latent-Space Causal Discovery from Indirect Neuroimaging Observations

Cet article présente INCAMA, un cadre conscient de la physique qui combine l'inversion dans l'espace latent avec un encodeur Mamba sensible aux délais pour reconstruire des structures causales neuronales dirigées à partir de signaux d'imagerie neurologique déformés, démontrant des performances supérieures aux méthodes de référence tant dans les simulations que sur des données fMRI réelles.

Sangyoon Bae, Miruna Oprescu, David Keetae Park, Shinjae Yoo, Jiook Cha2026-05-11✓ Author reviewed 🧬 q-bio

A Quadratic-Form Representation of the Scalar Casimir Trace from Codimension-Three Riesz Reduction

Ce papier établit une représentation sous forme quadratique de la trace scalaire de Casimir en dérivant un noyau de Green induit à partir d'une réduction de Riesz de codimension trois, ce qui permet à l'espérance de l'énergie d'une source gaussienne régularisée par la chaleur de reproduire exactement la trace et confirme les résultats standards de partie finie dans les géométries de plaques parallèles de Dirichlet.

Irshadullah Khan, Bilal Khan2026-05-11✓ Author reviewed 🔢 math