cs.AI artículos | Gist.Science

A Boltzmann-machine-enhanced Transformer For DNA Sequence Classification

Este artículo propone un Transformer mejorado con máquinas de Boltzmann para la clasificación de secuencias de ADN, que integra variables de compuerta binarias estructuradas y una función de energía para descubrir dependencias de alto orden e interacciones combinatorias mediante inferencia variacional y relajación Gumbel-Softmax, logrando así un equilibrio entre precisión predictiva y estructuras interpretables.

Zhixuan Cao, Yishu Xu, Xuang WU2026-03-30🤖 cs.LG

UNIFERENCE: A Discrete Event Simulation Framework for Developing Distributed AI Models

El documento presenta UNIFERENCE, un marco de simulación de eventos discretos que permite desarrollar, evaluar y desplegar modelos de IA distribuidos en un entorno unificado, ofreciendo una precisión del 98,6% frente a implementaciones físicas y facilitando la transición directa del código de simulación a PyTorch Distributed para su ejecución en hardware real.

Do\u{g}aç Eldenk, Stephen Xia2026-03-30🤖 cs.AI

Foundation Model for Cardiac Time Series via Masked Latent Attention

El artículo presenta LAMAE, un modelo fundacional de autoencoder enmascarado con atención latente que mejora la representación y transferibilidad de las señales electrocardiográficas al explotar explícitamente las conexiones estructurales entre las derivaciones durante el preentrenamiento auto-supervisado.

Moritz Vandenhirtz, Samuel Ruipérez-Campillo, Simon Böhi, Sonia Laguna, Irene Cannistraci, Andrea Agostini, Ece Ozkan, Thomas M. Sutter, Julia E. Vogt2026-03-30⚡ eess

Rocks, Pebbles and Sand: Modality-aware Scheduling for Multimodal Large Language Model Inference

El artículo presenta RPS-Serve, un planificador consciente de la modalidad que optimiza la inferencia de modelos de lenguaje grandes multimodales al gestionar dinámicamente la heterogeneidad de las solicitudes (texto, imágenes y video) para reducir significativamente la latencia y evitar el bloqueo de cola, logrando una respuesta interactiva similar a la de los modelos de texto puro.

Konstantinos Papaioannou, Thaleia Dimitra Doudali2026-03-30🤖 cs.AI

AIRA_2: Overcoming Bottlenecks in AI Research Agents

El paper presenta AIRA₂, un agente de investigación de IA que supera los cuellos de botella estructurales existentes mediante un pool de trabajadores asíncronos, un protocolo de evaluación oculta consistente y agentes ReAct interactivos, logrando un rendimiento superior en MLE-bench-30 al demostrar que el "sobreajuste" previo se debía a ruido en la evaluación y no a la memorización de datos.

Karen Hambardzumyan, Nicolas Baldwin, Edan Toledo, Rishi Hazra, Michael Kuchnik, Bassel Al Omari, Thomas Simon Foster, Anton Protopopov, Jean-Christophe Gagnon-Audet, Ishita Mediratta, Kelvin Niu, Mic (…)2026-03-30🤖 cs.AI

AMALIA Technical Report: A Fully Open Source Large Language Model for European Portuguese

El artículo presenta AMALIA, un modelo de lenguaje grande de código abierto diseñado específicamente para el portugués europeo mediante el uso de datos de alta calidad en esta variante y la creación de un nuevo conjunto de evaluaciones nativas que demuestran su superioridad frente a los enfoques tradicionales.

Afonso Simplício, Gonçalo Vinagre, Miguel Moura Ramos, Diogo Tavares, Rafael Ferreira, Giuseppe Attanasio, Duarte M. Alves, Inês Calvo, Inês Vieira, Rui Guerra, James Furtado, Beatriz Canave (…)2026-03-30💬 cs.CL

CADSmith: Multi-Agent CAD Generation with Programmatic Geometric Validation

El paper presenta CADSmith, un sistema multiagente que genera modelos CAD mediante código CadQuery y los refina iterativamente mediante bucles de corrección anidados que combinan validación geométrica programática y evaluación visual, logrando una precisión y fiabilidad significativamente superiores a los métodos de un solo paso.

Jesse Barkley, Rumi Loghmani, Amir Barati Farimani2026-03-30🤖 cs.AI

JAL-Turn: Joint Acoustic-Linguistic Modeling for Real-Time and Robust Turn-Taking Detection in Full-Duplex Spoken Dialogue Systems

El paper presenta JAL-Turn, un marco ligero y eficiente que utiliza un modelado conjunto acústico-lingüístico para detectar el cambio de turno en sistemas de diálogo a tiempo completo sin añadir latencia, superando a los métodos actuales en precisión y rendimiento en tiempo real.

Guangzhao Yang, Yu Pan, Shi Qiu, Ningjie Bai2026-03-30💬 cs.CL

ALBA: A European Portuguese Benchmark for Evaluating Language and Linguistic Dimensions in Generative LLMs

Este artículo presenta ALBA, un nuevo benchmark construido manualmente por expertos lingüísticos para evaluar el dominio del portugués europeo (pt-PT) en modelos de lenguaje generativo a través de ocho dimensiones lingüísticas, abordando la carencia actual de recursos específicos para esta variedad frente al predominio del portugués brasileño.

Inês Vieira, Inês Calvo, Iago Paulo, James Furtado, Rafael Ferreira, Diogo Tavares, Diogo Glória-Silva, David Semedo, João Magalhães2026-03-30💬 cs.CL

Stabilizing Rubric Integration Training via Decoupled Advantage Normalization

El artículo propone PAPO, un método que integra la evaluación a nivel de proceso en la optimización de políticas mediante una normalización de ventajas desacoplada para superar las limitaciones de los modelos de recompensa de resultado y proceso, logrando así mejorar tanto la precisión como la calidad del razonamiento en benchmarks complejos.

Zelin Tan, Zhouliang Yu, Bohan Lin, Zijie Geng, Hejia Geng, Yudong Zhang, Mulei Zhang, Yang Chen, Shuyue Hu, Zhenfei Yin, Chen Zhang, Lei Bai2026-03-30🤖 cs.AI

← Anterior Siguiente →