cs.AI artículos | Gist.Science

Memory, Benchmark & Robots: A Benchmark for Solving Complex Tasks with Reinforcement Learning

Este trabajo presenta MIKASA, un marco unificado y un nuevo conjunto de 32 tareas de manipulación robótica diseñadas para evaluar sistemáticamente las capacidades de memoria de los agentes de aprendizaje por refuerzo en entornos complejos y parcialmente observables.

Egor Cherepanov, Nikita Kachaev, Alexey K. Kovalev + 1 more2026-03-05🤖 cs.AI

Space-O-RAN: Enabling Intelligent, Open, and Interoperable Non Terrestrial Networks in 6G

Este artículo presenta Space-O-RAN, una arquitectura de control distribuida que extiende los principios de Open RAN a las constelaciones de satélites mediante aplicaciones descentralizadas ligeras y coordinación jerárquica para habilitar redes no terrestres inteligentes, abiertas e interoperables en el contexto de la 6G.

Eduardo Baena, Paolo Testolina, Michele Polese + 3 more2026-03-05🤖 cs.AI

Leveraging Taxonomy Similarity for Next Activity Prediction in Patient Treatment

Este artículo propone el enfoque TS4NAP, que utiliza taxonomías médicas (ICD-10-CM e ICD-10-PCS) combinadas con coincidencia de grafos para predecir y explicar el siguiente paso en el tratamiento de pacientes, demostrando su eficacia mediante el conjunto de datos MIMIC-IV para mejorar la planificación médica.

Martin Kuhn, Joscha Grüger, Tobias Geyer + 1 more2026-03-05🤖 cs.AI

Safety Guardrails for LLM-Enabled Robots

El artículo presenta RoboGuard, una arquitectura de dos etapas que combina un modelo de lenguaje seguro con razonamiento de cadena de pensamiento y síntesis de control lógico temporal para contextualizar reglas de seguridad y prevenir comportamientos peligrosos en robots impulsados por modelos de lenguaje grandes, logrando reducir drásticamente la ejecución de planes inseguros ante ataques sin comprometer el rendimiento en tareas seguras.

Zachary Ravichandran, Alexander Robey, Vijay Kumar + 2 more2026-03-05🤖 cs.AI

OSCAR: Online Soft Compression And Reranking

El artículo presenta OSCAR, un método novedoso de compresión en línea dependiente de la consulta y reordenamiento que reduce significativamente el costo computacional de los sistemas RAG sin sacrificar la precisión, logrando aceleraciones de 2 a 5 veces en modelos de lenguaje de gran tamaño.

Maxime Louis, Thibault Formal, Hervé Dejean + 1 more2026-03-05🤖 cs.AI

MuRAL: A Multi-Resident Ambient Sensor Dataset Annotated with Natural Language for Activities of Daily Living

MuRAL es un nuevo conjunto de datos de sensores ambientales para múltiples residentes que incluye descripciones en lenguaje natural y anotaciones detalladas, diseñado para evaluar y revelar las limitaciones actuales de los modelos de lenguaje grandes en tareas de comprensión de actividades diarias en entornos inteligentes complejos.

Xi Chen, Julien Cumin, Fano Ramparany + 1 more2026-03-05🤖 cs.AI

Synthetic emotions and consciousness: exploring architectural boundaries

Este artículo propone un modelo arquitectónico modular de emociones sintéticas que, al integrar señales motivacionales y memoria episódica bajo cuatro restricciones de ingeniería diseñadas para excluir características de la conciencia, demuestra la viabilidad de implementar control emocional sin riesgo de instantiar conciencia accesible, ofreciendo así un marco para auditorías de seguridad y gobernanza de IA.

Hermann Borotschnig2026-03-05🤖 cs.AI

When Your Own Output Becomes Your Training Data: Noise-to-Meaning Loops and a Formal RSI Trigger

El artículo presenta N2M-RSI, un modelo formal que demuestra cómo un agente de IA que utiliza sus propias salidas como datos de entrenamiento puede experimentar un crecimiento ilimitado de su complejidad interna al superar un umbral de integración de información, unificando conceptos como la auto-prompting y la autorreferencia gödeliana.

Rintaro Ando2026-03-05🤖 cs.AI

TPK: Trustworthy Trajectory Prediction Integrating Prior Knowledge For Interpretability and Kinematic Feasibility

El artículo propone TPK, un modelo de predicción de trayectorias confiable para la conducción autónoma que integra conocimientos previos sobre interacciones y cinemática específicos para vehículos, peatones y ciclistas, mejorando la interpretabilidad y garantizando la viabilidad física de las predicciones en escenarios de tráfico mixto.

Marius Baden, Ahmed Abouelazm, Christian Hubschneider + 3 more2026-03-05🤖 cs.AI

Emotion-Gradient Metacognitive RSI (Part I): Theoretical Foundations and Single-Agent Architecture

Este artículo establece los fundamentos teóricos y la arquitectura de un solo agente del marco EG-MRSI, el cual integra metacognición introspectiva, motivación intrínseca basada en emociones y auto-modificación recursiva bajo límites de riesgo formalmente definidos para guiar el desarrollo seguro de una IA general.

Rintaro Ando2026-03-05🤖 cs.AI

Unsupervised Representation Learning - an Invariant Risk Minimization Perspective

Los autores proponen un nuevo marco de aprendizaje de representaciones no supervisado basado en la Minimización de Riesgo Invariante (IRM) que, mediante los métodos PICA y VIAE, aprende características robustas y alineadas sin necesidad de etiquetas para generalizar eficazmente entre diferentes entornos.

Yotam Norman, Ron Meir2026-03-05✓ Author reviewed ⓘ🤖 cs.AI

TSPulse: Tiny Pre-Trained Models with Disentangled Representations for Rapid Time-Series Analysis

TSPulse es una familia de modelos preentrenados ultraligeros que, mediante representaciones desacopladas en los dominios temporal, espectral y semántico junto con una estrategia de enmascaramiento híbrido, logra un rendimiento superior en tareas de diagnóstico de series temporales y transferencia cero-shot, superando a modelos mucho más grandes con una eficiencia computacional notable.

Vijay Ekambaram, Subodh Kumar, Arindam Jati + 5 more2026-03-05🤖 cs.AI

Extremely Simple Multimodal Outlier Synthesis for Out-of-Distribution Detection and Segmentation

Este trabajo presenta "Feature Mixing", un método multimodal extremadamente simple y rápido para la síntesis de valores atípicos que mejora la detección y segmentación de datos fuera de distribución, junto con el nuevo conjunto de datos CARLA-OOD, logrando un rendimiento de vanguardia con una aceleración de hasta 370 veces en comparación con métodos anteriores.

Moru Liu, Hao Dong, Jessica Kelly + 2 more2026-03-05🤖 cs.AI

SafeDPO: A Simple Approach to Direct Preference Optimization with Enhanced Safety

El artículo presenta SafeDPO, un método ligero y teóricamente fundamentado que optimiza directamente la alineación de seguridad en modelos de lenguaje grandes utilizando solo datos de preferencia e indicadores de seguridad, eliminando la necesidad de modelos de recompensa o muestreo en línea mientras logra un equilibrio competitivo entre seguridad y utilidad.

Geon-Hyeong Kim, Yu Jin Kim, Byoungjip Kim + 4 more2026-03-05🤖 cs.AI

RLJP: Legal Judgment Prediction via First-Order Logic Rule-enhanced with Large Language Models

Este artículo presenta RLJP, un marco de predicción de fallos legales que combina reglas de lógica de primer orden y aprendizaje contrastivo para superar las limitaciones de rigidez de los enfoques anteriores y mejorar la precisión en casos complejos mediante un mecanismo adaptativo inspirado en la preparación de exámenes.

Yue Zhang, Zhiliang Tian, Shicheng Zhou + 7 more2026-03-05🤖 cs.AI

R1-Code-Interpreter: LLMs Reason with Code via Supervised and Multi-stage Reinforcement Learning

El artículo presenta R1-Code-Interpreter, un modelo de lenguaje entrenado mediante ajuste fino supervisado y aprendizaje por refuerzo multi-etapa que, al utilizar un enfoque de aprendizaje curricular para gestionar tareas heterogéneas, logra superar a modelos avanzados como GPT-4o en precisión y demostrar comportamientos emergentes de autoverificación mediante la ejecución autónoma de código.

Yongchao Chen, Yueying Liu, Junwei Zhou + 5 more2026-03-05🤖 cs.AI

Boosting In-Context Learning in LLMs Through the Lens of Classical Supervised Learning

Este artículo propone Supervised Calibration (SC), un marco unificado basado en la minimización de pérdidas que supera las limitaciones de los métodos de calibración actuales en el aprendizaje en contexto (ICL) al aprender transformaciones afines óptimas que pueden alterar la orientación de los límites de decisión de los LLM, logrando así un rendimiento superior en múltiples conjuntos de datos y modelos.

Korel Gundem, Juncheng Dong, Dennis Zhang + 2 more2026-03-05🤖 cs.AI

AutoQD: Automatic Discovery of Diverse Behaviors with Quality-Diversity Optimization

El artículo presenta AutoQD, un enfoque teóricamente fundamentado que automatiza el descubrimiento de comportamientos diversos en procesos de decisión de Markov mediante la generación de descriptores conductuales derivados de medidas de ocupación, eliminando así la necesidad de definir manualmente dichos descriptores.

Saeed Hedayatian, Stefanos Nikolaidis2026-03-05🤖 cs.AI

Robust Adversarial Quantification via Conflict-Aware Evidential Deep Learning

El artículo presenta C-EDL, un enfoque ligero y pos-hoc que mejora la robustez de la Aprendizaje Evidencial frente a ataques adversarios y datos fuera de distribución mediante la cuantificación de desacuerdos representacionales, logrando reducciones significativas en la cobertura de errores sin necesidad de reentrenamiento.

Charmaine Barker, Daniel Bethell, Simos Gerasimou2026-03-05🤖 cs.AI

LeanTutor: Towards a Verified AI Mathematical Proof Tutor

Este artículo presenta LeanTutor, un prototipo de tutor de demostraciones matemáticas basado en IA que combina las capacidades de los modelos de lenguaje grandes con la corrección verificable de los demostradores de teoremas Lean, y lo evalúa mediante el nuevo conjunto de datos PeanoBench.

Manooshree Patel, Rayna Bhattacharyya, Thomas Lu + 4 more2026-03-05🤖 cs.AI

← Anterior Siguiente →