cs.AI artículos | Gist.Science

Can LLM Aid in Solving Constraints with Inductive Definitions?

Este trabajo propone un enfoque neuro-simbólico que integra modelos de lenguaje grandes con solucionadores de restricciones para generar automáticamente lemas auxiliares, logrando resolver aproximadamente un 25% más de tareas de prueba con definiciones inductivas que las herramientas actuales.

Weizhi Feng, Shidong Shen, Jiaxiang Liu, Taolue Chen, Fu Song, Zhilin Wu2026-03-09🤖 cs.AI

Exploring Human-in-the-Loop Themes in AI Application Development: An Empirical Thematic Analysis

Este estudio empírico identifica cuatro temas clave sobre la gobernanza, la iteración, las restricciones operativas y la colaboración en el desarrollo de aplicaciones de IA con intervención humana, derivados del análisis de un diario retrospectivo y entrevistas con expertos, para orientar el diseño de marcos de trabajo efectivos.

Parm Suksakul, Nathan Kittichaikoonkij, Nakhin Polthai, Aung Pyae2026-03-09🤖 cs.AI

An Embodied Companion for Visual Storytelling

El artículo presenta "Companion", un sistema artístico que integra un robot de dibujo con modelos de lenguaje grandes para fomentar una co-creación bidireccional mediante voz y bocetos, transformando al robot en un colaborador activo capaz de generar obras con identidad estética y mérito expositivo validado por expertos.

Patrick Tresset, Markus Wulfmeier2026-03-09🤖 cs.AI

From Toil to Thought: Designing for Strategic Exploration and Responsible AI in Systematic Literature Reviews

Este estudio presenta ARC, una herramienta de diseño que integra bases de datos y utiliza IA transparente para reducir la carga cognitiva en las revisiones sistemáticas de literatura, permitiendo a los investigadores pasar de la gestión administrativa a la exploración estratégica y el juicio verificable.

Runlong Ye, Naaz Sibia, Angela Zavaleta Bernuy, Tingting Zhu, Carolina Nobre, Viktoria Pammer-Schindler, Michael Liut2026-03-09🤖 cs.AI

Traversal-as-Policy: Log-Distilled Gated Behavior Trees as Externalized, Verifiable Policies for Safe, Robust, and Efficient Agents

El artículo propone "Traversal-as-Policy", un marco que convierte los registros de ejecución de agentes LLM en árboles de comportamiento con puertas (GBT) ejecutables y verificables, logrando mejorar drásticamente el éxito en tareas complejas, eliminar violaciones de seguridad y reducir costos computacionales al reemplazar la generación libre por una política de control basada en la exploración de macros validadas.

Peiran Li, Jiashuo Sun, Fangzhou Lin, Shuo Xing, Tianfu Fu, Suofei Feng, Chaoqun Ni, Zhengzhong Tu2026-03-09🤖 cs.AI

RoboLayout: Differentiable 3D Scene Generation for Embodied Agents

El artículo presenta RoboLayout, una extensión de LayoutVLM que genera diseños de escenas 3D semánticamente coherentes y físicamente viables para agentes encarnados mediante la integración de restricciones de alcanzabilidad diferenciables y un proceso de refinamiento local que adapta el entorno a las capacidades físicas de diversos agentes.

Ali Shamsaddinlou2026-03-09🤖 cs.AI

Molecular Representations for AI in Chemistry and Materials Science: An NLP Perspective

Este artículo ofrece una guía desde la perspectiva de la Procesación del Lenguaje Natural (NLP) sobre las representaciones moleculares digitales más populares y sus aplicaciones en inteligencia artificial para la química y la ciencia de materiales, sirviendo como referencia para investigadores que inician su trabajo en esta intersección disciplinaria.

Sanjanasri JP, Pratiti Bhadra, N. Sukumar, Soman KP2026-03-09🤖 cs.AI

Omni-C: Compressing Heterogeneous Modalities into a Single Dense Encoder

El artículo presenta Omni-C, un único codificador Transformer denso que comprime modalidades heterogéneas en representaciones compartidas mediante preentrenamiento contrastivo, logrando un rendimiento competitivo y una mayor eficiencia de memoria al eliminar la necesidad de arquitecturas complejas como la de expertos múltiples (MoE) o supervisiones emparejadas.

Kin Wai Lau, Yasar Abbas Ur Rehman, Lai-Man Po, Pedro Porto Buarque de Gusmão2026-03-09🤖 cs.AI

Towards Neural Graph Data Management

El artículo presenta NGDBench, un benchmark unificado que evalúa las capacidades de las bases de datos neuronales mediante consultas Cypher complejas en diversos dominios, revelando las limitaciones actuales de los modelos de lenguaje y los métodos RAG en el razonamiento estructurado y la gestión de datos gráficos.

Yufei Li, Yisen Gao, Jiaxin Bai, Jiaxuan Xiong, Haoyu Huang, Zhongwei Xie, Hong Ting Tsang, Yangqiu Song2026-03-09🤖 cs.AI

On the Reliability of AI Methods in Drug Discovery: Evaluation of Boltz-2 for Structure and Binding Affinity Prediction

Este estudio evalúa el modelo de IA Boltz-2 para la predicción de estructuras y afinidades de unión en el descubrimiento de fármacos, concluyendo que, aunque ofrece velocidad para el cribado inicial, carece de la resolución energética necesaria para la identificación de candidatos y requiere métodos basados en física para su fiabilidad.

Shunzhou Wan, Xibei Zhang, Xiao Xue, Peter V. Coveney2026-03-09🤖 cs.AI

JAWS: Enhancing Long-term Rollout of Neural Operators via Spatially-Adaptive Jacobian Regularization

El artículo presenta JAWS, una estrategia de regularización probabilística que modula dinámicamente la fuerza de la regularización según la complejidad física local para mejorar la estabilidad a largo plazo, la fidelidad de las ondas de choque y la generalización en modelos de operadores neuronales, superando las limitaciones de las técnicas de regularización global y los métodos de optimización de trayectorias de largo horizonte.

Fengxiang Nie, Yasuhiro Suzuki2026-03-09🤖 cs.AI

VDCook:DIY video data cook your MLLMs

El artículo presenta VDCook, un sistema operativo de datos de video autoevolutivo que permite a investigadores y equipos especializados generar, actualizar y gestionar conjuntos de datos de entrenamiento para modelos multimodales mediante consultas en lenguaje natural y un mecanismo automatizado de ingestión basado en el Protocolo de Contexto de Modelo (MCP).

Chengwei Wu2026-03-09🤖 cs.AI

Human-Data Interaction, Exploration, and Visualization in the AI Era: Challenges and Opportunities

Este artículo examina los desafíos y oportunidades que la era de la IA plantea para la interacción humano-datos y la visualización, destacando la necesidad de trascender las métricas tradicionales y redefinir los roles humanos y artificiales para abordar problemas como la incertidumbre, la latencia y la escalabilidad en el análisis de datos no estructurados.

Jean-Daniel Fekete, Yifan Hu, Dominik Moritz, Arnab Nandi, Senjuti Basu Roy, Eugene Wu, Nikos Bikakis, George Papastefanatos, Panos K. Chrysanthis, Guoliang Li, Lingyun Yu2026-03-09🤖 cs.AI

EigenData: A Self-Evolving Multi-Agent Platform for Function-Calling Data Synthesis, Auditing, and Repair

El documento presenta EigenData, una plataforma multiagente autoevolutiva que automatiza la síntesis, auditoría y reparación de datos para la llamada de funciones, demostrando su eficacia al corregir sistemáticamente el benchmark BFCL-V3 y mejorar la correlación entre las métricas de evaluación y la corrección funcional percibida por humanos.

Jiaao Chen, Jingyuan Qi, Mingye Gao, Wei-Chen Wang, Hanrui Wang, Di Jin2026-03-09✓ Author reviewed ⓘ🤖 cs.AI

Towards Efficient and Stable Ocean State Forecasting: A Continuous-Time Koopman Approach

El artículo presenta un autocodificador de Koopman en tiempo continuo (CT-KAE) como un modelo sustituto ligero y estable que supera a las redes Transformer autoregresivas en la predicción a largo plazo de estados oceánicos, logrando un crecimiento de error acotado y una inferencia significativamente más rápida mediante la proyección de dinámicas no lineales a un espacio latente lineal.

Rares Grozavescu, Pengyu Zhang, Mark Girolami, Etienne Meunier2026-03-09🔬 physics.app-ph

Model Change for Description Logic Concepts

Este artículo presenta el concepto de cambio de modelo para conceptos de lógica descriptiva, distinguiendo entre expulsión, recepción y revisión, y demuestra que la revisión no es simplemente una combinación de las otras dos operaciones, proporcionando además resultados sobre su compatibilidad en las lógicas EL y ALC.

Ana Ozaki, Jandson S. Ribeiro2026-03-09🤖 cs.AI

When AI Levels the Playing Field: Skill Homogenization, Asset Concentration, and Two Regimes of Inequality

Este artículo presenta un modelo teórico que demuestra cómo la inteligencia artificial genera un aparente paradoja al igualar las habilidades individuales mientras concentra el valor económico en activos complementarios, creando dos regímenes de desigualdad que dependen de la estructura tecnológica y las instituciones laborales, aunque sus predicciones específicas aún carecen de datos empíricos adecuados para ser validadas.

Xupeng Chen, Shuchen Meng2026-03-09🤖 cs.AI

CBR-to-SQL: Rethinking Retrieval-based Text-to-SQL using Case-based Reasoning in the Healthcare Domain

El artículo presenta CBR-to-SQL, un marco basado en razonamiento basado en casos que supera las limitaciones de los enfoques RAG estándar en el dominio de la salud mediante un proceso de recuperación en dos etapas y plantillas abstractas, logrando mayor precisión, eficiencia de muestras y robustez en la traducción de preguntas naturales a SQL para bases de datos de registros electrónicos de salud.

Hung Nguyen, Hans Moen, Pekka Marttinen2026-03-09🤖 cs.AI

PRISM: Personalized Refinement of Imitation Skills for Manipulation via Human Instructions

El artículo presenta PRISM, un método que combina Aprendizaje por Imitación y Aprendizaje por Refuerzo para refinar políticas robóticas mediante instrucciones humanas y correcciones en tiempo real, logrando así una mayor eficiencia en datos, reutilización de políticas y robustez en tareas de manipulación.

Arnau Boix-Granell, Alberto San-Miguel-Tello, Magí Dalmau-Moreno, Néstor García2026-03-09🤖 cs.AI

Tool-Genesis: A Task-Driven Tool Creation Benchmark for Self-Evolving Language Agent

El artículo presenta Tool-Genesis, un nuevo marco de evaluación diagnóstico que mide la capacidad de los agentes de lenguaje para crear herramientas desde cero a partir de requisitos abstractos, revelando que incluso los modelos más avanzados sufren una degradación significativa en el rendimiento final debido a errores iniciales en la generación de interfaces y lógica.

Bowei Xia, Mengkang Hu, Shijian Wang, Jiarui Jin, Wenxiang Jiao, Yuan Lu, Kexin Li, Ping Luo2026-03-09🤖 cs.AI

← Anterior Siguiente →