Exploring Human-in-the-Loop Themes in AI Application Development: An Empirical Thematic Analysis

Este estudio empírico identifica cuatro temas clave sobre la gobernanza, la iteración, las restricciones operativas y la colaboración en el desarrollo de aplicaciones de IA con intervención humana, derivados del análisis de un diario retrospectivo y entrevistas con expertos, para orientar el diseño de marcos de trabajo efectivos.

Parm Suksakul, Nathan Kittichaikoonkij, Nakhin Polthai, Aung Pyae2026-03-09🤖 cs.AI

From Toil to Thought: Designing for Strategic Exploration and Responsible AI in Systematic Literature Reviews

Este estudio presenta ARC, una herramienta de diseño que integra bases de datos y utiliza IA transparente para reducir la carga cognitiva en las revisiones sistemáticas de literatura, permitiendo a los investigadores pasar de la gestión administrativa a la exploración estratégica y el juicio verificable.

Runlong Ye, Naaz Sibia, Angela Zavaleta Bernuy, Tingting Zhu, Carolina Nobre, Viktoria Pammer-Schindler, Michael Liut2026-03-09🤖 cs.AI

Traversal-as-Policy: Log-Distilled Gated Behavior Trees as Externalized, Verifiable Policies for Safe, Robust, and Efficient Agents

El artículo propone "Traversal-as-Policy", un marco que convierte los registros de ejecución de agentes LLM en árboles de comportamiento con puertas (GBT) ejecutables y verificables, logrando mejorar drásticamente el éxito en tareas complejas, eliminar violaciones de seguridad y reducir costos computacionales al reemplazar la generación libre por una política de control basada en la exploración de macros validadas.

Peiran Li, Jiashuo Sun, Fangzhou Lin, Shuo Xing, Tianfu Fu, Suofei Feng, Chaoqun Ni, Zhengzhong Tu2026-03-09🤖 cs.AI

Molecular Representations for AI in Chemistry and Materials Science: An NLP Perspective

Este artículo ofrece una guía desde la perspectiva de la Procesación del Lenguaje Natural (NLP) sobre las representaciones moleculares digitales más populares y sus aplicaciones en inteligencia artificial para la química y la ciencia de materiales, sirviendo como referencia para investigadores que inician su trabajo en esta intersección disciplinaria.

Sanjanasri JP, Pratiti Bhadra, N. Sukumar, Soman KP2026-03-09🤖 cs.AI

Omni-C: Compressing Heterogeneous Modalities into a Single Dense Encoder

El artículo presenta Omni-C, un único codificador Transformer denso que comprime modalidades heterogéneas en representaciones compartidas mediante preentrenamiento contrastivo, logrando un rendimiento competitivo y una mayor eficiencia de memoria al eliminar la necesidad de arquitecturas complejas como la de expertos múltiples (MoE) o supervisiones emparejadas.

Kin Wai Lau, Yasar Abbas Ur Rehman, Lai-Man Po, Pedro Porto Buarque de Gusmão2026-03-09🤖 cs.AI

On the Reliability of AI Methods in Drug Discovery: Evaluation of Boltz-2 for Structure and Binding Affinity Prediction

Este estudio evalúa el modelo de IA Boltz-2 para la predicción de estructuras y afinidades de unión en el descubrimiento de fármacos, concluyendo que, aunque ofrece velocidad para el cribado inicial, carece de la resolución energética necesaria para la identificación de candidatos y requiere métodos basados en física para su fiabilidad.

Shunzhou Wan, Xibei Zhang, Xiao Xue, Peter V. Coveney2026-03-09🤖 cs.AI

JAWS: Enhancing Long-term Rollout of Neural Operators via Spatially-Adaptive Jacobian Regularization

El artículo presenta JAWS, una estrategia de regularización probabilística que modula dinámicamente la fuerza de la regularización según la complejidad física local para mejorar la estabilidad a largo plazo, la fidelidad de las ondas de choque y la generalización en modelos de operadores neuronales, superando las limitaciones de las técnicas de regularización global y los métodos de optimización de trayectorias de largo horizonte.

Fengxiang Nie, Yasuhiro Suzuki2026-03-09🤖 cs.AI

Human-Data Interaction, Exploration, and Visualization in the AI Era: Challenges and Opportunities

Este artículo examina los desafíos y oportunidades que la era de la IA plantea para la interacción humano-datos y la visualización, destacando la necesidad de trascender las métricas tradicionales y redefinir los roles humanos y artificiales para abordar problemas como la incertidumbre, la latencia y la escalabilidad en el análisis de datos no estructurados.

Jean-Daniel Fekete, Yifan Hu, Dominik Moritz, Arnab Nandi, Senjuti Basu Roy, Eugene Wu, Nikos Bikakis, George Papastefanatos, Panos K. Chrysanthis, Guoliang Li, Lingyun Yu2026-03-09🤖 cs.AI

EigenData: A Self-Evolving Multi-Agent Platform for Function-Calling Data Synthesis, Auditing, and Repair

El documento presenta EigenData, una plataforma multiagente autoevolutiva que automatiza la síntesis, auditoría y reparación de datos para la llamada de funciones, demostrando su eficacia al corregir sistemáticamente el benchmark BFCL-V3 y mejorar la correlación entre las métricas de evaluación y la corrección funcional percibida por humanos.

Jiaao Chen, Jingyuan Qi, Mingye Gao, Wei-Chen Wang, Hanrui Wang, Di Jin2026-03-09✓ Author reviewed 🤖 cs.AI

Towards Efficient and Stable Ocean State Forecasting: A Continuous-Time Koopman Approach

El artículo presenta un autocodificador de Koopman en tiempo continuo (CT-KAE) como un modelo sustituto ligero y estable que supera a las redes Transformer autoregresivas en la predicción a largo plazo de estados oceánicos, logrando un crecimiento de error acotado y una inferencia significativamente más rápida mediante la proyección de dinámicas no lineales a un espacio latente lineal.

Rares Grozavescu, Pengyu Zhang, Mark Girolami, Etienne Meunier2026-03-09🔬 physics.app-ph

When AI Levels the Playing Field: Skill Homogenization, Asset Concentration, and Two Regimes of Inequality

Este artículo presenta un modelo teórico que demuestra cómo la inteligencia artificial genera un aparente paradoja al igualar las habilidades individuales mientras concentra el valor económico en activos complementarios, creando dos regímenes de desigualdad que dependen de la estructura tecnológica y las instituciones laborales, aunque sus predicciones específicas aún carecen de datos empíricos adecuados para ser validadas.

Xupeng Chen, Shuchen Meng2026-03-09🤖 cs.AI

CBR-to-SQL: Rethinking Retrieval-based Text-to-SQL using Case-based Reasoning in the Healthcare Domain

El artículo presenta CBR-to-SQL, un marco basado en razonamiento basado en casos que supera las limitaciones de los enfoques RAG estándar en el dominio de la salud mediante un proceso de recuperación en dos etapas y plantillas abstractas, logrando mayor precisión, eficiencia de muestras y robustez en la traducción de preguntas naturales a SQL para bases de datos de registros electrónicos de salud.

Hung Nguyen, Hans Moen, Pekka Marttinen2026-03-09🤖 cs.AI

PRISM: Personalized Refinement of Imitation Skills for Manipulation via Human Instructions

El artículo presenta PRISM, un método que combina Aprendizaje por Imitación y Aprendizaje por Refuerzo para refinar políticas robóticas mediante instrucciones humanas y correcciones en tiempo real, logrando así una mayor eficiencia en datos, reutilización de políticas y robustez en tareas de manipulación.

Arnau Boix-Granell, Alberto San-Miguel-Tello, Magí Dalmau-Moreno, Néstor García2026-03-09🤖 cs.AI

Tool-Genesis: A Task-Driven Tool Creation Benchmark for Self-Evolving Language Agent

El artículo presenta Tool-Genesis, un nuevo marco de evaluación diagnóstico que mide la capacidad de los agentes de lenguaje para crear herramientas desde cero a partir de requisitos abstractos, revelando que incluso los modelos más avanzados sufren una degradación significativa en el rendimiento final debido a errores iniciales en la generación de interfaces y lógica.

Bowei Xia, Mengkang Hu, Shijian Wang, Jiarui Jin, Wenxiang Jiao, Yuan Lu, Kexin Li, Ping Luo2026-03-09🤖 cs.AI