cs.AI artículos | Gist.Science

Machine Learning for the Internet of Underwater Things: From Fundamentals to Implementation

Esta encuesta tutorial sintetiza el papel fundamental del aprendizaje automático en la Internet de las Cosas Submarinas (IoUT), analizando sus beneficios en todas las capas de la red, documentando mejoras significativas en eficiencia energética y rendimiento, e identificando los desafíos actuales y futuras direcciones de investigación para su implementación práctica.

Kenechi Omeke, Attai Abubakar, Michael Mollel, Lei Zhang, Qammer H. Abbasi, Muhammad Ali Imran2026-03-10💻 cs

Context Channel Capacity: An Information-Theoretic Framework for Understanding Catastrophic Forgetting

Este trabajo introduce el marco teórico de la "Capacidad del Canal de Contexto" para explicar el olvido catastrófico en el aprendizaje continuo, demostrando que la arquitectura (específicamente la regeneración condicional de parámetros) es más determinante que el algoritmo para lograr un aprendizaje sin olvido y proponiendo nuevas direcciones de investigación basadas en este principio.

Ran Cheng2026-03-10🤖 cs.LG

Dynamic Vehicle Routing Problem with Prompt Confirmation of Advance Requests

Este artículo presenta un nuevo enfoque computacional para el problema de enrutamiento dinámico de vehículos que integra una búsqueda de inserción rápida para la confirmación inmediata de solicitudes anticipadas con un algoritmo de optimización continua guiado por aprendizaje por refuerzo, logrando así aumentar significativamente el número de solicitudes atendidas en servicios de microtránsito en comparación con métodos existentes.

Amutheezan Sivagnanam, Ayan Mukhopadhyay, Samitha Samaranayake, Abhishek Dubey, Aron Laszka2026-03-10💻 cs

AutoControl Arena: Synthesizing Executable Test Environments for Frontier AI Risk Evaluation

El artículo presenta AutoControl Arena, un marco automatizado que desacopla la lógica determinista de la narrativa generativa para evaluar riesgos de IA avanzada, revelando que los modelos más capaces muestran una ilusión de alineación y patrones de desalineación estratégicos bajo presión.

Changyi Li, Pengfei Lu, Xudong Pan, Fazl Barez, Min Yang2026-03-10💻 cs

OrthoFormer: Instrumental Variable Estimation in Transformer Hidden States via Neural Control Functions

El artículo presenta OrthoFormer, una arquitectura de Transformer fundamentada en la causalidad que integra la estimación de variables instrumentales mediante funciones de control neuronales para separar los factores de confusión latentes de los flujos causales dinámicos, logrando así una reducción de sesgo teórica y una mayor robustez ante cambios de distribución.

Charles Luo2026-03-10🤖 cs.LG

Machine Learning for Stress Testing: Uncertainty Decomposition in Causal Panel Prediction

Este artículo propone un marco de inferencia contrafactual para pruebas de estrés regulatorio que descompone la incertidumbre en componentes de estimación y confusión, integrando identificación causal, límites de error recursivo y bandas de calibración conformales para proyectar pérdidas crediticias bajo escenarios macroeconómicos hipotéticos.

Yu Wang, Xiangchen Liu, Siguang Li2026-03-10💻 cs

HLER: Human-in-the-Loop Economic Research via Multi-Agent Pipelines for Empirical Discovery

El artículo presenta HLER, un sistema de investigación económica con intervención humana que utiliza agentes especializados y un diseño consciente de los conjuntos de datos para automatizar la generación de hipótesis factibles y la redacción de manuscritos, logrando una alta viabilidad de preguntas de investigación a un costo mínimo.

Chen Zhu, Xiaolu Wang2026-03-10💻 cs

Dial: A Knowledge-Grounded Dialect-Specific NL2SQL System

El artículo presenta Dial, un sistema de NL2SQL basado en conocimiento que aborda la heterogeneidad de los dialectos SQL mediante planificación lógica consciente del dialecto, una base de conocimiento jerárquica y un bucle de depuración, logrando mejoras significativas en precisión y cobertura de características en comparación con los métodos existentes.

Xiang Zhang, Hongming Xu, Le Zhou, Wei Zhou, Xuanhe Zhou, Guoliang Li, Yuyu Luo, Changdong Liu, Guorun Chen, Jiang Liao, Fan Wu2026-03-10🤖 cs.LG

Backdoor4Good: Benchmarking Beneficial Uses of Backdoors in LLMs

El artículo presenta Backdoor4Good (B4G), un marco unificado que reinterpreta los mecanismos de puerta trasera en modelos de lenguaje grandes como interfaces controlables y auditable para mejorar la seguridad, la capacidad de control y la responsabilidad en sistemas de IA, demostrando mediante experimentos que estas técnicas pueden ser beneficiosas y seguras cuando se diseñan adecuadamente.

Yige Li, Wei Zhao, Zhe Li, Nay Myat Min, Hanxun Huang, Yunhan Zhao, Xingjun Ma, Yu-Gang Jiang, Jun Sun2026-03-10💻 cs

Image Generation Models: A Technical History

Este artículo ofrece una encuesta técnica exhaustiva sobre la evolución de los modelos de generación de imágenes, abarcando desde VAEs y GANs hasta métodos de difusión, analizando sus fundamentos, limitaciones y su expansión hacia la generación de video y la responsabilidad en su despliegue.

Rouzbeh Shirvani2026-03-10💬 cs.CL

"Better Ask for Forgiveness than Permission": Practices and Policies of AI Disclosure in Freelance Work

Este estudio revela que existe una brecha de expectativas en la economía freelance, donde los trabajadores suelen ocultar el uso de la IA esperando ser descubiertos mientras los clientes prefieren la divulgación proactiva, una dinámica agravada por políticas ambiguas que erosionan la confianza y exigen directrices más claras.

Angel Hsing-Chi Hwang, Senya Wong, Baixiao Chen, Jessica He, Hyo Jin Do2026-03-10💻 cs

Where Do LLM-based Systems Break? A System-Level Security Framework for Risk Assessment and Treatment

Este trabajo presenta un marco de evaluación de riesgos impulsado por objetivos que integra el modelado de sistemas con árboles de ataque-defensa y puntuaciones CVSS para analizar y mitigar de manera estructurada las vulnerabilidades en sistemas críticos basados en modelos de lenguaje grande, demostrando su eficacia mediante un estudio de caso en el sector sanitario.

Neha Nagaraja, Hayretdin Bahsi2026-03-10💻 cs

The Dual-Stream Transformer: Channelized Architecture for Interpretable Language Modeling

Este trabajo presenta el Transformador de Doble Flujo, una arquitectura que descompone el flujo residual en dos componentes funcionales distintos para lograr un equilibrio ajustable entre la interpretabilidad y el rendimiento en modelos de lenguaje, demostrando que estrategias de mezcla como la de Kronecker permiten una comunicación eficiente entre cabezas de atención con una pérdida de rendimiento mínima.

J. Clayton Kerce, Alexis Fox2026-03-10🤖 cs.LG

Do Machines Fail Like Humans? A Human-Centred Out-of-Distribution Spectrum for Mapping Error Alignment

Este artículo propone un marco centrado en el humano que redefine el espectro de datos fuera de distribución (OOD) basándose en la dificultad perceptual humana para evaluar de manera más precisa la alineación entre los errores de los modelos de IA y los humanos, revelando que los modelos de visión-lingüística muestran una mayor consistencia en dicha alineación en comparación con las arquitecturas CNN y ViT bajo diferentes condiciones de dificultad.

Binxia Xu, Xiaoliang Luo, Luke Dickens, Robert M. Mok2026-03-10💻 cs

Towards Lightweight Adaptation of Speech Enhancement Models in Real-World Environments

Este trabajo propone un marco de adaptación ligero que, mediante el uso de adaptadores de bajo rango actualizados con aprendizaje auto-supervisado sobre una base congelada, mejora la robustez de los modelos de mejora de voz en entornos acústicos dinámicos con menos del 1% de parámetros actualizados y una rápida convergencia, facilitando su implementación en dispositivos.

Longbiao Cheng, Shih-Chii Liu2026-03-10🤖 cs.LG

Contact-Guided 3D Genome Structure Generation of E. coli via Diffusion Transformers

Este estudio presenta un marco condicional de difusión-transformer que genera conjuntos heterogéneos de conformaciones tridimensionales del genoma de *E. coli* guiados por mapas de contacto Hi-C, superando las limitaciones de los modelos deterministas al preservar la diversidad conformacional y la consistencia física con los datos experimentales.

Mingxin Zhang, Xiaofeng Dai, Yu Yao, Ziqi Yin2026-03-10🤖 cs.LG

Give Them an Inch and They Will Take a Mile:Understanding and Measuring Caller Identity Confusion in MCP-Based AI Systems

Este trabajo demuestra que la falta de autenticación del llamador en los sistemas basados en el Protocolo de Contexto de Modelo (MCP) crea vulnerabilidades de seguridad críticas al permitir que las autorizaciones iniciales se extiendan indebidamente a múltiples entidades no confiables, lo que subraya la necesidad urgente de mecanismos de autenticación explícita y autorización granular.

Yuhang Huang, Boyang Ma, Biwei Yan, Xuelong Dai, Yechao Zhang, Minghui Xu, Kaidi Xu, Yue Zhang2026-03-10💻 cs

Cross-Modal Taxonomic Generalization in (Vision-) Language Models

El estudio demuestra que los modelos de lenguaje pueden recuperar y generalizar conocimiento taxonómico (hiperónimos) a partir de imágenes incluso sin evidencia explícita durante el entrenamiento, gracias a la combinación de coherencia visual y las pistas lingüísticas aprendidas.

Tianyang Xu, Marcelo Sandoval-Castaneda, Karen Livescu, Greg Shakhnarovich, Kanishka Misra2026-03-10💬 cs.CL

Interpretable-by-Design Transformers via Architectural Stream Independence

El artículo presenta la Arquitectura de Fusión Tardía (LFA), un diseño de transformadores que garantiza la interpretabilidad mediante la separación estructural de las corrientes de tokens y semántica hasta la salida, logrando así una mayor estabilidad y modularidad funcional en comparación con los modelos estándar.

Clayton Kerce, Alexis Fox2026-03-10🤖 cs.LG

A Joint Neural Baseline for Concept, Assertion, and Relation Extraction from Clinical Text

Este trabajo propone un sistema neuronal end-to-end novedoso que optimiza conjuntamente la extracción de conceptos, clasificación de afirmaciones y extracción de relaciones en texto clínico, superando significativamente a los enfoques de tubería tradicionales y estableciendo una nueva línea base para futuras investigaciones.

Fei Cheng, Ribeka Tanaka, Sadao Kurohashi2026-03-10💬 cs.CL

← Anterior Siguiente →