Machine Learning for the Internet of Underwater Things: From Fundamentals to Implementation

Esta encuesta tutorial sintetiza el papel fundamental del aprendizaje automático en la Internet de las Cosas Submarinas (IoUT), analizando sus beneficios en todas las capas de la red, documentando mejoras significativas en eficiencia energética y rendimiento, e identificando los desafíos actuales y futuras direcciones de investigación para su implementación práctica.

Kenechi Omeke, Attai Abubakar, Michael Mollel, Lei Zhang, Qammer H. Abbasi, Muhammad Ali Imran2026-03-10💻 cs

Context Channel Capacity: An Information-Theoretic Framework for Understanding Catastrophic Forgetting

Este trabajo introduce el marco teórico de la "Capacidad del Canal de Contexto" para explicar el olvido catastrófico en el aprendizaje continuo, demostrando que la arquitectura (específicamente la regeneración condicional de parámetros) es más determinante que el algoritmo para lograr un aprendizaje sin olvido y proponiendo nuevas direcciones de investigación basadas en este principio.

Ran Cheng2026-03-10🤖 cs.LG

Dynamic Vehicle Routing Problem with Prompt Confirmation of Advance Requests

Este artículo presenta un nuevo enfoque computacional para el problema de enrutamiento dinámico de vehículos que integra una búsqueda de inserción rápida para la confirmación inmediata de solicitudes anticipadas con un algoritmo de optimización continua guiado por aprendizaje por refuerzo, logrando así aumentar significativamente el número de solicitudes atendidas en servicios de microtránsito en comparación con métodos existentes.

Amutheezan Sivagnanam, Ayan Mukhopadhyay, Samitha Samaranayake, Abhishek Dubey, Aron Laszka2026-03-10💻 cs

OrthoFormer: Instrumental Variable Estimation in Transformer Hidden States via Neural Control Functions

El artículo presenta OrthoFormer, una arquitectura de Transformer fundamentada en la causalidad que integra la estimación de variables instrumentales mediante funciones de control neuronales para separar los factores de confusión latentes de los flujos causales dinámicos, logrando así una reducción de sesgo teórica y una mayor robustez ante cambios de distribución.

Charles Luo2026-03-10🤖 cs.LG

Dial: A Knowledge-Grounded Dialect-Specific NL2SQL System

El artículo presenta Dial, un sistema de NL2SQL basado en conocimiento que aborda la heterogeneidad de los dialectos SQL mediante planificación lógica consciente del dialecto, una base de conocimiento jerárquica y un bucle de depuración, logrando mejoras significativas en precisión y cobertura de características en comparación con los métodos existentes.

Xiang Zhang, Hongming Xu, Le Zhou, Wei Zhou, Xuanhe Zhou, Guoliang Li, Yuyu Luo, Changdong Liu, Guorun Chen, Jiang Liao, Fan Wu2026-03-10🤖 cs.LG

Backdoor4Good: Benchmarking Beneficial Uses of Backdoors in LLMs

El artículo presenta Backdoor4Good (B4G), un marco unificado que reinterpreta los mecanismos de puerta trasera en modelos de lenguaje grandes como interfaces controlables y auditable para mejorar la seguridad, la capacidad de control y la responsabilidad en sistemas de IA, demostrando mediante experimentos que estas técnicas pueden ser beneficiosas y seguras cuando se diseñan adecuadamente.

Yige Li, Wei Zhao, Zhe Li, Nay Myat Min, Hanxun Huang, Yunhan Zhao, Xingjun Ma, Yu-Gang Jiang, Jun Sun2026-03-10💻 cs

"Better Ask for Forgiveness than Permission": Practices and Policies of AI Disclosure in Freelance Work

Este estudio revela que existe una brecha de expectativas en la economía freelance, donde los trabajadores suelen ocultar el uso de la IA esperando ser descubiertos mientras los clientes prefieren la divulgación proactiva, una dinámica agravada por políticas ambiguas que erosionan la confianza y exigen directrices más claras.

Angel Hsing-Chi Hwang, Senya Wong, Baixiao Chen, Jessica He, Hyo Jin Do2026-03-10💻 cs

Where Do LLM-based Systems Break? A System-Level Security Framework for Risk Assessment and Treatment

Este trabajo presenta un marco de evaluación de riesgos impulsado por objetivos que integra el modelado de sistemas con árboles de ataque-defensa y puntuaciones CVSS para analizar y mitigar de manera estructurada las vulnerabilidades en sistemas críticos basados en modelos de lenguaje grande, demostrando su eficacia mediante un estudio de caso en el sector sanitario.

Neha Nagaraja, Hayretdin Bahsi2026-03-10💻 cs

The Dual-Stream Transformer: Channelized Architecture for Interpretable Language Modeling

Este trabajo presenta el Transformador de Doble Flujo, una arquitectura que descompone el flujo residual en dos componentes funcionales distintos para lograr un equilibrio ajustable entre la interpretabilidad y el rendimiento en modelos de lenguaje, demostrando que estrategias de mezcla como la de Kronecker permiten una comunicación eficiente entre cabezas de atención con una pérdida de rendimiento mínima.

J. Clayton Kerce, Alexis Fox2026-03-10🤖 cs.LG

Do Machines Fail Like Humans? A Human-Centred Out-of-Distribution Spectrum for Mapping Error Alignment

Este artículo propone un marco centrado en el humano que redefine el espectro de datos fuera de distribución (OOD) basándose en la dificultad perceptual humana para evaluar de manera más precisa la alineación entre los errores de los modelos de IA y los humanos, revelando que los modelos de visión-lingüística muestran una mayor consistencia en dicha alineación en comparación con las arquitecturas CNN y ViT bajo diferentes condiciones de dificultad.

Binxia Xu, Xiaoliang Luo, Luke Dickens, Robert M. Mok2026-03-10💻 cs

Towards Lightweight Adaptation of Speech Enhancement Models in Real-World Environments

Este trabajo propone un marco de adaptación ligero que, mediante el uso de adaptadores de bajo rango actualizados con aprendizaje auto-supervisado sobre una base congelada, mejora la robustez de los modelos de mejora de voz en entornos acústicos dinámicos con menos del 1% de parámetros actualizados y una rápida convergencia, facilitando su implementación en dispositivos.

Longbiao Cheng, Shih-Chii Liu2026-03-10🤖 cs.LG

Give Them an Inch and They Will Take a Mile:Understanding and Measuring Caller Identity Confusion in MCP-Based AI Systems

Este trabajo demuestra que la falta de autenticación del llamador en los sistemas basados en el Protocolo de Contexto de Modelo (MCP) crea vulnerabilidades de seguridad críticas al permitir que las autorizaciones iniciales se extiendan indebidamente a múltiples entidades no confiables, lo que subraya la necesidad urgente de mecanismos de autenticación explícita y autorización granular.

Yuhang Huang, Boyang Ma, Biwei Yan, Xuelong Dai, Yechao Zhang, Minghui Xu, Kaidi Xu, Yue Zhang2026-03-10💻 cs