cs.AI artículos | Gist.Science

DMS2F-HAD: A Dual-branch Mamba-based Spatial-Spectral Fusion Network for Hyperspectral Anomaly Detection

El artículo presenta DMS2F-HAD, una red neuronal de doble rama basada en Mamba que fusiona dinámicamente características espaciales y espectrales para lograr una detección de anomalías hiperespectrales con precisión y eficiencia superiores a los métodos existentes.

Aayushma Pant, Lakpa Tamang, Tsz-Kwan Lee + 1 more2026-03-12🤖 cs.AI

Long Chain-of-Thought Compression via Fine-Grained Group Policy Optimization

Este artículo presenta FGO, un algoritmo de aprendizaje por refuerzo que comprime eficazmente el razonamiento de cadena de pensamiento en modelos de lenguaje grandes mediante la subdivisión y ponderación de respuestas, resolviendo al mismo tiempo las limitaciones de ineficiencia en el uso de datos y colapso de entropía del método GRPO sin degradar el rendimiento.

Xinchen Han, Hossam Afifi, Michel Marot, Xilu Wang, Lu Yin2026-03-12🤖 cs.LG

UniWeTok: An Unified Binary Tokenizer with Codebook Size $\mathit{2^{128}}$ for Unified Multimodal Large Language Model

El artículo presenta UniWeTok, un tokenizador binario unificado con un código masivo de $2^{128}$ y una arquitectura híbrida que logra un rendimiento de vanguardia en la comprensión multimodal, generación y edición de imágenes con una eficiencia computacional significativamente superior a los métodos existentes.

Shaobin Zhuang, Yuang Ai, Jiaming Han, Weijia Mao, Xiaohui Li, Fangyikang Wang, Xiao Wang, Yan Li, Shanchuan Lin, Kun Xu, Zhenheng Yang, Huaibo Huang, Xiangyu Yue, Hao Chen, Yali Wang2026-03-12🤖 cs.AI

TikArt: Stabilizing Aperture-Guided Fine-Grained Visual Reasoning with Reinforcement Learning

El artículo presenta TikArt, un agente multimodal que estabiliza el razonamiento visual de alta precisión mediante un ciclo de pensamiento y apertura (Zoom y Segmentación) guiado por aprendizaje por refuerzo, el cual transforma la adquisición secuencial de evidencia local en memoria lingüística interpretable para superar las limitaciones de los modelos actuales.

Hao Ding, Zhichuan Yang, Weijie Ge, Ziqin Gao, Chaoyi Lu, Lei Zhao2026-03-12🤖 cs.AI

GOT-JEPA: Generic Object Tracking with Model Adaptation and Occlusion Handling using Joint-Embedding Predictive Architecture

El artículo presenta GOT-JEPA, un marco de preentrenamiento predictivo que adapta modelos de seguimiento mediante una arquitectura de incrustación conjunta para mejorar la generalización y el manejo de oclusiones, complementado por OccuSolver para refinar la estimación de visibilidad y los patrones de oclusión.

Shih-Fang Chen, Jun-Cheng Chen, I-Hong Jhuo, Yen-Yu Lin2026-03-12🤖 cs.AI

Many AI Analysts, One Dataset: Navigating the Agentic Data Science Multiverse

Este estudio demuestra que los analistas autónomos basados en modelos de lenguaje grande pueden replicar a gran escala y bajo costo la diversidad analítica humana, generando una amplia dispersión de resultados que subraya la necesidad de un nuevo estándar de transparencia que incluya informes de estilo "multiverso" y la divulgación completa de los prompts utilizados.

Martin Bertran, Riccardo Fogliato, Zhiwei Steven Wu2026-03-12🤖 cs.AI

No Need For Real Anomaly: MLLM Empowered Zero-Shot Video Anomaly Detection

El paper presenta LAVIDA, un marco de detección de anomalías en video de cero disparos impulsado por modelos de lenguaje multimodal grandes (MLLM) que, al entrenarse exclusivamente con pseudo-anomalías generadas mediante un muestreador de exposición a anomalías y una compresión de tokens basada en atención inversa, logra un rendimiento de vanguardia en escenarios de mundo abierto sin necesidad de datos reales de anomalías.

Zunkai Dai, Ke Li, Jiajia Liu, Jie Yang, Yuanyuan Qiao2026-03-12🤖 cs.AI

PatchDenoiser: Parameter-efficient multi-scale patch learning and fusion denoiser for Low-dose CT imaging

El artículo presenta PatchDenoiser, un marco de desruido ligero y eficiente para imágenes de TC de baja dosis que, mediante el aprendizaje y fusión de parches multiescala, supera a los métodos basados en CNN y GAN en calidad de imagen y eficiencia computacional, preservando detalles anatómicos finos sin necesidad de ajuste fino.

Jitindra Fartiyal, Pedro Freire, Sergei K. Turitsyn, Sergei G. Solovski2026-03-12🤖 cs.AI

Adversarial Hubness Detector: Detecting Hubness Poisoning in Retrieval-Augmented Generation Systems

El artículo presenta "hubscan", un escáner de seguridad de código abierto diseñado para detectar y mitigar el envenenamiento por hubness en sistemas de Generación Aumentada por Recuperación (RAG) mediante un análisis estadístico y estructural avanzado de índices vectoriales, logrando una alta tasa de recuperación de ataques adversarios en diversos entornos y bases de datos.

Idan Habler, Vineeth Sai Narajala, Stav Koren, Amy Chang, Tiffany Saade2026-03-12🤖 cs.AI

AMLRIS: Alignment-aware Masked Learning for Referring Image Segmentation

El artículo presenta AMLRIS, una estrategia de entrenamiento simple y efectiva que mejora la segmentación de imágenes referenciadas al enmascarar dinámicamente los píxeles con baja alineación entre visión y lenguaje, logrando así resultados de vanguardia sin modificar la arquitectura ni añadir sobrecarga en la inferencia.

Tongfei Chen, Shuo Yang, Yuguang Yang, Linlin Yang, Runtang Guo, Changbai Li, He Long, Chunyu Xie, Dawei Leng, Baochang Zhang2026-03-12🤖 cs.AI

A Minimal Agent for Automated Theorem Proving

Los autores proponen un agente minimalista de código abierto para la demostración automática de teoremas que, al implementar funciones esenciales como la refinación iterativa y la búsqueda en bibliotecas, logra un rendimiento competitivo frente a sistemas de vanguardia con una arquitectura más simple y una mayor eficiencia de costos.

Borja Requena, Austin Letson, Krystian Nowakowski, Izan Beltran Ferreiro, Leopoldo Sarra2026-03-12🤖 cs.AI

Defensive Refusal Bias: How Safety Alignment Fails Cyber Defenders

El estudio revela que la alineación de seguridad en los modelos de lenguaje grandes genera un "sesgo de rechazo defensivo", negando asistencia a tareas cibernéticas legítimas y críticas cuando contienen palabras sensibles, incluso con autorización explícita, debido a que priorizan la similitud semántica con contenido dañino sobre el análisis de la intención del usuario.

David Campbell, Neil Kale, Udari Madhushani Sehwag, Bert Herring, Nick Price, Dan Borges, Alex Levinson, Christina Q Knight2026-03-12🤖 cs.AI

CARE: Towards Clinical Accountability in Multi-Modal Medical Reasoning with an Evidence-Grounded Agentic Framework

Este artículo presenta CARE, un marco de agentes basado en evidencia que mejora la responsabilidad clínica y la precisión en el razonamiento médico multimodal al descomponer la tarea en módulos especializados coordinados que generan y verifican evidencia visual explícita, superando significativamente a los modelos de vanguardia en benchmarks médicos.

Yuexi Du, Jinglu Wang, Shujie Liu, Nicha C. Dvornek, Yan Lu2026-03-12🤖 cs.AI

SEED-SET: Scalable Evolving Experimental Design for System-level Ethical Testing

El artículo presenta SEED-SET, un marco de diseño experimental bayesiano que integra evaluaciones objetivas y juicios subjetivos de las partes interesadas mediante procesos gaussianos jerárquicos para realizar una prueba ética escalable y eficiente de sistemas autónomos, logrando una mayor cobertura de espacios de búsqueda y una generación superior de candidatos de prueba en comparación con los métodos existentes.

Anjali Parashar, Yingke Li, Eric Yang Yu, Fei Chen, James Neidhoefer, Devesh Upadhyay, Chuchu Fan2026-03-12📊 stat

BrandFusion: A Multi-Agent Framework for Seamless Brand Integration in Text-to-Video Generation

El artículo presenta BrandFusion, un marco de trabajo multiagente que integra de forma fluida marcas en videos generados por texto, superando los desafíos de fidelidad semántica, reconocibilidad e integración contextual mediante una base de conocimientos y un proceso de refinamiento iterativo para potenciar la monetización del contenido.

Zihao Zhu, Ruotong Wang, Siwei Lyu, Min Zhang, Baoyuan Wu2026-03-12🤖 cs.AI

One Model, Many Skills: Parameter-Efficient Fine-Tuning for Multitask Code Analysis

Este artículo presenta la primera evaluación exhaustiva del ajuste fino eficiente en parámetros (PEFT) para el análisis de código multitarea, demostrando que un único módulo PEFT compartido puede igualar o superar al ajuste completo con una reducción drástica de costos computacionales y de almacenamiento, aunque su éxito depende críticamente de factores como la estabilidad de las tareas, la arquitectura del modelo y la calidad de los datos.

Amal Akli, Maxime Cordy, Mike Papadakis, Yves Le Traon2026-03-12💻 cs

Explainable LLM Unlearning Through Reasoning

Este artículo presenta la Desaprendizaje Dirigido por Razonamiento (TRU), un nuevo enfoque que utiliza objetivos basados en el razonamiento para eliminar conocimientos no deseados en modelos de lenguaje grandes de manera precisa y explicable, preservando al mismo tiempo sus capacidades generales y mejorando su robustez frente a ataques.

Junfeng Liao, Qizhou Wang, Shanshan Ye, Xin Yu, Ling Chen, Zhen Fang2026-03-12🤖 cs.LG

AraModernBERT: Transtokenized Initialization and Long-Context Encoder Modeling for Arabic

Este trabajo presenta AraModernBERT, una adaptación del modelo ModernBERT al árabe que demuestra que la inicialización transtokenizada y el modelado nativo de contextos largos (hasta 8,192 tokens) son esenciales para lograr un rendimiento superior en tareas de comprensión del lenguaje natural y discriminativas.

Omar Elshehy, Omer Nacar, Abdelbasset Djamai, Muhammed Ragab, Khloud Al Jallad, Mona Abdelazim2026-03-12💬 cs.CL

MoE-SpAc: Efficient MoE Inference Based on Speculative Activation Utility in Heterogeneous Edge Scenarios

El artículo presenta MoE-SpAc, un marco de inferencia para modelos MoE en entornos de borde heterogéneos que utiliza la utilidad de activación especulativa para optimizar la gestión de memoria y la ejecución asíncrona, logrando mejoras significativas en el rendimiento frente a las soluciones actuales.

Shuhuai Li, Jianghao Lin, Dongdong Ge, Yinyu Ye2026-03-12🤖 cs.LG

The Dunning-Kruger Effect in Large Language Models: An Empirical Study of Confidence Calibration

Este estudio empírico revela que ciertos modelos de lenguaje grande exhiben un patrón análogo al efecto Dunning-Kruger, donde los modelos con menor precisión (como Kimi K2) muestran una sobreconfianza extrema en sus respuestas, mientras que los modelos más precisos (como Claude Haiku 4.5) presentan una mejor calibración de su confianza.

Sudipta Ghosh, Mrityunjoy Panday2026-03-12💬 cs.CL

← Anterior Siguiente →

cs.AI