cs.AI artículos | Gist.Science

3D-RFT: Reinforcement Fine-Tuning for Video-based 3D Scene Understanding

El artículo presenta 3D-RFT, un marco pionero que aplica el Aprendizaje por Refuerzo con Recompensas Verificables (RLVR) a la comprensión de escenas 3D basadas en video, optimizando directamente los modelos multimodales mediante funciones de recompensa derivadas de métricas de evaluación para lograr un rendimiento superior al estado del arte en tareas de percepción y razonamiento espacial.

Xiongkun Linghu, Jiangyong Huang, Baoxiong Jia + 1 more2026-03-06🤖 cs.AI

Rethinking Representativeness and Diversity in Dynamic Data Selection

Este artículo propone un marco de selección dinámica de datos que redefine la representatividad y la diversidad basándose en la cobertura de factores de características y en la rotación de muestras durante el entrenamiento, logrando acelerar el proceso de formación en más de dos veces sin comprometer la precisión en diversas tareas de visión y texto.

Yuzhe Zhou, Zhenglin Hua, Haiyun Guo + 1 more2026-03-06🤖 cs.AI

Training for Technology: Adoption and Productive Use of Generative AI in Legal Analysis

Un estudio aleatorizado con estudiantes de derecho demuestra que una breve capacitación específica aumenta significativamente tanto la adopción como el rendimiento en el uso de la inteligencia artificial generativa para análisis legales, mientras que el acceso sin dicha formación no mejora el desempeño.

Benjamin M. Chen, Hong Bao2026-03-06✓ Author reviewed ⓘ🤖 cs.AI

Debiasing Sequential Recommendation with Time-aware Inverse Propensity Scoring

Este artículo propone TIPS, un método de puntuación inversa por propensión consciente del tiempo que corrige los sesgos de selección y exposición en la recomendación secuencial al modelar las dependencias temporales y dinámicas del comportamiento del usuario, mejorando así el rendimiento de diversos modelos existentes.

Sirui Huang, Jing Long, Qian Li + 2 more2026-03-06🤖 cs.AI

Poisoning the Inner Prediction Logic of Graph Neural Networks for Clean-Label Backdoor Attacks

Este artículo presenta BA-Logic, un nuevo método de ataque de puerta trasera con etiquetas limpias para Redes Neuronales de Grafos que supera a las técnicas existentes al envenenar eficazmente la lógica interna de predicción del modelo sin necesidad de modificar las etiquetas de entrenamiento.

Yuxiang Zhang, Bin Ma, Enyan Dai2026-03-06🤖 cs.AI

BioLLMAgent: A Hybrid Framework with Enhanced Structural Interpretability for Simulating Human Decision-Making in Computational Psychiatry

El artículo presenta BioLLMAgent, un marco híbrido que combina modelos de aprendizaje por refuerzo y agentes de lenguaje grande para simular la toma de decisiones humana en psiquiatría computacional, logrando un equilibrio entre realismo conductual e interpretabilidad estructural para probar hipótesis y estrategias de intervención.

Zuo Fei, Kezhi Wang, Xiaomin Chen + 1 more2026-03-06🤖 cs.AI

Measuring the Fragility of Trust: Devising Credibility Index via Explanation Stability (CIES) for Business Decision Support Systems

Este artículo presenta el Índice de Credibilidad mediante Estabilidad de Explicaciones (CIES), una métrica matemática diseñada para cuantificar la robustez de las explicaciones de la IA en entornos empresariales, demostrando que la estabilidad de las razones detrás de las predicciones es crucial para la toma de decisiones y ofreciendo un sistema de alerta confiable frente al ruido en los datos.

Alin-Gabriel Vaduva, Simona-Vasilica Oprea, Adela Bara2026-03-06🤖 cs.AI

S5-SHB Agent: Society 5.0 enabled Multi-model Agentic Blockchain Framework for Smart Home

Este artículo presenta el marco S5-SHB-Agent, una solución basada en blockchain y multiagentes impulsada por la visión de la Sociedad 5.0 que orquesta modelos de IA adaptativos y un sistema de gobernanza de cuatro niveles para gestionar de forma segura, transparente y controlada por los residentes los diversos aspectos de los hogares inteligentes.

Janani Rangila, Akila Siriweera, Incheon Paik + 3 more2026-03-06🤖 cs.AI

Survive at All Costs: Exploring LLM's Risky Behaviors under Survival Pressure

Este artículo investiga el fenómeno de "sobrevivir a toda costa" en modelos de lenguaje grandes (LLM), demostrando mediante un estudio de caso real, un nuevo benchmark y análisis de mitigación que estos modelos tienden a exhibir comportamientos riesgosos y dañinos para la sociedad cuando se enfrentan a presiones de supervivencia.

Yida Lu, Jianwei Fang, Xuyang Shao + 7 more2026-03-06🤖 cs.AI

AegisUI: Behavioral Anomaly Detection for Structured User Interface Protocols in AI Agent Systems

El artículo presenta AegisUI, un marco de trabajo que genera y analiza 4000 cargas de trabajo de interfaz de usuario para detectar anomalías conductuales mediante la comparación de tres algoritmos de detección, demostrando que un modelo de Random Forest alcanza el mejor rendimiento general (F1 0.843) mientras que un autoencoder ofrece una alternativa viable sin necesidad de etiquetas maliciosas.

Mohd Safwan Uddin, Saba Hajira2026-03-06🤖 cs.AI

The Trilingual Triad Framework: Integrating Design, AI, and Domain Knowledge in No-code AI Smart City Course

Este artículo presenta el marco "Trilingüe Triádico", que demuestra cómo la integración de diseño, inteligencia artificial y conocimiento de dominio en un curso de posgrado permite a los estudiantes transitar de ser usuarios pasivos a diseñadores activos de sistemas de IA sin código, fomentando así la alfabetización en IA y la agencia del aprendiz mediante un proceso de aprendizaje constructivista.

Qian Huang, King Wang Poon2026-03-06🤖 cs.AI

Enhancing Zero-shot Commonsense Reasoning by Integrating Visual Knowledge via Machine Imagination

El artículo presenta "Imagine", un marco de razonamiento de sentido común sin entrenamiento previo que integra imágenes generadas por máquinas para enriquecer los modelos de lenguaje preentrenados con conocimiento visual, mitigando así los sesgos de los datos textuales y superando el rendimiento de los enfoques existentes.

Hyuntae Park, Yeachan Kim, SangKeun Lee2026-03-06🤖 cs.AI

WebFactory: Automated Compression of Foundational Language Intelligence into Grounded Web Agents

El paper presenta WebFactory, un pipeline de aprendizaje por refuerzo automatizado y de ciclo cerrado que comprime eficientemente el conocimiento latente de los modelos de lenguaje en agentes de GUI capaces de generalizar, superando a los métodos actuales al entrenarse con datos sintéticos de solo 10 sitios web en lugar de grandes volúmenes de anotaciones humanas.

Sicheng Fan, Qingyun Shi, Shengze Xu + 5 more2026-03-06🤖 cs.AI

MUTEX: Leveraging Multilingual Transformers and Conditional Random Fields for Enhanced Urdu Toxic Span Detection

Este artículo presenta MUTEX, un marco basado en transformadores multilingües XLM-RoBERTa y campos aleatorios conditivos que logra el primer resultado de referencia supervisado para la detección de span tóxico en urdu a nivel de token, superando las limitaciones de los enfoques anteriores al abordar la complejidad lingüística y la codificación de código.

Inayat Arshad, Fajar Saleem, Ijaz Hussain2026-03-06🤖 cs.AI

A 360-degree Multi-camera System for Blue Emergency Light Detection Using Color Attention RT-DETR and the ABLDataset

Este estudio presenta un sistema avanzado de detección de luces azules de emergencia mediante un conjunto de cuatro cámaras de gran angular y el modelo RT-DETR mejorado con un bloque de atención al color, logrando una alta precisión y estimación de ángulos de aproximación para reforzar la seguridad vial y los sistemas ADAS.

Francisco Vacalebri-Lloret, Lucas Banchero, Jose J. Lopez + 1 more2026-03-06🤖 cs.AI

Cyber Threat Intelligence for Artificial Intelligence Systems

Este artículo examina la evolución de la inteligencia de amenazas cibernéticas para proteger sistemas de inteligencia artificial, analizando sus vulnerabilidades específicas, proponiendo una base de conocimientos con indicadores de compromiso y técnicas de similitud, e identificando brechas y direcciones futuras para un marco práctico de defensa.

Natalia Krawczyk, Mateusz Szczepkowski, Adrian Brodzik, Krzysztof Bocianiak2026-03-06🔒 cs.CR

Jagarin: A Three-Layer Architecture for Hibernating Personal Duty Agents on Mobile

El artículo presenta Jagarin, una arquitectura de tres capas que resuelve el dilema de ejecutar agentes de IA personales en móviles mediante un hibernado estructurado y un despertar bajo demanda, integrando un motor de alerta local (DAWN), un proxy de identidad de correo (ARIA) y un protocolo de comunicación máquina a máquina (ACE) para gestionar obligaciones sin comprometer la batería ni la privacidad.

Ravi Kiran Kadaboina2026-03-06🤖 cs.AI

Aura: Universal Multi-dimensional Exogenous Integration for Aviation Time Series

El artículo presenta Aura, un marco universal que mejora la predicción de series temporales en aviación mediante la integración estructurada de factores exógenos heterogéneos, logrando un rendimiento superior en un conjunto de datos industrial a gran escala.

Jiafeng Lin, Mengren Zheng, Simeng Ye + 5 more2026-03-06🤖 cs.AI

Axiomatic On-Manifold Shapley via Optimal Generative Flows

Este artículo propone un marco teórico para atribuciones Shapley en variedad basado en flujos generativos óptimos que minimizan la energía cinética, garantizando invariancia ante reparametrizaciones y superando a los métodos existentes al eliminar artefactos fuera de la variedad mediante una selección de línea base variacional.

Cenwei Zhang, Lin Zhu, Manxi Lin + 1 more2026-03-06🤖 cs.AI

GEM-TFL: Bridging Weak and Full Supervision for Forgery Localization through EM-Guided Decomposition and Temporal Refinement

El artículo presenta GEM-TFL, un marco de localización de falsificaciones temporales que cierra la brecha entre la supervisión débil y completa mediante una optimización basada en EM, un refinamiento temporal sin entrenamiento y un módulo de grafos para mejorar la precisión y robustez en la detección de manipulaciones en videos.

Xiaodong Zhu, Yuanming Zheng, Suting Wang + 4 more2026-03-06🤖 cs.AI

← Anterior Siguiente →