cs artículos | Gist.Science

Extracting Recurring Vulnerabilities from Black-Box LLM-Generated Software

Este artículo presenta FSTab, un marco de ataque en caja negra que demuestra cómo las vulnerabilidades recurrentes en software generado por LLMs pueden predecirse a partir de características observables y evalúa la consistencia de estas fallas en modelos de última generación como GPT-5.2, Claude-4.5 Opus y Gemini-3 Pro, revelando un riesgo de seguridad significativo y transferible entre dominios.

Tomer Kordonsky, Maayan Yamin, Noam Benzimra, Amit LeVi, Avi Mendelson2026-03-10💻 cs

LMMRec: LLM-driven Motivation-aware Multimodal Recommendation

El artículo presenta LMMRec, un marco de recomendación multimodal impulsado por modelos de lenguaje grande que utiliza técnicas de razonamiento y aprendizaje contrastivo para extraer y alinear motivaciones finas de usuarios y artículos a partir de texto y datos de interacción, logrando mejoras significativas en el rendimiento.

Yicheng Di, Zhanjie Zhang, Yun Wang, Jinren Liu, Jiaqi Yan, Jiyu Wei, Xiangyu Chen, Yuan Liu2026-03-10💻 cs

Assessing Problem-Solving in HR Contexts: A Comparison Between Game-Based and Self-Report Measures

Este estudio demuestra que no existe una convergencia significativa entre las medidas de resolución de problemas basadas en juegos y las autoevaluadas, lo que respalda la necesidad de integrar ambos enfoques complementarios en los procesos de selección de personal para obtener una visión más completa de las competencias.

Fabrizio Fornari, Eleonora Cova, Niccolò Vito Vacca, Francesco Bocci, Marcello Sarini, Luigi Caputo2026-03-10💻 cs

Conditional Diffusion Guidance under Hard Constraint: A Stochastic Analysis Approach

Este artículo presenta un marco de guía condicional para modelos de difusión bajo restricciones estrictas, basado en la transformada h de Doob y procesos de variación cuadrática, que permite estimar la corrección de deriva necesaria mediante algoritmos de aprendizaje fuera de política sin modificar la red de puntuación preentrenada, garantizando teóricamente la satisfacción de las condiciones y demostrando su eficacia en la generación de eventos raros.

Zhengyi Guo, Wenpin Tang, Renyuan Xu2026-03-10💻 cs

Beyond Judgment: Exploring Large Language Models as Non-Judgmental Support for Maternal Mental Health

Este estudio revela que las madres utilizan los modelos de lenguaje grandes como recursos no juzgadores para obtener apoyo emocional y tranquilidad sobre la crianza, evitando el juicio social, aunque la mayoría sigue valorando más el calor humano, especialmente en contextos familiares complejos.

Shayla Sharmin, Sadia Afrin Ratna2026-03-10💻 cs

NAAMSE: Framework for Evolutionary Security Evaluation of Agents

El artículo presenta NAAMSE, un marco evolutivo que automatiza la evaluación de seguridad de agentes de IA mediante la optimización de mutaciones de prompts y la exploración jerárquica para identificar vulnerabilidades adaptativas sin comprometer la funcionalidad benigna.

Kunal Pai, Parth Shah, Harshil Patel2026-03-10💻 cs

PhysDrape: Learning Explicit Forces and Collision Constraints for Physically Realistic Garment Draping

PhysDrape es un solucionador híbrido neural-físico que integra una red neuronal informada por física con un solver de proyección diferenciable para resolver el conflicto entre la viabilidad geométrica y la plausibilidad física en el drapeado de prendas, logrando un manejo robusto de colisiones y un equilibrio cuasi-estático mediante fuerzas explícitas y restricciones geométricas estrictas.

Minghai Chen, Mingyuan Liu, Ning Ma, Jianqing Li, Yuxiang Huan2026-03-10💻 cs

LLM4PQC - Accurate and Efficient Synthesis of PQC Cores by Feedback-Driven LLMs

El artículo presenta LLM4PQC, un marco basado en modelos de lenguaje grande que automatiza la refactorización de especificaciones de criptografía postcuántica en código sintetizable y verifica su corrección mediante un flujo de retroalimentación jerárquico, reduciendo así el esfuerzo manual y acelerando la exploración del espacio de diseño de hardware.

Buddhi Perera, Zeng Wang, Weihua Xiao, Mohammed Nabeel, Ozgur Sinanoglu, Johann Knechtel, Ramesh Karri2026-03-10💻 cs

Move What Matters: Parameter-Efficient Domain Adaptation via Optimal Transport Flow for Collaborative Perception

El artículo presenta FlowAdapt, un marco de adaptación de dominio eficiente en parámetros basado en la teoría del transporte óptimo que, mediante una muestreo selectivo y una transferencia progresiva de conocimiento, supera las limitaciones de la adaptación directa en sistemas de percepción colaborativa V2X logrando un rendimiento de vanguardia con solo el 1% de parámetros entrenables.

Zesheng Jia, Jin Wang, Siao Liu, Lingzhi Li, Ziyao Huang, Yunjiang Xu, Jianping Wang2026-03-10💻 cs

SToRM: Supervised Token Reduction for Multi-modal LLMs toward efficient end-to-end autonomous driving

El marco SToRM propone un método de reducción supervisada de tokens para modelos de lenguaje multimodal que permite una conducción autónoma de extremo a extremo eficiente, reduciendo los costos computacionales hasta en un 30x sin sacrificar el rendimiento en comparación con el uso de todos los tokens.

Seo Hyun Kim, Jin Bok Park, Do Yeon Koo, Hogun Park, Il Yong Chun2026-03-10💻 cs

Accelerating Robotic Reinforcement Learning with Agent Guidance

El artículo presenta AGPS, un marco que automatiza el aprendizaje por refuerzo en robótica mediante un agente multimodal que sustituye la supervisión humana, mejorando significativamente la eficiencia de las muestras y la escalabilidad en tareas de manipulación.

Haojun Chen, Zili Zou, Chengdong Ma, Yaoxiang Pu, Haotong Zhang, Yuanpei Chen, Yaodong Yang2026-03-10💻 cs

To Mix or To Merge: Toward Multi-Domain Reinforcement Learning for Large Language Models

El artículo M2RL compara los paradigmas de entrenamiento mixto y de fusión de modelos para el Aprendizaje por Refuerzo con Recompensas Verificables (RLVR) en múltiples dominios, descubriendo que estos interactúan de forma sinérgica sin interferencias significativas y analizando los mecanismos internos que explican estas ganancias mutuas.

Haoqing Wang, Xiang Long, Ziheng Li, Yilong Xu, Tingguang Li, Yehui Tang2026-03-10💻 cs

SkillsBench: Benchmarking How Well Agent Skills Work Across Diverse Tasks

El artículo presenta SkillsBench, un benchmark que demuestra que las habilidades curadas mejoran significativamente el rendimiento de los agentes de IA en diversas tareas, mientras que las generadas automáticamente no aportan beneficios y un diseño enfocado resulta más efectivo que la documentación exhaustiva.

Xiangyi Li, Wenbo Chen, Yimin Liu, Shenghan Zheng, Xiaokun Chen, Yifeng He, Yubo Li, Bingran You, Haotian Shen, Jiankai Sun, Shuyi Wang, Binxu Li, Qunhong Zeng, Di Wang, Xuandong Zhao, Yuanli Wang, Roey Ben Chaim, Zonglin Di, Yipeng Gao, Junwei He, Yizhuo He, Liqiang Jing, Luyang Kong, Xin Lan, Jiachen Li, Songlin Li, Yijiang Li, Yueqian Lin, Xinyi Liu, Xuanqing Liu, Haoran Lyu, Ze Ma, Bowei Wang, Runhui Wang, Tianyu Wang, Wengao Ye, Yue Zhang, Hanwen Xing, Yiqi Xue, Steven Dillmann, Han-chung Lee2026-03-10💻 cs

State Feedback Control of State-Delayed LPV Systems using Dynamic IQCs

Este artículo presenta un nuevo marco de control de retroalimentación de estado para sistemas LPV con retardos de estado variables en el tiempo, que integra funciones de Lyapunov dependientes de los parámetros y restricciones cuadráticas integrales (IQC) dinámicas para lograr condiciones de síntesis convexas que garantizan estabilidad y rendimiento con menor conservadurismo.

Fen Wu2026-03-10💻 cs

Social Life of Code: Modeling Evolution through Code Embedding and Opinion Dynamics

Este artículo presenta un marco novedoso que integra incrustaciones semánticas de código con la teoría de dinámicas de opinión para cuantificar y analizar la evolución de proyectos de software, revelando patrones de colaboración, formación de consenso y mecanismos de influencia en comunidades de desarrolladores de código abierto.

Yulong He, Nikita Verbin, Sergey Kovalchuk2026-03-10💻 cs

RIS Control through the Lens of Stochastic Network Calculus: An O-RAN Framework for Delay-Sensitive 6G Applications

Este trabajo presenta DARIO, un marco compatible con O-RAN que utiliza un modelo de cálculo de redes estocásticas para optimizar dinámicamente la asignación de superficies inteligentes reconfigurables (RIS) en entornos 6G, logrando reducciones significativas en la latencia para aplicaciones sensibles al retraso.

Oscar Adamuz-Hinojosa, Lanfranco Zanzi, Vincenzo Sciancalepore, Marco Di Renzo, Xavier Costa-Pérez2026-03-10💻 cs

Graph Neural Model Predictive Control for High-Dimensional Systems

Este trabajo presenta un marco de control predictivo basado en redes neuronales de grafos que permite el control en tiempo real de sistemas de alta dimensión, como robots blandos, mediante la explotación de la esparsidad de las interacciones y la paralelización en GPU, logrando un seguimiento preciso y la evitación de obstáculos en sistemas con hasta 1.000 nodos.

Patrick Benito Eberhard, Luis Pabon, Daniele Gammelli, Hugo Buurmeijer, Amon Lahr, Mark Leone, Andrea Carron, Marco Pavone2026-03-10💻 cs

3DMedAgent: Unified Perception-to-Understanding for 3D Medical Analysis

El artículo presenta 3DMedAgent, un agente unificado que habilita a modelos de lenguaje multimodal 2D para realizar análisis médicos 3D mediante la descomposición progresiva de tareas complejas y el uso de una memoria estructurada, superando así las limitaciones de los enfoques existentes y logrando un rendimiento superior en más de 40 tareas de análisis de tomografía computarizada.

Ziyue Wang, Linghan Cai, Chang Han Low, Haofeng Liu, Junde Wu, Jingyu Wang, Rui Wang, Lei Song, Jiang Bian, Jingjing Fu, Yueming Jin2026-03-10💻 cs

OVerSeeC: Open-Vocabulary Costmap Generation from Satellite Images and Natural Language

El artículo presenta OVerSeeC, un marco modular de cero disparos que combina modelos de lenguaje y segmentación de visión abierta para generar mapas de costos globales adaptativos a misiones a partir de imágenes satelitales y descripciones en lenguaje natural, permitiendo la planificación de rutas para entidades y reglas desconocidas sin ontologías predefinidas.

Rwik Rana, Jesse Quattrociocchi, Dongmyeong Lee, Christian Ellis, Amanda Adkins, Adam Uccello, Garrett Warnell, Joydeep Biswas2026-03-10💻 cs

On the Energy Cost of Post-Quantum Key Establishment in Wireless Low-Power Personal Area Networks

Este artículo demuestra que, en redes de área personal de baja potencia, el costo energético de la comunicación durante el establecimiento de claves post-cuánticas a menudo supera al de la computación, lo que exige una optimización coordinada de protocolos y capas inferiores para lograr una operación cuánticamente segura eficiente.

Tao Liu, Gowri Ramachandra, Raja Jurdak2026-03-10💻 cs

← Anterior Siguiente →