CogBlender: Towards Continuous Cognitive Intervention in Text-to-Image Generation

El artículo presenta CogBlender, un marco que permite la intervención continua y multidimensional de propiedades cognitivas (como valencia, excitación, dominio y memorabilidad) en la generación de imágenes a partir de texto, logrando alinear el contenido visual con la intención psicológica mediante la interpolación de campos de velocidad en un espacio cognitivo.

Shengqi Dang, Jiaying Lei, Yi He, Ziqing Qian, Nan CaoWed, 11 Ma💻 cs

Exploring Modality-Aware Fusion and Decoupled Temporal Propagation for Multi-Modal Object Tracking

El artículo presenta MDTrack, un marco novedoso para el seguimiento de objetos multimodal que supera las limitaciones de las estrategias de fusión uniformes mediante una fusión adaptativa basada en expertos y una propagación temporal desacoplada utilizando modelos de espacio de estado, logrando así un rendimiento superior en cinco benchmarks.

Shilei Wang, Pujian Lai, Dong Gao, Jifeng Ning, Gong ChengWed, 11 Ma💻 cs

ToolRosetta: Bridging Open-Source Repositories and Large Language Model Agents through Automated Tool Standardization

El artículo presenta ToolRosetta, un marco unificado que automatiza la conversión de repositorios de código de código abierto en herramientas estandarizadas compatibles con el Protocolo de Contexto de Modelo (MCP), permitiendo a los agentes de modelos de lenguaje grandes ejecutar tareas complejas de extremo a extremo con mínima intervención humana y garantizando la seguridad.

Shimin Di, Xujie Yuan, Hanghui Guo, Chaoqian Ouyang, Zhangze Chen, Ling Yue, Libin Zheng, Jia Zhu, Shaowu Pan, Jian Yin, Min-Ling Zhang, Yong RuiWed, 11 Ma💻 cs

See, Plan, Rewind: Progress-Aware Vision-Language-Action Models for Robust Robotic Manipulation

El marco See, Plan, Rewind (SPR) mejora la manipulación robótica al medir el progreso mediante hitos espaciales, permitiendo la planificación de trayectorias y la recuperación automática de errores mediante un ciclo cerrado que supera a los modelos existentes en robustez y generalización.

Tingjun Dai, Mingfei Han, Tingwen Du, Zhiheng Liu, Zhihui Li, Salman Khan, Jun Yu, Xiaojun ChangWed, 11 Ma💻 cs

External entropy supply for IoT devices employing a RISC-V Trusted Execution Environment

Este artículo presenta una solución basada en un Entorno de Ejecución Confiable (TEE) de RISC-V que proporciona un servicio de entropía externa para dispositivos IoT con recursos limitados, permitiendo que estos generen claves criptográficas seguras al solicitar entropía de alta calidad a un servidor verificado.

Arttu Paju, Alejandro Cabrera Aldaya, Nicola Tuveri, Juha Savimäki, Marko Kivikangas, Brian McGillionWed, 11 Ma💻 cs

IntroSVG: Learning from Rendering Feedback for Text-to-SVG Generation via an Introspective Generator-Critic Framework

El artículo presenta IntroSVG, un marco generativo introspectivo que utiliza un modelo de lenguaje visual unificado en un bucle cerrado de "generar-revisar-refinar" con retroalimentación visual y optimización directa de preferencias para superar las limitaciones de los métodos actuales y producir gráficos vectoriales escalables (SVG) de mayor calidad, complejidad y alineación semántica.

Feiyu Wang, Jiayuan Yang, Zhiyuan Zhao, Da Zhang, Bingyu Li, Peng Liu, Junyu GaoWed, 11 Ma💻 cs

NLiPsCalib: An Efficient Calibration Framework for High-Fidelity 3D Reconstruction of Curved Visuotactile Sensors

El artículo presenta NLiPsCalib, un marco de calibración eficiente y consistente con la física que utiliza estereofotometría de luz cercana para lograr una reconstrucción 3D de alta fidelidad en sensores visuotáctiles curvos mediante contactos simples con objetos cotidianos, eliminando la necesidad de dispositivos de calibración costosos y laboriosos.

Xuhao Qin, Feiyu Zhao, Yatao Leng, Runze Hu, Chenxi XiaoWed, 11 Ma💻 cs

OddGridBench: Exposing the Lack of Fine-Grained Visual Discrepancy Sensitivity in Multimodal Large Language Models

Este trabajo presenta OddGridBench, un nuevo benchmark que revela la deficiente sensibilidad a discrepancias visuales de los modelos de lenguaje multimodal actuales, y propone OddGrid-GRPO, un marco de aprendizaje por refuerzo que mejora significativamente esta capacidad mediante aprendizaje curricular y recompensas conscientes de la distancia espacial.

Tengjin Weng, Wenhao Jiang, Jingyi Wang, Ming Li, Lin Ma, Zhong MingWed, 11 Ma💻 cs

Dynamic Precision Math Engine for Linear Algebra and Trigonometry Acceleration on Xtensa LX6 Microcontrollers

Este artículo presenta y evalúa un motor de matemáticas de precisión dinámica para microcontroladores ESP32 que combina aritmética de punto fijo, un módulo CORDIC y multiplicación de matrices optimizada para lograr aceleraciones significativas en operaciones trigonométricas y de álgebra lineal mediante la conmutación en tiempo real entre rutas de ejecución de punto fijo y de coma flotante.

Elian Alfonso Lopez PreciadoWed, 11 Ma💻 cs

Can ChatGPT Generate Realistic Synthetic System Requirement Specifications? Results of a Case Study

Este estudio de caso demuestra que, aunque es posible generar especificaciones de requisitos de sistema sintéticas y realistas con ChatGPT mediante un enfoque iterativo de patrones de prompts, la evaluación automática basada en modelos de lenguaje no puede sustituir completamente la revisión exhaustiva de expertos debido a errores como contradicciones y alucinaciones.

Alex R. Mattukat, Florian M. Braun, Horst LichterWed, 11 Ma💻 cs

ProvAgent: Threat Detection Based on Identity-Behavior Binding and Multi-Agent Collaborative Attack Investigation

ProvAgent es un marco de trabajo que mejora la detección y la investigación de amenazas avanzadas persistentes (APT) mediante la combinación de modelos tradicionales para el filtrado de anomalías, un aprendizaje de contraste gráfico para la vinculación de identidad y comportamiento, y un sistema multiagente autónomo que reconstruye procesos de ataque con alta precisión y bajo costo.

Wenhao Yan, Ning An, Linxu Li, Bingsheng Bi, Bo Jiang, Zhigang Lu, Baoxu Liu, Junrong Liu, Cong DongWed, 11 Ma💻 cs

Evidential Perfusion Physics-Informed Neural Networks with Residual Uncertainty Quantification

El artículo presenta EPPINN, un marco de aprendizaje profundo evidencial basado en redes neuronales informadas por física que mejora la precisión y fiabilidad de la estimación de parámetros de perfusión en la tomografía computarizada para el ictus isquémico agudo al cuantificar la incertidumbre aleatoria y epistémica sin necesidad de muestreo bayesiano.

Junhyeok Lee, Minseo Choi, Han Jang, Young Hun Jeon, Heeseong Eum, Joon Jang, Chul-Ho Sohn, Kyu Sung ChoiWed, 11 Ma💻 cs