Once4All: Skeleton-Guided SMT Solver Fuzzing with LLM-Synthesized Generators

Once4All es un nuevo marco de fuzzing asistido por LLM que sintetiza generadores de términos reutilizables a partir de gramáticas extraídas de la documentación para producir fórmulas SMT sintácticamente válidas y semánticamente diversas con un único costo de interacción, logrando así descubrir y ayudar a corregir 43 errores en los solucionadores Z3 y cvc5.

Maolin Sun, Yibiao Yang, Yuming ZhouFri, 13 Ma🤖 cs.AI

Quality Assurance of LLM-generated Code: Addressing Non-Functional Quality Characteristics

Este estudio revela una desconexión entre el enfoque académico, las prioridades de la industria y el comportamiento observado de los modelos de lenguaje grandes en cuanto a las características de calidad no funcionales del código generado, destacando la necesidad urgente de integrar mecanismos de aseguramiento de calidad para evitar la acumulación de deuda técnica.

Xin Sun, Daniel Ståhl, Kristian Sandahl, Christoph KesslerFri, 13 Ma🤖 cs.AI

DIVE: Scaling Diversity in Agentic Task Synthesis for Generalizable Tool Use

El paper presenta DIVE, un enfoque basado en evidencia que invierte el orden de síntesis de tareas para priorizar la diversidad estructural en lugar de la cantidad, logrando una generalización superior en el uso de herramientas para modelos de lenguaje al entrenar con datos derivados de trazas de ejecución reales.

Aili Chen, Chi Zhang, Junteng Liu, Jiangjie Chen, Chengyu Du, Yunji Li, Ming Zhong, Qin Wang, Zhengmao Zhu, Jiayuan Song, Ke Ji, Junxian He, Pengyu Zhao, Yanghua XiaoFri, 13 Ma🤖 cs.AI

Quality-Driven Agentic Reasoning for LLM-Assisted Software Design: Questions-of-Thoughts (QoT) as a Time-Series Self-QA Chain

Este artículo presenta Questions-of-Thoughts (QoT), un método de razonamiento auto-evaluativo que mejora la calidad, modularidad y seguridad del diseño de software asistido por LLMs mediante la descomposición de objetivos en pasos de ingeniería y la verificación iterativa de restricciones, demostrando mejoras significativas en dominios complejos como APIs y sistemas de archivos.

Yen-Ku Liu, Yun-Cheng TsaiFri, 13 Ma🤖 cs.AI

Quantum Computing for All: Online Courses Built Around Interactive Visual Quantum Circuit Simulator

Este artículo presenta un curso en línea diseñado para democratizar el aprendizaje de la computación cuántica mediante un simulador interactivo de circuitos que ofrece retroalimentación inmediata y tareas evaluadas automáticamente, eliminando así la barrera de entrada para estudiantes sin conocimientos previos de física cuántica.

Juha Reinikainen, Vlad Stirbu, Teiko Heinosaari + 2 more2026-03-11⚛️ quant-ph

Dance of the ADS: Orchestrating Failures through Historically-Informed Scenario Fuzzing

Este artículo presenta ScenarioFuzz, un método pionero de fuzzing basado en escenarios que utiliza datos históricos y redes neuronales gráficas para orquestar pruebas de seguridad en sistemas de conducción autónoma, logrando reducir los costos de tiempo en un 60,3% y descubrir un 103% más de escenarios de error por unidad de tiempo, identificando además 58 errores en seis sistemas probados.

Tong Wang, Taotao Gu, Huan Deng + 3 more2026-03-11🤖 cs.AI

Exploration of Evolving Quantum Key Distribution Network Architecture Using Model-Based Systems Engineering

Este trabajo propone un marco basado en la ingeniería de sistemas y la modelización de variabilidad para gestionar la evolución de las arquitecturas de redes de distribución de claves cuánticas, facilitando su integración con infraestructuras clásicas y garantizando la seguridad ante las amenazas de la computación cuántica.

Hayato Ishida, Amal Elsokary, Maria Aslam + 3 more2026-03-10⚛️ quant-ph

Automated TEE Adaptation with LLMs: Identifying, Transforming, and Porting Sensitive Functions in Programs

El artículo presenta AUTOTEE, un enfoque basado en modelos de lenguaje grande (LLM) que automatiza la identificación, transformación y portabilidad de funciones sensibles hacia Entornos de Ejecución de Confianza (TEE) con alta precisión y tasas de éxito en Java y Python, reduciendo así la necesidad de intervención manual y conocimientos especializados.

Ruidong Han, Zhou Yang, Chengyan Ma, Ye Liu, Yuqing Niu, Siqi Ma, Debin Gao, David Lo2026-03-06🔒 cs.CR

Assessing the Impact of Code Changes on the Fault Localizability of Large Language Models

Este estudio presenta un marco de evaluación a gran escala que demuestra que la capacidad de los modelos de lenguaje grandes para localizar fallos es frágil y depende en gran medida de señales sintéticas irrelevantes en lugar de un razonamiento semántico profundo, ya que la mayoría de las localizaciones exitosas fallan al aplicar mutaciones que preservan la semántica.

Sabaat Haroon, Ahmad Faraz Khan, Ahmad Humayun + 5 more2026-03-06💻 cs

Vision Language Model-based Testing of Industrial Autonomous Mobile Robots

Este artículo presenta RVSG, un enfoque de prueba basado en Modelos de Lenguaje Visual (VLM) desarrollado junto con PAL Robotics para generar escenarios de comportamiento humano que violan los requisitos de seguridad de los Robots Móviles Autónomos (AMR) industriales en simulación, permitiendo así identificar comportamientos inciertos de manera segura y eficiente.

Jiahui Wu, Chengjie Lu, Aitor Arrieta + 2 more2026-03-06💻 cs

RefAgent: A Multi-agent LLM-based Framework for Automatic Software Refactoring

El artículo presenta RefAgent, un marco de trabajo basado en agentes LLM multiagente para la refactorización automática de software que, tras ser evaluado en proyectos Java, demuestra superar significativamente a los enfoques de agente único y herramientas tradicionales al mejorar la calidad del código, reducir los "code smells" y lograr una alta tasa de éxito en pruebas unitarias.

Khouloud Oueslati, Maxime Lamothe, Foutse Khomh2026-03-06💻 cs

Refactoring for Novices in Java: An Eye Tracking Study on the Extract vs. Inline Methods

Este estudio de seguimiento ocular con 32 novatos en Java revela que, aunque la extracción de métodos mejora el rendimiento en tareas complejas, puede perjudicar el desempeño y aumentar la carga cognitiva en tareas simples debido a la navegación excesiva, lo que sugiere precaución al modularizar código para principiantes.

José Aldo Silva da Costa, Rohit Gheyi, José Júnior Silva da Costa + 5 more2026-03-06💻 cs