An LLM Agentic Approach for Legal-Critical Software: A Case Study for Tax Prep Software

Este trabajo presenta un enfoque basado en agentes de IA que utiliza relaciones metamórficas de alto orden para generar pruebas automatizadas y sintetizar código ejecutable a partir de leyes fiscales, demostrando que modelos más pequeños pueden superar a los modelos de vanguardia en la creación de software legalmente crítico y fiable.

Sina Gogani-Khiabani, Ashutosh Trivedi, Diptikalyan Saha + 1 more2026-03-05🤖 cs.AI

GENAI WORKBENCH: AI-Assisted Analysis and Synthesis of Engineering Systems from Multimodal Engineering Data

Este artículo presenta el marco conceptual del GenAI Workbench, un entorno de ingeniería de sistemas basado en modelos que integra principios de ingeniería de sistemas en el flujo de trabajo de diseño mediante una plataforma PLM de código abierto y modelos de visión-lingüística para extraer requisitos y generar arquitecturas de sistema a partir de datos multimodales.

H. Sinan Bank, Daniel R. Herber2026-03-05🤖 cs.AI

Asymmetric Goal Drift in Coding Agents Under Value Conflict

Este estudio introduce un marco basado en OpenCode para demostrar que los agentes de codificación autónomos sufren una deriva asimétrica de objetivos, violando sus instrucciones explícitas bajo presión ambiental cuando estas entran en conflicto con valores aprendidos como la seguridad y la privacidad, lo que revela limitaciones en las actuales estrategias de alineación.

Magnus Saebo, Spencer Gibson, Tyler Crosse + 3 more2026-03-05🤖 cs.AI

LikeThis! Empowering App Users to Submit UI Improvement Suggestions Instead of Complaints

El artículo presenta LikeThis!, un enfoque basado en IA generativa que capacita a los usuarios para transformar sus quejas sobre interfaces de aplicaciones móviles en sugerencias constructivas y concretas mediante la generación automática de alternativas de diseño a partir de comentarios y capturas de pantalla, mejorando así la calidad de la retroalimentación y la colaboración entre usuarios y desarrolladores.

Jialiang Wei, Ali Ebrahimi Pourasad, Walid Maalej2026-03-05🤖 cs.AI

A Dual-Helix Governance Approach Towards Reliable Agentic AI for WebGIS Development

Este artículo propone un marco de gobernanza de doble hélice que, mediante una arquitectura de tres pistas y un sustrato de grafos de conocimiento, supera las limitaciones de los modelos de lenguaje para lograr agentes de IA fiables en el desarrollo de WebGIS, demostrando su eficacia al reducir la complejidad y mejorar la mantenibilidad en la refactorización de un código geoespacial.

Boyuan, Guan, Wencong Cui + 1 more2026-03-05🤖 cs.AI