AI-Generated Rubric Interfaces: K-12 Teachers' Perceptions and Practices

Este estudio revela que, aunque los docentes de primaria y secundaria perciben las rúbricas generadas por IA como un punto de partida útil que mejora la estructura y claridad, su adopción condicional depende de herramientas que permitan una fácil personalización y mantengan el control humano sobre el contenido y la evaluación.

Bahare Riahi, Sayali Patukale, Joy Niranjan, Yogya Koneru, Tiffany Barnes, Veronica Cateté2026-03-12💻 cs

Incremental Federated Learning for Intrusion Detection in IoT Networks under Evolving Threat Landscape

Este estudio propone un enfoque de aprendizaje federado incremental basado en LSTM para mejorar la detección de intrusiones en redes IoT bajo un panorama de amenazas en evolución, demostrando que las estrategias de aprendizaje acumulativo y representativo ofrecen el mejor rendimiento estable frente al cambio de concepto, mientras que los métodos basados en retención equilibran eficazmente la precisión y la latencia.

Muaan Ur Rehman, Hayretdin Bahs, Rajesh Kalakoti2026-03-12💻 cs

Phase-Interface Instance Segmentation as a Visual Sensor for Laboratory Process Monitoring

Este artículo presenta LGA-RCM-YOLO, un modelo de segmentación de instancias de interfaz de fase basado en YOLO11m que, junto con el nuevo conjunto de datos CTG 2.0, supera los desafíos de monitoreo visual en vidrio transparente para lograr una automatización de laboratorio precisa y en tiempo real.

Mingyue Li, Xin Yang, Shilin Yan, Jinye Ran, Morui Zhu, Zirui Peng, Huanqing Peng, Wei Peng, Guanghua Zhang, Shuo Li, Hao Zhang2026-03-12💻 cs

The Quadratic Geometry of Flow Matching: Semantic Granularity Alignment for Text-to-Image Synthesis

Este trabajo propone la Alineación de Granularidad Semántica (SGA), un método que aprovecha una perspectiva geométrica basada en el Kernel Tangente Neural para mitigar conflictos de gradientes en el ajuste fino de modelos de flujo, logrando así una convergencia más rápida y una mejor integridad estructural en la síntesis de imágenes a partir de texto.

Zhinan Xiong, Shunqi Yuan2026-03-12💻 cs

PolGS++: Physically-Guided Polarimetric Gaussian Splatting for Fast Reflective Surface Reconstruction

El artículo presenta PolGS++, un marco de representación gaussiana polarimétrica guiado por física que integra un modelo pBRDF y una máscara de visibilidad guiada por profundidad para lograr una reconstrucción rápida y precisa de superficies reflectantes mediante la decouplación de componentes difusos y especulares.

Yufei Han, Chu Zhou, Youwei Lyu, Qi Chen, Si Li, Boxin Shi, Yunpeng Jia, Heng Guo, Zhanyu Ma2026-03-12💻 cs

Beyond Standard Datacubes: Extracting Features from Irregular and Branching Earth System Data

Este artículo presenta un marco unificado basado en hipercubos de datos comprimidos mediante estructuras arbóreas dentro del sistema Polytope, diseñado para superar las limitaciones de los modelos tradicionales y permitir una extracción eficiente y flexible de características en conjuntos de datos de ciencias de la Tierra irregulares y complejos.

Mathilde Leuridan, James Hawkes, Tiago Quintino, Martin Schultz2026-03-12💻 cs

HanMoVLM: Large Vision-Language Models for Professional Artistic Painting Evaluation

El artículo presenta HanMoVLM, un modelo de visión-lingüaje grande especializado en la evaluación profesional de pinturas chinas que, mediante un dataset de obras maestras y un razonamiento paso a paso validado por expertos, cierra la brecha con la evaluación humana y actúa como verificador de alta calidad para mejorar la generación de imágenes artísticas.

Hongji Yang, Yucheng Zhou, Wencheng Han, Songlian Li, Xiaotong Zhao, Jianbing Shen2026-03-12💻 cs

A dataset of medication images with instance segmentation masks for preventing adverse drug events

El artículo presenta MEDISEG, un nuevo conjunto de datos con máscaras de segmentación de instancias para 32 tipos de pastillas en 8262 imágenes que aborda la falta de complejidades del mundo real, demostrando su eficacia para entrenar modelos de IA que previenen errores de medicación y mejoran el reconocimiento de clases no vistas en escenarios de múltiples pastillas.

W. I. Chu, S. Hirani, G. Tarroni, L. Li2026-03-12💻 cs

Evaluating Few-Shot Pill Recognition Under Visual Domain Shift

Este estudio evalúa el reconocimiento de píldoras en escenarios de pocos ejemplos bajo cambios de dominio visual, concluyendo que aunque la clasificación semántica se adapta rápidamente con muy pocos datos, la precisión en la localización disminuye significativamente en condiciones complejas como el solapamiento, lo que subraya la importancia de utilizar datos de entrenamiento realistas para garantizar la robustez en despliegues reales.

W. I. Chu, G. Tarroni, L. Li2026-03-12💻 cs

UltrasoundAgents: Hierarchical Multi-Agent Evidence-Chain Reasoning for Breast Ultrasound Diagnosis

El artículo presenta UltrasoundAgents, un marco de razonamiento basado en agentes múltiples jerárquicos y una estrategia de entrenamiento progresivo desacoplado que mejora el diagnóstico de ecografías mamarias al imitar el flujo de trabajo clínico para localizar lesiones, analizar atributos específicos y generar evidencia estructurada y trazable para la clasificación BI-RADS.

Yali Zhu, Kang Zhou, Dingbang Wu, Gaofeng Meng2026-03-12💻 cs

OSUM-Pangu: An Open-Source Multidimension Speech Understanding Foundation Model Built upon OpenPangu on Ascend NPUs

El artículo presenta OSUM-Pangu, un modelo fundacional de comprensión de voz de código abierto desarrollado completamente en la plataforma Ascend NPU sin CUDA, que integra un codificador de audio con OpenPangu-7B para lograr un rendimiento comparable a los modelos basados en GPU y fomentar la evolución independiente de la inteligencia multimodal.

Yujie Liao, Xuelong Geng, Hongfei Xue, Shuiyuan Wang, Lei Xie2026-03-12💻 cs

Beyond Sequential Distance: Inter-Modal Distance Invariant Position Encoding

El artículo propone DIPE, un mecanismo de codificación posicional que mitiga el desvanecimiento visual en modelos de lenguaje multimodal de gran contexto al eliminar la penalización basada en la distancia entre tokens visuales y textuales, garantizando así una conexión visual estable sin sacrificar el rendimiento en tareas de contexto corto.

Lin Chen, Bolin Ni, Qi Yang, Zili Wang, Kun Ding, Ying Wang, Houwen Peng, Shiming Xiang2026-03-12💻 cs

Exploring Indicators of Developers' Sentiment Perceptions in Student Software Projects

Este estudio, basado en una encuesta con estudiantes de proyectos de software, revela que la percepción del sentimiento en los mensajes es inestable, depende fuertemente del contenido específico del enunciado y muestra correlaciones débiles con factores individuales o del proyecto, lo que sugiere precaución al interpretar los resultados del análisis de sentimiento.

Martin Obaidi, Marc Herrmann, Jendrik Martensen, Jil Klünder, Kurt Schneider2026-03-12💻 cs