cs.AI artículos | Gist.Science

Combining X-Vectors and Bayesian Batch Active Learning: Two-Stage Active Learning Pipeline for Speech Recognition

Este artículo presenta una novedosa pipeline de aprendizaje activo en dos etapas para el reconocimiento automático del habla que combina la selección de muestras diversas mediante agrupamiento de x-vectores y la identificación de muestras informativas con un método bayesiano adaptado, logrando así un entrenamiento de modelos más eficiente con menos datos etiquetados.

Ognjen Kundacina, Vladimir Vincan, Dragisa Miskovic2026-03-09⚡ eess

My part is bigger than yours -- assessment within a group of peers

Este artículo presenta modelos simples para agregar las opiniones de expertos sobre la distribución de contribuciones en proyectos colaborativos, asignando un mayor peso a las valoraciones de quienes tienen una contribución más significativa con el fin de alcanzar un consenso entre pares.

Konrad Kułakowski, Jacek Szybowski2026-03-09🤖 cs.AI

Predictive Coding Networks and Inference Learning: Tutorial and Survey

Este trabajo ofrece una revisión exhaustiva y una especificación formal de las redes de codificación predictiva, situándolas como un marco versátil y biológicamente plausible dentro de la inteligencia artificial moderna que supera las limitaciones de la retropropagación tradicional.

Björn van Zwol, Ro Jefferson, Egon L. van den Broek2026-03-09🤖 cs.AI

Transforming Agency. On the mode of existence of Large Language Models

El artículo concluye que los Modelos de Lenguaje Grande (LLM) carecen de agencia autónoma al no cumplir con las condiciones de individualidad, normatividad y asimetría interaccional, por lo que deben caracterizarse como interlocutores o autómatas lingüísticos que, a través de una "encarnación" textual y computacional, transforman la agencia humana generando formas híbridas de agencia intencional en lugar de meras herramientas extendidas.

Xabier E. Barandiaran, Lola S. Almendros2026-03-09🤖 cs.AI

FALCON: Future-Aware Learning with Contextual Object-Centric Pretraining for UAV Action Recognition

El artículo presenta FALCON, un enfoque de preentrenamiento auto-supervisado unificado para el reconocimiento de acciones en videos de UAV que aborda el desequilibrio espacial mediante la integración de enmascaramiento consciente de objetos y reconstrucción futura dual, logrando mejoras significativas en precisión y velocidad de inferencia en comparación con métodos supervisados.

Ruiqi Xian, Xiyang Wu, Tianrui Guan, Xijun Wang, Boqing Gong, Dinesh Manocha2026-03-09🤖 cs.AI

UniHR: Hierarchical Representation Learning for Unified Knowledge Graph Link Prediction

El artículo presenta UniHR, un marco de aprendizaje de representaciones jerárquicas unificadas que integra datos hiperrelacionales, temporales y anidados en representaciones basadas en tripletes mediante módulos de representación de datos y aprendizaje estructural jerárquico, demostrando su eficacia en la predicción de enlaces a través de diversos tipos de grafos de conocimiento.

Zhiqiang Liu, Yin Hua, Mingyang Chen + 4 more2026-03-09💬 cs.CL

SpecFuse: Ensembling Large Language Models via Next-Segment Prediction

El artículo presenta SpecFuse, un marco de ensamblaje de modelos de lenguaje grande (LLM) libre de entrenamiento que mejora el rendimiento mediante la predicción de segmentos siguientes para la colaboración semántica y un mecanismo de retroalimentación en línea que ajusta dinámicamente los pesos de votación de cada modelo según su desempeño.

Bo Lv, Nayu Liu, Chen Tang, Xin Liu, Yue Yu, Ping Luo2026-03-09🤖 cs.AI

Transforming Science with Large Language Models: A Survey on AI-assisted Scientific Discovery, Experimentation, Content Generation, and Evaluation

Esta encuesta ofrece una visión estructurada de cómo los modelos de lenguaje grandes y multimodales están transformando el ciclo de vida científico, abarcando desde la búsqueda de literatura y la generación de ideas hasta la creación de contenido y la evaluación ética, sirviendo como guía tanto para nuevos investigadores como para el desarrollo futuro de sistemas de "IA para la Ciencia".

Steffen Eger, Yong Cao, Jennifer D'Souza, Andreas Geiger, Christian Greisinger, Stephanie Gross, Yufang Hou, Brigitte Krenn, Anne Lauscher, Yizhi Li, Chenghua Lin, Nafise Sadat Moosavi, Wei Zhao, Tristan Miller2026-03-09🤖 cs.AI

Conditioning LLMs to Generate Code-Switched Text

Este trabajo propone un marco de trabajo que utiliza la retrotraducción y el ajuste fino para capacitar a los modelos de lenguaje grandes (LLM) para generar texto con cambio de código de alta calidad entre inglés y español, demostrando que las métricas basadas en LLM se alinean mejor con la preferencia humana que las métricas tradicionales.

Maite Heredia, Gorka Labaka, Jeremy Barnes, Aitor Soroa2026-03-09🤖 cs.AI

Generative Predictive Control: Flow Matching Policies for Dynamic and Difficult-to-Demonstrate Tasks

Este artículo introduce el Control Predictivo Generativo, un marco de aprendizaje supervisado que combina la modelación generativa con el control predictivo para entrenar políticas de flujo de alta frecuencia en tareas dinámicas difíciles de demostrar, superando así la dependencia de demostraciones expertas y las limitaciones de velocidad de los métodos existentes.

Vince Kurtz, Joel W. Burdick2026-03-09🤖 cs.AI

FragFM: Hierarchical Framework for Efficient Molecule Generation via Fragment-Level Discrete Flow Matching

El artículo presenta FragFM, un marco jerárquico innovador que utiliza el emparejamiento de flujo discreto a nivel de fragmentos para generar moléculas de manera eficiente y escalable, ofreciendo un control de propiedades superior y un nuevo benchmark para productos naturales.

Joongwon Lee, Seonghwan Kim, Seokhyun Moon, Hyunwoo Kim, Woo Youn Kim2026-03-09🤖 cs.AI

Aligning Compound AI Systems via System-level DPO

El artículo presenta SysDPO, un marco que extiende la Optimización Directa de Preferencias (DPO) a sistemas de IA compuestos modelados como grafos acíclicos dirigidos, permitiendo su alineación conjunta a nivel de sistema a pesar de las interacciones no diferenciables y la dificultad de transformar preferencias globales en locales.

Xiangwen Wang, Yibo Jacky Zhang, Zhoujie Ding, Katherine Tsai, Haolun Wu, Sanmi Koyejo2026-03-09🤖 cs.AI

Adversarial Robustness of Partitioned Quantum Classifiers

Este artículo investiga la robustez adversarial de los clasificadores cuánticos particionados, demostrando que las perturbaciones dirigidas a técnicas de división de circuitos o teletransportación equivalen a la implementación de puertas adversarias en capas intermedias, un fenómeno que se analiza tanto teórica como experimentalmente.

Pouya Kananian, Hans-Arno Jacobsen2026-03-09⚛️ quant-ph

A Survey on Music Generation from Single-Modal, Cross-Modal, and Multi-Modal Perspectives

Este artículo presenta una revisión exhaustiva de la generación musical desde perspectivas unimodales, cruzadas y multimodales, abarcando la representación de datos, la alineación entre modalidades, los conjuntos de datos actuales, los métodos de evaluación, los desafíos clave y las futuras direcciones de investigación.

Shuyu Li, Shulei Ji, Zihao Wang + 3 more2026-03-09🤖 cs.AI

FindAnything: Open-Vocabulary and Object-Centric Mapping for Robot Exploration in Any Environment

El artículo presenta FindAnything, un marco de mapeo en mundo abierto que integra información visión-idioma en submapas volumétricos centrados en objetos mediante la agregación eficiente de características, logrando una comprensión semántica precisa y escalable en tiempo real incluso en dispositivos con recursos limitados como los MAVs.

Sebastián Barbas Laina, Simon Boche, Sotiris Papatheodorou, Simon Schaefer, Jaehyung Jung, Helen Oleynikova, Stefan Leutenegger2026-03-09🤖 cs.AI

From Tokenizer Bias to Backbone Capability: A Controlled Study of LLMs for Time Series Forecasting

Este estudio controlado revela que, aunque los modelos de lenguaje grandes (LLM) muestran cierto potencial para la predicción de series temporales, su rendimiento sigue siendo limitado y no supera consistentemente al de modelos específicamente entrenados con grandes volúmenes de datos de series temporales, debido a que los enfoques previos enmascaraban sus capacidades reales mediante pares de tokenizadores y detokenizadores sobreajustados a distribuciones de datos pequeñas.

Xinyu Zhang, Shanshan Feng, Xutao Li, Kenghong Lin, Fan Li, Pengfei Jia2026-03-09🤖 cs.AI

Position: Stop Anthropomorphizing Intermediate Tokens as Reasoning/Thinking Traces!

Este artículo de posición argumenta que antropomorfizar los tokens intermedios generados por los modelos de lenguaje como "razonamiento" o "pensamiento" es una metáfora peligrosa que confunde la naturaleza de estos sistemas, conduce a investigaciones cuestionables e impide su uso efectivo, por lo que insta a la comunidad a evitar dicha personificación.

Subbarao Kambhampati, Karthik Valmeekam, Siddhant Bhambri, Vardhan Palod, Lucas Saldyt, Kaya Stechly, Soumya Rani Samineni, Durgesh Kalwar, Upasana Biswas2026-03-09🤖 cs.AI

The Malicious Technical Ecosystem: Exposing Limitations in Technical Governance of AI-Generated Non-Consensual Intimate Images of Adults

Este artículo adopta un enfoque centrado en las supervivientes para exponer cómo un "ecosistema técnico malicioso" de herramientas de código abierto y software de desnudamiento, junto con las limitaciones de los marcos de gobernanza actuales como el informe NIST AI 100-4, impiden eficazmente regular la creación de imágenes íntimas generadas por IA sin consentimiento.

Michelle L. Ding, Harini Suresh2026-03-09🤖 cs.AI

Federated Learning: A Survey on Privacy-Preserving Collaborative Intelligence

Esta encuesta ofrece una visión integral del Aprendizaje Federado, abarcando su arquitectura, ciclo de vida, desafíos técnicos como la heterogeneidad de datos y la privacidad, así como tendencias emergentes, aplicaciones prácticas y direcciones futuras para sistemas colaborativos seguros.

Ratun Rahman2026-03-09🤖 cs.AI

HCT-QA: A Benchmark for Question Answering on Human-Centric Tables

Este artículo presenta HCT-QA, un nuevo benchmark exhaustivo para la respuesta a preguntas sobre tablas centradas en humanos (HCTs) que incluye miles de tablas reales y sintéticas con sus correspondientes pares de preguntas y respuestas, evaluando el rendimiento de diversos modelos de lenguaje y visión y demostrando que el ajuste fino mejora significativamente la precisión.

Mohammad S. Ahmad, Zan A. Naeem, Michaël Aupetit, Ahmed Elmagarmid, Mohamed Eltabakh, Xiaosong Ma, Mourad Ouzzani, Chaoyi Ruan, Hani Al-Sayeh2026-03-09🤖 cs.AI

← Anterior Siguiente →