cs.AI artículos | Gist.Science

SwiftEmbed: Ultra-Fast Text Embeddings via Static Token Lookup for Real-Time Applications

SwiftEmbed es un sistema de inferencia en Rust que ofrece latencias ultra bajas de 1,12 ms mediante la búsqueda estática de tokens y la serialización binaria, logrando un rendimiento robusto en tareas de detección de duplicados y similitud semántica para aplicaciones en tiempo real que no pueden soportar la inferencia completa de transformadores.

Edouard Lansiaux, Antoine Simonet, Eric Wiel2026-03-10💬 cs.CL

Vectorized Online POMDP Planning

Este artículo presenta VOPP, un planificador en línea de POMDP vectorizado que aprovecha la paralelización masiva mediante computaciones totalmente vectorizadas para eliminar cuellos de botella de sincronización, logrando una eficiencia de cálculo 20 veces superior a los solvers paralelos existentes y superando a los solvers secuenciales con un presupuesto de planificación 1000 veces menor.

Marcus Hoerger, Muhammad Sudrajat, Hanna Kurniawati2026-03-10💻 cs

Detecting AI-Generated Images via Diffusion Snap-Back Reconstruction: A Forensic Approach

Este artículo presenta un método forense llamado "reconstrucción de retroceso de difusión" que detecta imágenes generadas por IA analizando cómo estas responden a perturbaciones y reconstrucciones mediante modelos de difusión, logrando una alta precisión (AUROC de 0.993) y robustez frente a distorsiones comunes.

Mohd Ruhul Ameen, Akif Islam2026-03-10💻 cs

Balancing Interpretability and Performance in Motor Imagery EEG Classification: A Comparative Study of ANFIS-FBCSP-PSO and EEGNet

Este estudio compara un enfoque de razonamiento fuzzy interpretable (ANFIS-FBCSP-PSO) con un modelo de aprendizaje profundo (EEGNet) para la clasificación de EEG de imaginación motora, revelando que el primero ofrece un mejor rendimiento dentro del sujeto mientras que el segundo demuestra una mayor generalización entre sujetos, proporcionando así directrices prácticas para seleccionar sistemas BCI según si se prioriza la interpretabilidad o la robustez.

Farjana Aktar, Mohd Ruhul Ameen, Akif Islam, Md Ekramul Hamid2026-03-10🤖 cs.LG

Towards Efficient Federated Learning of Networked Mixture-of-Experts for Mobile Edge Computing

Este trabajo propone el sistema de Mezcla de Expertos en Red (NMoE) y un marco de aprendizaje federado que combina aprendizaje supervisado y auto-supervisado para permitir la inferencia colaborativa y el entrenamiento eficiente de modelos de inteligencia artificial en dispositivos de borde con recursos limitados, preservando la privacidad y optimizando las comunicaciones.

Song Gao, Songyang Zhang, Shusen Jing, Shuai Zhang, Xiangwei Zhou, Yue Wang, Zhipeng Cai2026-03-10🤖 cs.LG

FATE: A Formal Benchmark Series for Frontier Algebra of Multiple Difficulty Levels

El artículo presenta FATE, una nueva serie de benchmarks en álgebra formal que abarca desde ejercicios universitarios hasta problemas de investigación avanzada, revelando que los modelos de lenguaje actuales tienen un rendimiento muy limitado en esta área, especialmente en la formalización de su razonamiento natural.

Jiedong Jiang, Wanyi He, Yuefeng Wang, Guoxiong Gao, Yongle Hu, Jingting Wang, Nailin Guan, Peihao Wu, Chunbo Dai, Liang Xiao, Bin Dong2026-03-10🤖 cs.LG

Jr. AI Scientist and Its Risk Report: Autonomous Scientific Exploration from a Baseline Paper

El artículo presenta a Jr. AI Scientist, un sistema autónomo que imita el flujo de trabajo de un investigador novato para generar contribuciones científicas válidas a partir de artículos base, demostrando su superioridad sobre sistemas automatizados anteriores mientras identifica sus limitaciones actuales y los riesgos asociados para la integridad de la investigación académica.

Atsuyuki Miyai, Mashiro Toyooka, Takashi Otonari, Zaiying Zhao, Kiyoharu Aizawa2026-03-10🤖 cs.LG

HatePrototypes: Interpretable and Transferable Representations for Implicit and Explicit Hate Speech Detection

El artículo presenta HatePrototypes, representaciones vectoriales interpretables y transferibles derivadas de modelos de lenguaje que permiten detectar tanto el discurso de odio explícito como el implícito mediante un enfoque eficiente y sin necesidad de reentrenamiento continuo.

Irina Proskurina, Marc-Antoine Carpentier, Julien Velcin2026-03-10💬 cs.CL

Think, Speak, Decide: Language-Augmented Multi-Agent Reinforcement Learning for Economic Decision-Making

El artículo presenta LAMP, un marco de aprendizaje por refuerzo multiagente que integra el razonamiento lingüístico en un flujo de trabajo de "pensar, hablar y decidir" para superar las limitaciones de los modelos actuales y lograr estrategias económicas más rentables, robustas e interpretables en entornos de simulación.

Heyang Ma, Qirui Mi, Qipeng Yang, Zijun Fan, Bo Li, Haifeng Zhang2026-03-10💻 cs

UnfoldLDM: Deep Unfolding-based Blind Image Restoration with Latent Diffusion Priors

El artículo presenta UnfoldLDM, un marco de red de despliegue profundo que integra un modelo de difusión latente para superar las limitaciones de dependencia del modelo de degradación y el sesgo de sobre-suavizado en la restauración ciega de imágenes, logrando resultados de vanguardia mediante módulos de estimación de degradación y corrección de texturas.

Chunming He, Rihan Zhang, Zheng Chen, Bowen Yang, Chengyu Fang, Yunlong Lin, Yulun Zhang, Fengyang Xiao, Sina Farsiu2026-03-10💻 cs

Stable Multi-Drone GNSS Tracking System for Marine Robots

Este trabajo presenta un sistema de seguimiento GNSS estable y en tiempo real para robots marinos, que utiliza una flota de drones con detección visual, alineación de IDs cooperativa y un filtro de Kalman extendido ponderado por confianza para superar la pérdida de señal bajo el agua.

Shuo Wen, Edwin Meriaux, Mariana Sosa Guzmán, Zhizun Wang, Junming Shi, Gregory Dudek2026-03-10💻 cs

Towards Realistic Guarantees: A Probabilistic Certificate for SmoothLLM

Este trabajo mejora la certificación de seguridad de SmoothLLM frente a ataques de jailbreaking al reemplazar la estricta suposición de "k-inestabilidad" con un marco probabilístico más realista "(k, $\varepsilon$ )-inestable" que incorpora modelos empíricos de éxito del ataque para ofrecer garantías de defensa más confiables y prácticas.

Adarsh Kumarappan, Ayushi Mehrotra2026-03-10🤖 cs.LG

Yo'City: Personalized and Boundless 3D Realistic City Scene Generation via Self-Critic Expansion

El artículo presenta Yo'City, un marco agéntico innovador que utiliza modelos grandes y una estrategia de planificación jerárquica para generar ciudades 3D realistas, personalizadas y de escala infinita, superando a los métodos existentes mediante un ciclo de síntesis iterativo y un mecanismo de expansión guiado por relaciones espaciales y semánticas.

Keyang Lu, Sifan Zhou, Hongbin Xu, Gang Xu, Zhifei Yang, Yikai Wang, Zhen Xiao, Jieyi Long, Ming Li2026-03-10💻 cs

Enhancing low energy reconstruction and classification in KM3NeT/ORCA with transformers

Este estudio demuestra que la incorporación de máscaras de atención inspiradas en la física y el diseño del detector en modelos transformadores mejora significativamente la reconstrucción y clasificación de neutrinos de baja energía en el telescopio KM3NeT/ORCA, optimizando además la transferencia de conocimiento entre diferentes configuraciones.

Iván Mozún Mateo (on behalf of the KM3NeT collaboration)2026-03-10🔭 astro-ph

Automating Deception: Scalable Multi-Turn LLM Jailbreaks

Este artículo presenta un pipeline automatizado para generar a gran escala ataques de jailbreak multi-turno basados en el principio psicológico "Pie en la Puerta", revelando que la historia conversacional aumenta drásticamente la vulnerabilidad de los modelos de la familia GPT, mientras que Gemini 2.5 Flash demuestra una resistencia excepcional.

Adarsh Kumarappan, Ananya Mujoo2026-03-10🤖 cs.LG

Computing Evolutionarily Stable Strategies in Multiplayer Games

El artículo presenta un algoritmo para calcular todas las estrategias evolutivamente estables en juegos de forma normal no degenerados con tres o más jugadores.

Sam Ganzfried2026-03-10📈 econ

RadDiff: Retrieval-Augmented Denoising Diffusion for Protein Inverse Folding

El artículo presenta RadDiff, un nuevo método de plegamiento inverso de proteínas que combina un mecanismo de recuperación de conocimiento actualizado con un modelo de difusión denoising para superar las limitaciones de los enfoques existentes y lograr una tasa de recuperación de secuencias superior.

Jin Han, Tianfan Fu, Wu-Jun Li2026-03-10💻 cs

ForamDeepSlice: A High-Accuracy Deep Learning Framework for Foraminifera Species Classification from 2D Micro-CT Slices

Este estudio presenta ForamDeepSlice, un marco de aprendizaje profundo basado en un ensemble de redes neuronales convolucionales que logra una precisión del 95,64% en la clasificación automática de especies de foraminíferos a partir de rebanadas 2D de micro-TC, ofreciendo además una herramienta interactiva para su despliegue práctico en geociencias.

Abdelghafour Halimi, Ali Alibrahim, Didier Barradas-Bautista, Ronell Sicat, Abdulkader M. Afifi2026-03-10🤖 cs.LG

Integrating a Causal Foundation Model into a Prescriptive Maintenance Framework for Optimising Production-Line OEE

Este artículo propone un marco de mantenimiento prescriptivo que integra un modelo fundacional causal para simular intervenciones y optimizar la Eficacia Global del Equipo (OEE) mediante la identificación de causas raíz y la recomendación de acciones correctivas específicas.

Felix Saretzky, Lucas Andersen, Thomas Engel, Fazel Ansari2026-03-10💻 cs

AltNet: Addressing the Plasticity-Stability Dilemma in Reinforcement Learning

El artículo presenta AltNet, un enfoque basado en redes gemelas que resuelve el dilema de plasticidad-estabilidad en el aprendizaje por refuerzo al permitir la restauración periódica de la plasticidad mediante el intercambio de roles entre dos redes, logrando así una mayor eficiencia y rendimiento sin sufrir caídas temporales en el desempeño.

Mansi Maheshwari, John C. Raisbeck, Bruno Castro da Silva2026-03-10🤖 cs.LG

← Anterior Siguiente →