cs.LG artigos | Gist.Science

GATech at AbjadGenEval Shared Task: Multilingual Embeddings for Arabic Machine-Generated Text Classification

O artigo descreve a abordagem da GATech na tarefa compartilhada AbjadGenEval, onde o ajuste fino do codificador multilíngue E5-large com pooling médio alcançou um F1 de 0,75 na classificação de texto árabe gerado por IA, superando métodos de pooling mais complexos devido à estabilidade e à observação de que textos humanos tendem a ser significativamente mais longos que os gerados por máquinas.

Ahmed Khaled Khamis2026-03-12💬 cs.CL

GATech at AbjadMed: Bidirectional Encoders vs. Causal Decoders: Insights from 82-Class Arabic Medical Classification

Este artigo demonstra que, para a classificação de textos médicos árabes em 82 categorias, os codificadores bidirecionais especializados (como o AraBERTv2) superam os decodificadores causais ao capturar com mais precisão as fronteiras semânticas necessárias, mesmo diante de desequilíbrio de classes e ruído nos dados.

Ahmed Khaled Khamis2026-03-12💬 cs.CL

Personalized Group Relative Policy Optimization for Heterogenous Preference Alignment

O artigo apresenta o Personalized GRPO (P-GRPO), um novo framework de alinhamento que supera as limitações do GRPO padrão ao normalizar vantagens com base em históricos específicos de grupos de preferência, permitindo assim uma convergência mais rápida e um alinhamento eficaz com preferências humanas heterogêneas sem sacrificar capacidades gerais.

Jialu Wang, Heinrich Peters, Asad A. Butt, Navid Hashemi, Alireza Hashemi, Pouya M. Ghari, Joseph Hoover, James Rae, Morteza Dehghani2026-03-12🤖 cs.LG

Defining AI Models and AI Systems: A Framework to Resolve the Boundary Problem

Este artigo propõe definições conceituais e operacionais claras para distinguir "modelos de IA" de "sistemas de IA", com base em uma revisão sistemática da literatura e de documentos regulatórios, visando resolver ambiguidades na atribuição de responsabilidades aos diferentes atores da cadeia de valor de IA e facilitar a implementação de regulamentações como o AI Act da UE.

Yuanyuan Sun, Timothy Parker, Lara Gierschmann, Sana Shams, Teo Canmetin, Mathieu Duteil, Rokas Gipiškis, Ze Shen Chin2026-03-12🤖 cs.AI

LWM-Temporal: Sparse Spatio-Temporal Attention for Wireless Channel Representation Learning

O LWM-Temporal é um modelo de base para canais sem fio que utiliza atenção espaciotemporal esparsa alinhada à propagação e pré-treinamento auto-supervisionado para aprender representações universais e transferíveis que capturam a evolução induzida pela mobilidade, superando abordagens existentes em tarefas de previsão de canal, especialmente em horizontes longos e com dados limitados.

Sadjad Alikhani, Akshay Malhotra, Shahab Hamidi-Rad, Ahmed Alkhateeb2026-03-12🤖 cs.LG

HTM-EAR: Importance-Preserving Tiered Memory with Hybrid Routing under Saturation

O artigo apresenta o HTM-EAR, um sistema de memória hierárquica que combina armazenamento de trabalho baseado em HNSW com armazenamento de arquivo e um mecanismo de roteamento híbrido para preservar informações essenciais e manter alta precisão em consultas sob condições de saturação, superando significativamente abordagens tradicionais como LRU.

Shubham Kumar Singh2026-03-12🤖 cs.AI

Tureis: Transformer-based Unified Resilience for IoT Devices in Smart Homes

O Tureis é um método auto-supervisionado e baseado em Transformers que detecta e localiza falhas em sensores de casas inteligentes com múltiplos residentes e falhas simultâneas, oferecendo alta precisão e eficiência para implantação em dispositivos de borda sem a necessidade de dados rotulados.

Alireza Borhani, Vafa Andalibi, Bahar Asgari2026-03-12💻 cs

Evaluating Generalization Mechanisms in Autonomous Cyber Attack Agents

Este artigo avalia os mecanismos de generalização de agentes cibernéticos autônomos em cenários de reatribuição de IPs, descobrindo que, embora agentes baseados em LLMs superem outros métodos em tarefas não vistas, eles o fazem às custas de maior consumo computacional, menor transparência e falhas práticas como loops de ação inválida.

Ondřej Lukáš, Jihoon Shin, Emilia Rivas, Diego Forni, Maria Rigaki, Carlos Catania, Aritran Piplai, Christopher Kiekintveld, Sebastian Garcia2026-03-12💻 cs

Safety Under Scaffolding: How Evaluation Conditions Shape Measured Safety

Este estudo demonstra que as condições de avaliação, particularmente o formato das perguntas (múltipla escolha versus aberto), têm um impacto maior na segurança medida dos modelos de linguagem do que as arquiteturas de scaffolding em si, revelando que as classificações de segurança não são generalizáveis e variam drasticamente dependendo do modelo e da configuração de implantação.

David Gringras2026-03-12🤖 cs.AI

Gated Adaptation for Continual Learning in Human Activity Recognition

Este artigo propõe um framework de aprendizado contínuo eficiente em parâmetros para reconhecimento de atividades humanas em dispositivos IoT, que utiliza modulação por portas em canais de representações pré-treinadas congeladas para adaptar modelos a novos sujeitos com alta precisão e estabilidade, minimizando drasticamente o esquecimento catastrófico sem a necessidade de buffers de replay ou transmissão de dados sensíveis.

Reza Rahimi Azghan, Gautham Krishna Gudur, Mohit Malu, Edison Thomaz, Giulia Pedrielli, Pavan Turaga, Hassan Ghasemzadeh2026-03-12🤖 cs.LG

Revisiting Sharpness-Aware Minimization: A More Faithful and Effective Implementation

Este artigo propõe o XSAM, uma implementação aprimorada e mais fiel da Minimização Sensível à Acurácia (SAM) que supera as limitações das abordagens atuais ao estimar explicitamente a direção do máximo e otimizar o espaço de busca, resultando em melhor generalização com custo computacional insignificante.

Jianlong Chen, Zhiming Zhou2026-03-12🤖 cs.LG

InFusionLayer: a CFA-based ensemble tool to generate new classifiers for learning and modeling

Este artigo apresenta o \texttt{InFusionLayer}, uma ferramenta de ensemble em Python baseada na Análise de Fusão Combinatória (CFA) que integra funções de característica de pontuação-rank (RSC) e diversidade cognitiva (CD) para otimizar problemas de classificação multiclasse em fluxos de trabalho de aprendizado de máquina, como PyTorch, TensorFlow e Scikit-learn.

Eric Roginek, Jingyan Xu, D. Frank. Hsu2026-03-12🤖 cs.LG

Where Do Flow Semantics Reside? A Protocol-Native Tabular Pretraining Paradigm for Encrypted Traffic Classification

O artigo propõe o FlowSem-MAE, um paradigma de pré-treinamento tabular nativo de protocolos que, ao tratar as unidades semânticas de fluxo como prioridades arquitetônicas e corrigir vieses indutivos da modelagem baseada em bytes, supera significativamente os métodos atuais de classificação de tráfego criptografado com apenas metade dos dados rotulados.

Sizhe Huang, Shujie Yang2026-03-12🤖 cs.AI

OmniGuide: Universal Guidance Fields for Enhancing Generalist Robot Policies

O artigo apresenta o OMNIGUIDE, um framework universal que aprimora significativamente o desempenho de políticas robóticas generalistas (VLA) em tarefas complexas ao integrar diversas fontes de orientação como funções de energia diferenciáveis que influenciam a geração de ações no espaço 3D.

Yunzhou Song, Long Le, Yong-Hyun Park, Jie Wang, Junyao Shi, Lingjie Liu, Jiatao Gu, Eric Eaton, Dinesh Jayaraman, Kostas Daniilidis2026-03-12💻 cs

Cluster-Aware Attention-Based Deep Reinforcement Learning for Pickup and Delivery Problems

Este artigo apresenta o CAADRL, um framework de Aprendizado por Reforço Profundo baseado em atenção que explora explicitamente a estrutura de aglomerados dos problemas de coleta e entrega por meio de codificação multiescala e decodificação hierárquica, alcançando desempenho competitivo com tempos de inferência significativamente menores em comparação com métodos colaborativos existentes.

Wentao Wang, Lifeng Han, Guangyu Zou2026-03-12🤖 cs.LG

Quantization of Ricci Curvature in Information Geometry

Este artigo resolve uma conjectura de 20 anos sobre a quantização da curvatura de Ricci em bitnets, provando que a média do escalar de Ricci é quantizada em semi-inteiros positivos para redes em árvore e completas, mas refutando a generalidade da conjectura ao apresentar contraexemplos com ciclos e estendendo a análise para redes Gaussianas, onde se observa uma dicotomia de sinal entre curvaturas positivas e negativas.

Carlos C. Rodriguez2026-03-12🔢 math

Training Language Models via Neural Cellular Automata

O artigo propõe o uso de autômatos celulares neurais para gerar dados sintéticos não linguísticos que, ao serem utilizados em uma fase de pré-pré-treinamento, melhoram significativamente a eficiência, a convergência e o desempenho em tarefas de raciocínio de modelos de linguagem grandes, superando até mesmo o pré-treinamento com grandes volumes de texto natural.

Dan Lee, Seungwook Han, Akarsh Kumar, Pulkit Agrawal2026-03-12🤖 cs.LG

HTMuon: Improving Muon via Heavy-Tailed Spectral Correction

O artigo apresenta o HTMuon, um otimizador que melhora o treinamento de modelos de linguagem grandes ao corrigir a supressão de espectros de pesos de cauda pesada no Muon original, resultando em melhor desempenho e fundamentação teórica baseada na teoria de auto-regularização de cauda pesada.

Tianyu Pang, Yujie Fang, Zihang Liu, Shenyang Deng, Lei Hsiung, Shuhua Yu, Yaoqing Yang2026-03-12🤖 cs.LG

Improving Search Agent with One Line of Code

O artigo propõe o SAPO, uma modificação de uma única linha no algoritmo GRPO que estabiliza o treinamento de agentes de busca ao aplicar uma restrição condicional de KL em nível de token, eliminando o colapso catastrófico causado pelo desvio na distribuição de amostragem e resultando em melhorias significativas de desempenho em benchmarks de perguntas e respostas.

Jian Li, Dongsheng Chen, Zhenhua Xu, Yizhang Jin, Jiafu Wu, Chengjie Wang, Xiaotong Yuan, Yabiao Wang2026-03-12🤖 cs.LG

Dissecting Chronos: Sparse Autoencoders Reveal Causal Feature Hierarchies in Time Series Foundation Models

Este estudo aplica autoencoders esparsos ao modelo Chronos-T5-Large para revelar uma hierarquia causal de características em séries temporais, demonstrando que os recursos mais críticos para a previsão residem nas camadas intermediárias de detecção de mudanças abruptas, e não nas camadas finais semanticamente mais ricas.

Anurag Mishra2026-03-12🤖 cs.LG

← Anterior Próximo →