MAcPNN: Mutual Assisted Learning on Data Streams with Temporal Dependence

O artigo propõe o MAcPNN, um paradigma de aprendizado mútuo assistido baseado na Teoria Sociocultural de Vygotsky e em Redes Neurais Progressivas Contínuas (cPNN), que permite que dispositivos IoT autônomos melhorem seu desempenho em fluxos de dados com dependência temporal e deriva de conceito, solicitando assistência apenas quando necessário para evitar o esquecimento e reduzir a comunicação em comparação com a Aprendizagem Federada tradicional.

Federico Giannini, Emanuele Della ValleWed, 11 Ma🤖 cs.LG

Data-driven robust Markov decision processes on Borel spaces: performance guarantees via an axiomatic approach

Este artigo apresenta uma abordagem axiomática para processos de decisão de Markov robustos em espaços de Borel com distribuições de perturbação desconhecidas, demonstrando que, ao definir conjuntos de ambiguidade baseados em funções de distância, é possível garantir limites de desempenho fora da amostra com alta probabilidade e taxas de convergência que os processos empíricos tradicionais não conseguem oferecer.

Sivaramakrishnan RamaniWed, 11 Ma🤖 cs.LG

MAPLE: Elevating Medical Reasoning from Statistical Consensus to Process-Led Alignment

O artigo apresenta o MAPLE, uma nova abordagem que integra modelos de recompensa de processo médico ao Aprendizado por Reforço em Tempo de Teste, substituindo a votação majoritária por supervisão alinhada a especialistas para melhorar o raciocínio médico e superar os métodos atuais.

Kailong Fan, Anqi Pu, Yichen Wu, Wanhua Li, Yicong Li, Hanspeter Pfister, Huafeng Liu, Xiang Li, Quanzheng Li, Ning GuoWed, 11 Ma🤖 cs.LG

Statistical Inference via Generative Models: Flow Matching and Causal Inference

Este livro propõe uma reinterpretação estatística da IA generativa, utilizando o Flow Matching como exemplo central para transformar modelos generativos em ferramentas de inferência estatística rigorosa que permitem imputação de dados, análise contrafactual e inferência causal em problemas de alta dimensionalidade, mantendo a validade inferencial através de técnicas como ortogonalização e cross-fitting.

Shinto EguchiWed, 11 Ma🤖 cs.LG

The Coupling Within: Flow Matching via Distilled Normalizing Flows

O artigo propõe o Normalized Flow Matching (NFM), um novo método que utiliza o acoplamento quase determinístico de modelos de fluxo normalizante pré-treinados para treinar modelos de fluxo de destino, resultando em desempenho superior tanto em relação aos modelos de fluxo tradicionais quanto ao próprio modelo professor.

David Berthelot, Tianrong Chen, Jiatao Gu, Marco Cuturi, Laurent Dinh, Bhavik Chandna, Michal Klein, Josh Susskind, Shuangfei ZhaiWed, 11 Ma🤖 cs.LG

An accurate flatness measure to estimate the generalization performance of CNN models

Este trabalho propõe uma medida de planicidade exata e fiel à arquitetura para Redes Neurais Convolucionais (CNNs), derivando uma expressão fechada para o traço do Hessiano que considera as simetrias de escalonamento e interações de filtros, demonstrando empiricamente sua eficácia como ferramenta robusta para estimar o desempenho de generalização e orientar o design de modelos.

Rahman Taleghani, Maryam Mohammadi, Francesco MarchettiWed, 11 Ma🤖 cs.LG

When to Retrain after Drift: A Data-Only Test of Post-Drift Data Size Sufficiency

O artigo apresenta o CALIPER, um método independente de detector e modelo que utiliza apenas dados para determinar o tamanho amostral pós-desvio necessário para uma re-treinagem estável, identificando o momento adequado para retreinar com base em uma tendência de erro decrescente e garantindo eficiência computacional em cenários de aprendizado em fluxo.

Ren Fujiwara, Yasuko Matsubara, Yasushi SakuraiWed, 11 Ma🤖 cs.LG

SCALAR: Learning and Composing Skills through LLM Guided Symbolic Planning and Deep RL Grounding

O artigo apresenta o SCALAR, um framework bidirecional que combina planejamento com LLMs e aprendizado por reforço profundo para iterativamente refinar habilidades simbólicas através de feedback de execução, alcançando desempenho superior em tarefas complexas como as do ambiente Craftax.

Renos Zabounidis, Yue Wu, Simon Stepputtis, Woojun Kim, Yuanzhi Li, Tom Mitchell, Katia SycaraWed, 11 Ma🤖 cs.LG

FlexServe: A Fast and Secure LLM Serving System for Mobile Devices with Flexible Resource Isolation

O artigo apresenta o FlexServe, um sistema de inferência de LLMs para dispositivos móveis que utiliza o TrustZone da ARM com mecanismos de isolamento de recursos flexíveis (Flex-Mem e Flex-NPU) para garantir segurança e desempenho, alcançando acelerações significativas no tempo de resposta em comparação com designs anteriores.

Yinpeng Wu, Yitong Chen, Lixiang Wang, Jinyu Gu, Zhichao Hua, Yubin XiaWed, 11 Ma🤖 cs.LG

From Days to Minutes: An Autonomous AI Agent Achieves Reliable Clinical Triage in Remote Patient Monitoring

O artigo apresenta o "Sentinel", um agente de IA autônomo que supera os médicos individuais na triagem de sinais vitais de monitoramento remoto de pacientes, alcançando alta sensibilidade e consistência a um custo mínimo, o que resolve o problema de escalabilidade que limitou estudos clínicos anteriores.

Seunghwan Kim (AnsibleHealth Inc., San Francisco, USA), Tiffany H. Kung (AnsibleHealth Inc., San Francisco, USA, Stanford School of Medicine, Stanford, USA), Heena Verma (AnsibleHealth Inc., San Francisco, USA), Dilan Edirisinghe (AnsibleHealth Inc., San Francisco, USA), Kaveh Sedehi (AnsibleHealth Inc., San Francisco, USA), Johanna Alvarez (AnsibleHealth Inc., San Francisco, USA), Diane Shilling (AnsibleHealth Inc., San Francisco, USA), Audra Lisa Doyle (AnsibleHealth Inc., San Francisco, USA), Ajit Chary (AnsibleHealth Inc., San Francisco, USA), William Borden (AnsibleHealth Inc., San Francisco, USA, George Washington University, Washington, D.C., USA), Ming Jack Po (AnsibleHealth Inc., San Francisco, USA)Wed, 11 Ma🤖 cs.AI

Sim2Act: Robust Simulation-to-Decision Learning via Adversarial Calibration and Group-Relative Perturbation

O artigo propõe o Sim2Act, um framework robusto de aprendizado de simulação para decisão que utiliza calibração adversarial e perturbação relativa a grupos para alinhar a fidelidade da simulação com o impacto das decisões e estabilizar políticas em ambientes incertos, superando as limitações de abordagens existentes em domínios críticos como cadeias de suprimentos.

Hongyu Cao, Jinghan Zhang, Kunpeng Liu, Dongjie Wang, Feng Xia, Haifeng Chen, Xiaohua Hu, Yanjie FuWed, 11 Ma🤖 cs.AI

Quality over Quantity: Demonstration Curation via Influence Functions for Data-Centric Robot Learning

O artigo propõe o método "Quality over Quantity" (QoQ), que utiliza funções de influência para identificar e selecionar sistematicamente demonstrações de alta qualidade em aprendizado de robótica, melhorando o desempenho da política ao priorizar a contribuição de cada amostra na redução do erro de validação em vez de apenas aumentar o volume de dados.

Haeone Lee, Taywon Min, Junsu Kim, Sinjae Kang, Fangchen Liu, Lerrel Pinto, Kimin LeeWed, 11 Ma🤖 cs.LG

Adaptive Active Learning for Online Reliability Prediction of Satellite Electronics

Este artigo propõe um novo framework integrado de previsão de confiabilidade online para eletrônica de satélites, combinando um modelo de degradação baseado em processo de Wiener com um esquema de aprendizado ativo adaptativo para superar a escassez de dados e a variabilidade entre unidades, demonstrando maior precisão e eficiência em estudos de caso como o da estação espacial Tiangong.

Shixiang Li, Yubin Tian, Dianpeng Wang, Piao Chen, Mengying RenWed, 11 Ma🤖 cs.LG

Verifying Good Regulator Conditions for Hypergraph Observers: Natural Gradient Learning from Causal Invariance via Established Theorems

Este artigo verifica que observadores persistentes em substratos de hipergrafos satisfazem o Teorema do Bom Regulador de Conant-Ashby, demonstrando que a descida de gradiente natural é a regra de aprendizado admissível e derivando um parâmetro de regime específico para o framework de Vanchurin, embora essa previsão seja fortemente dependente do modelo escolhido.

Max ZhuravlevWed, 11 Ma🤖 cs.LG

Not All News Is Equal: Topic- and Event-Conditional Sentiment from Finetuned LLMs for Aluminum Price Forecasting

Este estudo demonstra que a integração de scores de sentimento derivados de notícias em inglês e chinês, extraídos por modelos de linguagem (LLMs) ajustados como o Qwen3, com dados tabulares tradicionais, melhora significativamente a previsão de preços do alumínio e o desempenho econômico em mercados voláteis, superando modelos base apenas em dados numéricos.

Alvaro Paredes Amorin, Andre Python, Christoph WeisserWed, 11 Ma🤖 cs.AI