cs.AI artigos | Gist.Science

REAP the Experts: Why Pruning Prevails for One-Shot MoE compression

O artigo propõe o método REAP, que demonstra que a poda de especialistas é superior à fusão para a compressão de modelos MoE em tarefas generativas, alcançando compressão quase sem perdas ao preservar o controle de roteamento e minimizar o erro de reconstrução.

Mike Lasby, Ivan Lazarevich, Nish Sinnadurai, Sean Lie, Yani Ioannou, Vithursan ThangarasaWed, 11 Ma🤖 cs.AI

RL-100: Performant Robotic Manipulation with Real-World Reinforcement Learning

O artigo apresenta o RL-100, um framework de aprendizado por reforço no mundo real baseado em políticas visuomotoras de difusão que unifica imitação e reforço, alcançando 100% de sucesso em diversas tarefas robóticas complexas e demonstrando alta robustez e eficiência em cenários de implantação prática.

Kun Lei, Huanyu Li, Dongjie Yu, Zhenyu Wei, Lingxiao Guo, Zhennan Jiang, Ziyu Wang, Shiyu Liang, Huazhe XuWed, 11 Ma🤖 cs.AI

From Spatial to Actions: Grounding Vision-Language-Action Model in Spatial Foundation Priors

O artigo apresenta o FALCON, um novo paradigma que integra priores espaciais 3D ricos em modelos de fundação diretamente no cabeçalho de ação de modelos Visão-Linguagem-Ação, permitindo raciocínio espacial robusto e desempenho de ponta em tarefas do mundo real sem comprometer o alinhamento linguístico ou exigir reestruturação arquitetural.

Zhengshen Zhang, Hao Li, Yalun Dai, Zhengbang Zhu, Lei Zhou, Chenchen Liu, Dong Wang, Francis E. H. Tay, Sijin Chen, Ziwei Liu, Yuxiao Liu, Xinghang Li, Pan ZhouWed, 11 Ma🤖 cs.AI

SynHLMA:Synthesizing Hand Language Manipulation for Articulated Object with Discrete Human Object Interaction Representation

O artigo apresenta o SynHLMA, um novo framework que gera sequências de manipulação de mãos para objetos articulados a partir de instruções em linguagem natural, utilizando uma representação discreta de interação mão-objeto e uma perda consciente das juntas para garantir a coerência dinâmica e funcionalidade em tarefas como geração, previsão e interpolação de gestos.

Wang zhi, Yuyan Liu, Liu Liu, Li Zhang, Ruixuan Lu, Dan GuoWed, 11 Ma🤖 cs.AI

GraphKeeper: Graph Domain-Incremental Learning via Knowledge Disentanglement and Preservation

O artigo apresenta o GraphKeeper, um método inovador de aprendizado incremental em grafos que aborda o esquecimento catastrófico em cenários de múltiplos domínios através da disentrelaçamento e preservação de conhecimento, alcançando desempenho superior e compatibilidade com diversos modelos fundamentais de grafos.

Zihao Guo, Qingyun Sun, Ziwei Zhang, Haonan Yuan, Huiping Zhuang, Xingcheng Fu, Jianxin LiWed, 11 Ma🤖 cs.AI

Structured Matrix Scaling for Multi-Class Calibration

Este artigo propõe métodos de recalibração pós-hoc baseados em regressão logística com regularização estruturada para gerenciar o equilíbrio entre viés e variância em cenários de classificação multiclasse, demonstrando ganhos substanciais em relação às técnicas existentes e fornecendo implementações de código aberto eficientes.

Eugène Berta, David Holzmüller, Michael I. Jordan, Francis BachWed, 11 Ma🤖 cs.AI

Lightweight Time Series Data Valuation on Time Series Foundation Models via In-Context Finetuning

O artigo propõe o LTSV, um método leve e eficiente para valoração de dados de séries temporais em modelos fundamentais, que utiliza ajuste fino em contexto e agregação de blocos temporais para superar as limitações computacionais e de dependência temporal dos métodos tradicionais.

Shunyu Wu, Tianyue Li, Yixuan Leng, Jingyi Suo, Jian Lou, Dan Li, See-Kiong NgWed, 11 Ma🤖 cs.AI

MediRound: Multi-Round Entity-Level Reasoning Segmentation in Medical Images

O artigo apresenta o MediRound, um modelo e um novo conjunto de dados (MR-MedSeg) que habilitam a segmentação de imagens médicas por meio de diálogos de múltiplas rodadas com raciocínio em nível de entidade, superando as limitações de métodos anteriores ao incorporar um mecanismo de julgamento e correção para mitigar erros de propagação.

Qinyue Tong, Ziqian Lu, Jun Liu, Rui Zuo, Zheming LuWed, 11 Ma🤖 cs.AI

TSFM in-context learning for time-series classification of bearing-health status

Este artigo apresenta um método de aprendizado em contexto utilizando modelos fundamentais de séries temporais para classificar o estado de saúde de mancais em dados de vibração sem necessidade de ajuste fino, permitindo a previsão de probabilidades de classe através da transformação de sinais de referência em padrões pseudo temporais.

Michel Tokic, Slobodan Djukanovic, Anja von Beuningen, Cheng FengWed, 11 Ma🤖 cs.AI

Research and Prototyping Study of an LLM-Based Chatbot for Electromagnetic Simulations

Este trabalho apresenta um chatbot baseado em modelos de linguagem (Google Gemini 2.0 Flash) que automatiza a geração e resolução de modelos de simulação eletromagnética bidimensionais usando Gmsh e GetDP, reduzindo o tempo de configuração e permitindo a definição de geometrias variáveis e rotinas de pós-processamento personalizadas.

Albert Piwonski, Mirsad HadžiefendicWed, 11 Ma🤖 cs.AI

Mitigating Long-Tail Bias in HOI Detection via Adaptive Diversity Cache

Este artigo propõe o módulo Adaptive Diversity Cache (ADC), uma solução de treinamento livre e plug-and-play que mitiga o viés de cauda longa na detecção de Interação Humano-Objeto (HOI) ao acumular representações de características diversas e de alta confiança durante a inferência, melhorando significativamente a detecção de categorias raras sem necessidade de ajuste adicional.

Yuqiu Jiang, Xiaozhen Qiao, Yifan Chen, Ye Zheng, Zhe Sun, Xuelong LiWed, 11 Ma🤖 cs.AI

Periodic Asynchrony: An On-Policy Approach for Accelerating LLM Reinforcement Learning

Este artigo propõe uma abordagem de assincronia periódica que desacopla a inferência do treinamento em um pipeline produtor-consumidor, alcançando um aumento de 3 a 5 vezes no throughput de RL on-policy para LLMs sem comprometer a precisão ou introduzir viés off-policy.

Jian LuWed, 11 Ma🤖 cs.AI

When Robots Obey the Patch: Universal Transferable Patch Attacks on Vision-Language-Action Models

O artigo apresenta o UPA-RFAS, um quadro unificado que gera um ataque de patch adversarial universal e transferível para modelos Visão-Linguagem-Ação (VLA), capaz de comprometer robôs em cenários de caixa preta, diferentes arquiteturas e transições simulação-realidade ao manipular representações de recursos, atenção e semântica.

Hui Lu, Yi Yu, Yiming Yang, Chenyu Yi, Qixin Zhang, Bingquan Shen, Alex C. Kot, Xudong JiangWed, 11 Ma🤖 cs.AI

Multi-Agent Reinforcement Learning with Communication-Constrained Priors

Este artigo propõe um novo quadro de aprendizado por reforço multiagente que utiliza um prior generalizado de comunicação com restrições e um estimador de informação mútua dual para distinguir e quantificar o impacto de mensagens com e sem perdas na tomada de decisão distribuída, demonstrando eficácia em benchmarks com limitações de comunicação.

Guang Yang, Tianpei Yang, Jingwen Qiao, Yanqing Wu, Jing Huo, Xingguo Chen, Yang GaoWed, 11 Ma🤖 cs.AI

Enhancing Retrieval-Augmented Generation with Entity Linking for Educational Platforms

O artigo propõe o ELERAG, uma arquitetura aprimorada de Geração Aumentada por Recuperação (RAG) que integra a Vinculação de Entidades para melhorar a precisão factual em sistemas de perguntas e respostas educacionais em italiano, demonstrando que estratégias híbridas adaptadas ao domínio superam abordagens padrão em contextos especializados.

Francesco Granata, Francesco Poggi, Misael MongiovìWed, 11 Ma🤖 cs.AI

EMFusion: Conditional Diffusion Framework for Trustworthy Frequency Selective EMF Forecasting in Wireless Networks

O artigo apresenta o EMFusion, um framework de previsão probabilística baseado em difusão condicional que utiliza uma arquitetura U-Net residual com atenção cruzada para realizar previsões multivariadas e seletivas em frequência de campos eletromagnéticos em redes sem fio, superando os modelos existentes ao fornecer estimativas de incerteza calibradas e lidar com medições irregulares.

Zijiang Yan, Yixiang Huang, Jianhua Pei, Hina Tabassum, Luca ChiaraviglioWed, 11 Ma🤖 cs.AI

Small Language Models for Efficient Agentic Tool Calling: Outperforming Large Models with Targeted Fine-tuning

Este artigo demonstra que um modelo de linguagem pequeno (SLM) de 350 milhões de parâmetros, como o OPT-350M, pode superar modelos grandes e complexos na execução de chamadas de ferramentas após um ajuste fino direcionado, alcançando uma taxa de sucesso de 77,55% no ToolBench e oferecendo uma solução mais eficiente em termos de custos para a adoção de IA generativa em escala empresarial.

Polaris Jhandi, Owais Kazi, Shreyas Subramanian, Neel SendasWed, 11 Ma🤖 cs.AI

Reinforcement Learning for Self-Improving Agent with Skill Library

O artigo apresenta o SAGE, um novo framework de Aprendizado por Reforço que utiliza um processo de "Rolloout Sequencial" e recompensas integradas a habilidades para permitir que agentes baseados em Grandes Modelos de Linguagem aprendam e acumulem automaticamente um banco de habilidades, resultando em maior precisão e eficiência em tarefas complexas.

Jiongxiao Wang, Qiaojing Yan, Yawei Wang, Yijun Tian, Soumya Smruti Mishra, Zhichao Xu, Megha Gandhi, Panpan Xu, Lin Lee CheongWed, 11 Ma🤖 cs.AI

MCGI: Manifold-Consistent Graph Indexing for Billion-Scale Disk-Resident Vector Search

O artigo apresenta o MCGI, um método de indexação de grafos geométrico e residente em disco que utiliza a Dimensão Intrínseca Local (LID) para adaptar dinamicamente as estratégias de busca à geometria dos dados, superando significativamente os métodos existentes em termos de throughput e latência em buscas de vizinhos mais próximos aproximados em escala bilionária.

Dongfang ZhaoWed, 11 Ma🤖 cs.AI

CRANE: Causal Relevance Analysis of Language-Specific Neurons in Multilingual Large Language Models

O artigo apresenta o CRANE, um novo framework que identifica neurônios específicos de idiomas em modelos de linguagem multilíngues através de intervenções direcionadas e análise de relevância funcional, superando os métodos baseados apenas em magnitude de ativação ao demonstrar que a especialização linguística é seletiva, mas não exclusiva.

Yifan Le, Yunliang LiWed, 11 Ma🤖 cs.AI

← Anterior Próximo →