cs.LG artigos | Gist.Science

ReactDance: Hierarchical Representation for High-Fidelity and Coherent Long-Form Reactive Dance Generation

O artigo apresenta o ReactDance, um framework de difusão que utiliza uma representação latente hierárquica com quantização escalar finita (HFSQ) e uma estratégia de amostragem não autoregressiva baseada em blocos (BLC) para gerar danças reativas de alta fidelidade e coerência temporal em sequências longas.

Jingzhong Lin, Xinru Li, Yuanyuan Qi + 8 more2026-03-06💻 cs

Learning Virtual Machine Scheduling in Cloud Computing through Language Agents

Este artigo apresenta o MiCo, um framework hierárquico baseado em agentes de linguagem que utiliza grandes modelos de linguagem (LLMs) para projetar heurísticas adaptáveis e generalizáveis, resolvendo com alta eficiência o complexo problema de escalonamento dinâmico de máquinas virtuais em nuvem.

JieHao Wu, Ziwei Wang, Junjie Sheng + 3 more2026-03-06💻 cs

Ice Cream Doesn't Cause Drowning: Benchmarking LLMs Against Statistical Pitfalls in Causal Inference

Este artigo apresenta o CausalPitfalls, um benchmark abrangente que avalia a capacidade de modelos de linguagem de grande escala (LLMs) de superar armadilhas estatísticas comuns na inferência causal, revelando limitações significativas em sua confiabilidade para aplicações do mundo real.

Jin Du, Li Chen, Xun Xian + 6 more2026-03-06💻 cs

ShIOEnv: A Command Evaluation Environment for Grammar-Constrained Synthesis and Execution Behavior Modeling

O artigo apresenta o ShIOEnv, um ambiente de shell Bash compatível com Gymnasium que utiliza síntese baseada em gramática e um sinal de irreduzibilidade auto-supervisionado para gerar 2,1 milhões de pares de entrada-saída, permitindo que modelos aprendam com maior precisão o comportamento de execução de comandos reais, superando as abordagens anteriores livres de execução.

Jarrod Ragsdale, Rajendra Boppana2026-03-06💻 cs

VTool-R1: VLMs Learn to Think with Images via Reinforcement Learning on Multimodal Tool Use

O artigo apresenta o VTool-R1, um framework pioneiro que utiliza aprendizado por reforço para treinar modelos de linguagem e visão (VLMs) a raciocinar de forma multimodal, intercalando texto e etapas visuais intermediárias geradas por ferramentas de edição de imagem, melhorando assim o desempenho em tarefas complexas de questionamento visual.

Mingyuan Wu, Jingcheng Yang, Jize Jiang + 6 more2026-03-06💻 cs

Attribute-Efficient PAC Learning of Sparse Halfspaces with Constant Malicious Noise Rate

Este artigo apresenta um algoritmo de aprendizado PAC eficiente em atributos para hiperplanos esparsos que é robusto a uma taxa constante de ruído malicioso, utilizando variantes simples de programas de minimização de perda de hinge sob condições de concentração e margem.

Shiwei Zeng, Jie Shen2026-03-06💻 cs

Highly Efficient and Effective LLMs with Multi-Boolean Architectures

Este artigo propõe um novo quadro que representa modelos de linguagem grandes com parâmetros booleanos multi-núcleo, permitindo o ajuste fino direto no domínio booleano sem pesos latentes, o que elimina a perda de desempenho e reduz drasticamente a complexidade em comparação com métodos existentes.

Ba-Hien Tran, Van Minh Nguyen2026-03-06💻 cs

Continuous Chain of Thought Enables Parallel Exploration and Reasoning

Este trabalho propõe o raciocínio em cadeia de pensamento com tokens contínuos (CoT2), demonstrando teoricamente e empiricamente que essa abordagem permite a exploração paralela de múltiplos traços de raciocínio, superando métodos tradicionais em eficiência e desempenho em tarefas lógicas complexas.

Halil Alperen Gozeten, M. Emrullah Ildiz, Xuechen Zhang + 3 more2026-03-06💻 cs

SealQA: Raising the Bar for Reasoning in Search-Augmented Language Models

O artigo apresenta o SealQA, um novo benchmark desafiador que avalia modelos de linguagem aumentados por busca em cenários de resultados conflitantes e ruidosos, revelando que mesmo os modelos de ponta atuais falham em tarefas de raciocínio factual e de contexto longo, com desempenho que não melhora consistentemente com o aumento de recursos computacionais.

Thinh Pham, Nguyen Nguyen, Pratibha Zunjare + 3 more2026-03-06💻 cs

FPGA-Enabled Machine Learning Applications in Earth Observation: A Systematic Review

Esta revisão sistemática analisa 68 experimentos que utilizam FPGAs para implantar modelos de aprendizado de máquina em plataformas de observação da Terra, propondo duas taxonomias para otimizar arquiteturas de modelos e estratégias de implementação, seguindo as diretrizes PRISMA 2020 para garantir transparência e reprodutibilidade.

Cédric Léonard, Dirk Stober, Martin Schulz2026-03-06💻 cs

HSG-12M: A Large-Scale Benchmark of Spatial Multigraphs from the Energy Spectra of Non-Hermitian Crystals

Este artigo apresenta o HSG-12M, o primeiro grande conjunto de dados de multigrafos espaciais contendo 16,7 milhões de grafos espectrais de Hamiltonianos de cristais não hermitianos, gerados automaticamente pela ferramenta Poly2Graph para superar a escassez de dados em física quântica e impulsionar o aprendizado de máquina geométrico.

Xianquan Yan, Hakan Akgün, Kenji Kawaguchi + 2 more2026-03-06🔬 cond-mat.mes-hall

EDINET-Bench: Evaluating LLMs on Complex Financial Tasks using Japanese Financial Statements

O artigo apresenta o EDINET-Bench, um novo benchmark de código aberto baseado em relatórios anuais japoneses para avaliar LLMs em tarefas financeiras complexas, demonstrando que os modelos atuais têm desempenho limitado e destacando a necessidade de ambientes de teste mais realistas e estruturados para superar essas deficiências.

Issa Sugiura, Takashi Ishida, Taro Makino + 4 more2026-03-06💻 cs

SPEED-RL: Faster Training of Reasoning Models via Online Curriculum Learning

O artigo apresenta o SPEED-RL, um método de aprendizado por reforço online que acelera o treinamento de modelos de raciocínio em até 6 vezes ao selecionar dinamicamente exemplos de dificuldade intermediária para maximizar a eficiência do aprendizado sem comprometer a precisão.

Ruiqi Zhang, Daman Arora, Song Mei + 1 more2026-03-06💻 cs

Bures-Wasserstein Flow Matching for Graph Generation

Este artigo apresenta o BWFlow, um novo framework de *Flow Matching* para geração de gráficos que supera as limitações dos métodos atuais ao modelar a evolução conjunta de nós e arestas através de campos aleatórios de Markov e transporte ótimo, garantindo caminhos de probabilidade suaves e melhorando a convergência no treinamento e amostragem.

Keyue Jiang, Jiahao Cui, Xiaowen Dong + 1 more2026-03-06💻 cs

From Bandit Regret to FDR Control: Online Selective Generation with Adversarial Feedback Unlocking

O artigo propõe o ExSUL, um novo framework de aprendizado online para geração seletiva que, ao lidar com feedback adversário parcial, utiliza conversão de arrependimento e "feedback unlocking" para garantir controle rigoroso da Taxa de Descoberta Falsa (FDR) em modelos de linguagem, mantendo alta cobertura de respostas mesmo em ambientes não estacionários.

Minjae Lee, Yoonjae Jung, Sangdon Park2026-03-06💻 cs

Structured Kolmogorov-Arnold Neural ODEs for Interpretable Learning and Symbolic Discovery of Nonlinear Dynamics

O artigo propõe as SKANODEs, uma estrutura que integra redes KAN a Neural ODEs para recuperar estados físicos latentes e descobrir equações simbólicas interpretáveis de sistemas dinâmicos não lineares, superando métodos de caixa preta e clássicos em precisão e robustez.

Wei Liu, Kiran Bacsa, Loon Ching Tang + 1 more2026-03-06🔬 physics

Learning Physical Systems: Symplectification via Gauge Fixing in Dirac Structures

Este trabalho apresenta as Redes de Presimplificação (PSNs), um novo framework que supera as limitações atuais do aprendizado de sistemas físicos ao restaurar a geometria simplética em sistemas com dissipação e restrições holonômicas, como robôs quadrúpedes, através da elevação para uma variedade de dimensão superior baseada em estruturas de Dirac.

Aristotelis Papatheodorou, Pranav Vaidhyanathan, Natalia Ares + 1 more2026-03-06💻 cs

Parameter Stress Analysis in Reinforcement Learning: Applying Synaptic Filtering to Policy Networks

Este artigo analisa a robustez de políticas de aprendizado por reforço aplicando filtros sinápticos como estresse interno e ataques adversariais como estresse externo para classificar parâmetros como frágeis, robustos ou antifrágeis, demonstrando que parâmetros antifrágeis podem melhorar o desempenho do agente sob condições adversas em ambientes de controle contínuo.

Zain ul Abdeen, Ming Jin2026-03-06💻 cs

MuRating: A High Quality Data Selecting Approach to Multilingual Large Language Model Pretraining

O artigo apresenta o MuRating, uma abordagem escalável que transfere sinais de qualidade de dados do inglês para treinar um avaliador multilíngue, permitindo a seleção de conjuntos de dados equilibrados que melhoram significativamente o desempenho de modelos de linguagem grandes em tarefas multilíngues e baseadas em conhecimento.

Zhixun Chen, Ping Guo, Wenhan Han + 10 more2026-03-06💻 cs

Overtone: Cyclic Patch Modulation for Clean, Efficient, and Flexible Physics Emulators

O artigo apresenta o Overtone, um emulador de física baseado em transformadores que utiliza modulação cíclica dinâmica do tamanho dos patches durante a inferência para mitigar erros harmônicos sistemáticos e permitir um ajuste flexível entre precisão e custo computacional, superando os modelos de patches fixos em benchmarks de EDPs.

Payel Mukhopadhyay, Michael McCabe, Ruben Ohana + 1 more2026-03-06💻 cs

← Anterior Próximo →