cs.AI artigos | Gist.Science

Yukthi Opus: A Multi-Chain Hybrid Metaheuristic for Large-Scale NP-Hard Optimization

O artigo apresenta o Yukthi Opus, uma metaheurística híbrida multi-cadeia que integra MCMC, busca local gulosa e recozimento simulado para resolver problemas de otimização NP-difíceis sob restrições de orçamento de avaliação, demonstrando desempenho competitivo e robustez em benchmarks como Rastrigin, Rosenbrock e o Problema do Caixeiro Viajante.

SB Danush Vikraman, Hannah Abigail, Prasanna Kesavraj + 1 more2026-03-06💻 cs

When Do Tools and Planning Help Large Language Models Think? A Cost- and Latency-Aware Benchmark

Este estudo avalia o impacto do uso de ferramentas e planejamento em tempo de inferência em modelos de linguagem de grande escala, demonstrando que, embora essas abordagens possam melhorar significativamente a precisão em tarefas complexas de raciocínio baseadas em conhecimento, elas frequentemente resultam em aumentos drásticos de latência e custo sem benefícios consistentes em tarefas mais simples, destacando a necessidade de escolhas estratégicas e conscientes de custos entre o tamanho do modelo e a complexidade do agente.

Subha Ghoshal, Ali Al-Bustami2026-03-06💻 cs

Interleaved Tool-Call Reasoning for Protein Function Understanding

O artigo propõe o PFUA, um agente de raciocínio aumentado por ferramentas que supera as limitações dos modelos puramente textuais na previsão de funções proteicas ao integrar decomposição de problemas e ferramentas biológicas específicas, alcançando uma melhoria média de desempenho de 103% em quatro benchmarks.

Chuanliu Fan, Zicheng Ma, Huanran Meng + 6 more2026-03-06💻 cs

Identifying Good and Bad Neurons for Task-Level Controllable LLMs

O artigo apresenta o NeuronLLM, um novo framework que identifica tanto neurônios facilitadores quanto inibidores em Grandes Modelos de Linguagem para tarefas específicas, utilizando aprendizado contrastivo e conjuntos de perguntas aumentados para superar as limitações dos métodos anteriores e oferecer uma compreensão mais holística da organização funcional desses modelos.

Wenjie Li, Guansong Pang, Hezhe Qiao + 2 more2026-03-06💻 cs

Controlled LLM Training on Spectral Sphere

Este artigo apresenta o Otimizador da Esfera Espectral (SSO), um novo algoritmo de treinamento que impõe restrições espectrais estritas a pesos e atualizações para garantir estabilidade e convergência em larga escala, superando o desempenho do AdamW e do Muon em diversas arquiteturas de modelos grandes.

Tian Xie, Haoming Luo, Haoyu Tang + 9 more2026-03-06💻 cs

EmboTeam: Grounding LLM Reasoning into Reactive Behavior Trees via PDDL for Embodied Multi-Robot Collaboration

O artigo apresenta o EmboTeam, um framework inovador para planejamento de tarefas em equipes de robôs heterogêneos que integra raciocínio de modelos de linguagem (LLMs), planejamento clássico baseado em PDDL e árvores de comportamento reativas para melhorar significativamente a execução de tarefas de longo prazo em ambientes domésticos.

Haishan Zeng, Mengna Wang, Peng Li2026-03-06💻 cs

"What if she doesn't feel the same?" What Happens When We Ask AI for Relationship Advice

Este estudo revela que os utilizadores estão altamente satisfeitos com conselhos de relacionamentos gerados por IA, e essa satisfação, associada à perceção de fiabilidade e utilidade do modelo, melhora significativamente as suas atitudes gerais e confiança nos sistemas de IA.

Niva Manchanda, Akshata Kishore Moharir, Ratna Kandala2026-03-06💻 cs

ButterflyMoE: Sub-Linear Ternary Experts via Structured Butterfly Orbits

O artigo apresenta o ButterflyMoE, um método que supera a limitação de memória linear em dispositivos de borda ao representar múltiplos especialistas como reorientações geométricas de um substrato compartilhado ternário, alcançando uma redução de 150 vezes no uso de memória com perda de precisão negligenciável.

Aryan Karmore2026-03-06💻 cs

Yuan3.0 Ultra: A Trillion-Parameter Enterprise-Oriented MoE LLM

O artigo apresenta o Yuan3.0 Ultra, um modelo de linguagem aberto de grande escala baseado em Mistura de Especialistas (MoE) com 1010B de parâmetros totais e 68,8B ativados, que introduz o algoritmo de Poda de Especialistas Adaptativa por Camada (LAEP) para otimizar a eficiência do pré-treinamento e alcançar desempenho líder em tarefas corporativas.

YuanLab. ai, :, Shawn Wu + 25 more2026-03-06💻 cs

Where is the multimodal goal post? On the Ability of Foundation Models to Recognize Contextually Important Moments

Este trabalho avalia a capacidade de modelos fundacionais multimodais de identificar momentos importantes em vídeos de futebol, demonstrando que seu desempenho é próximo ao acaso devido à dependência de uma única modalidade e à falta de sinergia entre fontes, o que destaca a necessidade de arquiteturas modulares e procedimentos de treinamento complementares.

Aditya K Surikuchi, Raquel Fernández, Sandro Pezzelle2026-03-06💻 cs

A Scalable Inter-edge Correlation Modeling in CopulaGNN for Link Sign Prediction

Este artigo propõe uma abordagem escalável para a previsão de sinais em links de grafos assinados, baseada no modelo CopulaGNN, que utiliza uma representação eficiente de matrizes de correlação e uma reformulação probabilística para superar limitações computacionais, garantindo convergência linear e desempenho competitivo.

Jinkyu Sung, Myunggeum Jee, Joonseok Lee2026-03-06💻 cs

Mobility-Embedded POIs: Learning What A Place Is and How It Is Used from Human Movement

O artigo apresenta o framework ME-POIs, que aprimora as representações de pontos de interesse ao integrar dados de mobilidade humana em larga escala com embeddings linguísticos, capturando efetivamente a função e o uso real dos locais e superando abordagens baseadas apenas em texto ou mobilidade em tarefas de enriquecimento de mapas.

Maria Despoina Siampou, Shushman Choudhury, Shang-Ling Hsu + 2 more2026-03-06💻 cs

PerfGuard: A Performance-Aware Agent for Visual Content Generation

O artigo apresenta o PerfGuard, um framework de agente consciente de desempenho para geração de conteúdo visual que supera as limitações de abordagens existentes ao modelar sistematicamente os limites de desempenho das ferramentas através de seleção baseada em pontuação, atualização adaptativa de preferências e otimização de planejamento alinhada às capacidades, resultando em maior precisão, confiabilidade e alinhamento com a intenção do usuário.

Zhipeng Chen, Zhongrui Zhang, Chao Zhang + 5 more2026-03-06💻 cs

YuriiFormer: A Suite of Nesterov-Accelerated Transformers

O artigo apresenta o YuriiFormer, uma nova arquitetura de transformadores baseada em um quadro variacional que interpreta as camadas como iterações de otimização, permitindo a incorporação de aceleração de Nesterov para superar o desempenho de modelos padrão como o nanoGPT.

Aleksandr Zimin, Yury Polyanskiy, Philippe Rigollet2026-03-06🔢 math

Replacing Parameters with Preferences: Federated Alignment of Heterogeneous Vision-Language Models

O artigo propõe o MoR, um framework de alinhamento federado para modelos de visão e linguagem heterogêneos que substitui a troca de parâmetros pela agregação adaptativa de preferências locais via GRPO e mistura de recompensas, garantindo privacidade e melhor generalização sem expor dados brutos.

Shule Lu, Yujing Wang, Hainan Zhang + 5 more2026-03-06💻 cs

Adaptive Rollout Allocation for Online Reinforcement Learning with Verifiable Rewards

O artigo apresenta o VIP, uma estratégia de alocação de rolagens adaptativa que utiliza um modelo de processo gaussiano para prever probabilidades de sucesso e otimizar a distribuição do orçamento computacional, minimizando a variância do gradiente e melhorando a eficiência de amostragem no aprendizado por reforço com recompensas verificáveis.

Hieu Trung Nguyen, Bao Nguyen, Wenao Ma + 3 more2026-03-06💻 cs

Towards Exploratory and Focused Manipulation with Bimanual Active Perception: A New Problem, Benchmark and Strategy

Este trabalho apresenta o novo problema de Manipulação Exploratória e Focada (EFM), estabelecendo o benchmark EFM-10 e uma estratégia de Percepção Ativa Bimanual (BAP) que utiliza um braço para visão ativa e outro para sensoriamento de força, validando sua eficácia através de um conjunto de dados e aprendizado por imitação para superar oclusões visuais em tarefas de manipulação desafiadoras.

Yuxin He, Ruihao Zhang, Tianao Shen + 2 more2026-03-06💻 cs

On the Non-Identifiability of Steering Vectors in Large Language Models

Este artigo demonstra que os vetores de direção usados para controlar o comportamento de grandes modelos de linguagem são fundamentalmente não identificáveis, pois perturbações ortogonais produzem efeitos equivalentes, revelando assim limites intrínsecos na interpretabilidade dessas intervenções.

Sohan Venkatesh, Ashish Mahendran Kurapath2026-03-06💻 cs

LatentChem: From Textual CoT to Latent Thinking in Chemical Reasoning

O artigo apresenta o LatentChem, uma interface de raciocínio latente que desacopla o cálculo químico da geração textual, permitindo que modelos realizem inferências complexas diretamente no espaço contínuo, o que resulta em uma precisão superior e um aumento de 10,84 vezes na velocidade de inferência em comparação com métodos tradicionais de Cadeia de Pensamento explícita.

Xinwu Ye, Yicheng Mao, Jia Zhang + 16 more2026-03-06🔬 physics

Supervised Metric Regularization Through Alternating Optimization for Multi-Regime Physics-Informed Neural Networks

Este artigo propõe o TAPINN, uma arquitetura de Redes Neurais Informadas pela Física que utiliza Regularização Métrica Supervisionada e Otimização Alternada para mitigar o viés espectral e o colapso de modos em sistemas dinâmicos com transições de regime abruptas, alcançando uma convergência estável e maior precisão física com menos parâmetros do que os métodos existentes.

Enzo Nicolas Spotorno, Josafat Ribeiro Leal, Antonio Augusto Frohlich2026-03-06🔬 physics

← Anterior Próximo →