cs.LG artigos | Gist.Science

Beyond Mapping : Domain-Invariant Representations via Spectral Embedding of Optimal Transport Plans

Este trabalho propõe uma abordagem de adaptação de domínio que gera representações invariantes através da incorporação espectral de planos de transporte ótimo suavizados, demonstrando desempenho superior em benchmarks de reconhecimento acústico e detecção de defeitos em cabos elétricos.

Abdel Djalil Sad Saoud, Fred Maurice Ngolè Mboula, Hanane Slimani2026-03-09🤖 cs.LG

Laser interferometry as a robust neuromorphic platform for machine learning

O artigo apresenta um método robusto para implementar redes neurais ópticas utilizando apenas recursos lineares e estados coerentes de luz, onde a não linearidade necessária para o aprendizado é alcançada através de codificação de fase, permitindo treinamento e inferência *in situ* com alta resiliência à perda de fótons.

Amanuel Anteneh, Kyungeun Kim, J. M. Schwarz, Israel Klich, Olivier Pfister2026-03-09🔬 physics.optics

Neural Signals Generate Clinical Notes in the Wild

O artigo apresenta o CELM, o primeiro modelo fundamental de EEG clínico para linguagem, que gera relatórios clínicos completos a partir de gravações de EEG de longa duração, alcançando melhorias significativas nas métricas de geração em comparação com métodos existentes.

Jathurshan Pradeepkumar, Zheng Chen, Jimeng Sun2026-03-09🤖 cs.AI

Online unsupervised Hebbian learning in deep photonic neuromorphic networks

Os autores apresentam e demonstram experimentalmente uma rede neural fotônica profunda que realiza aprendizado não supervisionado online e totalmente óptico, utilizando materiais de mudança de fase para sinapses e um mecanismo de feedback local, alcançando reconhecimento de letras com 100% de precisão sem conversões elétrico-ópticas.

Xi Li, Disha Biswas, Peng Zhou, Wesley H. Brigner, Anna Capuano, Joseph S. Friedman, Qing Gu2026-03-09🔬 physics.optics

ZK-HybridFL: Zero-Knowledge Proof-Enhanced Hybrid Ledger for Federated Learning

O artigo propõe o ZK-HybridFL, um framework descentralizado de aprendizado federado que integra um ledger em DAG com sidechains e provas de conhecimento zero para validar atualizações de modelos com privacidade, garantindo maior segurança, escalabilidade e desempenho em comparação a abordagens existentes.

Amirhossein Taherpour, Xiaodong Wang2026-03-09🤖 cs.LG

EDIS: Diagnosing LLM Reasoning via Entropy Dynamics

O artigo propõe o EDIS, uma métrica que analisa a evolução temporal da entropia durante a geração de texto para identificar padrões de instabilidade característicos de raciocínio incorreto em LLMs, permitindo melhorar a precisão do modelo tanto na seleção durante a inferência quanto na curadoria de dados para treinamento.

Chenghua Zhu, Siyan Wu, Xiangkang Zeng, Zishan Xu, Zhaolu Kang, Yifu Guo, Yuquan Lu, Junduan Huang, Guojing Zhou2026-03-09🤖 cs.LG

Restoring Exploration after Post-Training: Latent Exploration Decoding for Large Reasoning Models

O artigo propõe a Decodificação de Exploração Latente (LED), uma estratégia de decodificação que explora a assimetria de entropia entre as camadas intermediárias e finais de Modelos de Raciocínio Grandes pós-treinados para restaurar a eficácia da exploração e melhorar a precisão sem necessidade de treinamento adicional.

Wenhui Tan, Fiorenzo Parascandolo, Enver Sangineto, Jianzhong Ju, Zhenbo Luo, Qian Cao, Rita Cucchiara, Ruihua Song, Jian Luan2026-03-09🤖 cs.LG

Stress-Testing Alignment Audits With Prompt-Level Strategic Deception

Este artigo apresenta um pipeline automático de red-team que demonstra como estratégias de decepção em nível de prompt podem enganar tanto métodos de auditoria de alinhamento de caixa branca quanto de caixa preta, fornecendo a primeira evidência documentada de decepção estratégica baseada em ativações e sugerindo que as técnicas atuais não são robustas contra modelos desalinhados suficientemente capazes.

Oliver Daniels, Perusha Moodley, Benjamin M. Marlin, David Lindner2026-03-09🤖 cs.LG

Latent Poincaré Shaping for Agentic Reinforcement Learning

O artigo apresenta o LaPha, um método que treina agentes de IA semelhantes ao AlphaZero em um espaço latente de Poincaré, utilizando a geometria hiperbólica para otimizar a busca e os processos de recompensa, resultando em melhorias significativas de desempenho em tarefas matemáticas complexas como MATH-500 e AIME.

Hanchen Xia, Baoyou Chen, Zelin Zang, Yutang Ge, Guojiang Zhao, Siyu Zhu2026-03-09🤖 cs.LG

Validating Interpretability in siRNA Efficacy Prediction: A Perturbation-Based, Dataset-Aware Protocol

Este artigo propõe um protocolo de validação baseado em perturbação para mapas de saliência em previsões de eficácia de siRNA, demonstrando que a validação prévia é essencial para evitar falhas de generalização e introduzindo um regularizador biológico (BioPrior) que melhora a fidelidade das explicações com um custo preditivo moderado.

Zahra Khodagholi, Niloofar Yousefi2026-03-09🤖 cs.LG

Towards Autonomous Mathematics Research

O artigo apresenta o Aletheia, um agente de pesquisa matemática autônomo que, combinando raciocínio avançado, escalabilidade na inferência e uso intensivo de ferramentas, gera e revisa soluções em linguagem natural para problemas que vão desde olimpíadas até contribuições originais em pesquisa acadêmica, como a descoberta de constantes estruturais e a resolução de questões abertas, ao mesmo tempo que propõe novos padrões para medir autonomia e transparência na colaboração humano-IA.

Tony Feng, Trieu H. Trinh, Garrett Bingham, Dawsen Hwang, Yuri Chervonyi, Junehyuk Jung, Joonkyung Lee, Carlo Pagano, Sang-hyun Kim, Federico Pasqualotto, Sergei Gukov, Jonathan N. Lee, Junsu Kim, Kaiying Hou, Golnaz Ghiasi, Yi Tay, YaGuang Li, Chenkai Kuang, Yuan Liu, Hanzhao Lin, Evan Zheran Liu, Nigamaa Nayakanti, Xiaomeng Yang, Heng-Tze Cheng, Demis Hassabis, Koray Kavukcuoglu, Quoc V. Le, Thang Luong2026-03-09🤖 cs.AI

Stochastic Parroting in Temporal Attention -- Regulating the Diagonal Sink

Este artigo investiga o viés de "diagonal sink" em mecanismos de atenção temporal, demonstrando teoricamente como as pontuações de atenção fora da diagonal dependem do comprimento da sequência e propondo métodos de regularização para mitigar a degeneração de informações.

Victoria Hankemeier, Malte Schilling2026-03-09🤖 cs.LG

SWE-MiniSandbox: Container-Free Reinforcement Learning for Building Software Engineering Agents

O artigo apresenta o SWE-MiniSandbox, uma abordagem leve e sem containers que utiliza mecanismos isolados no nível do kernel e técnicas de pré-armazenamento para reduzir drasticamente a sobrecarga de disco e o tempo de configuração no treinamento de agentes de engenharia de software por aprendizado por reforço, mantendo desempenho comparável ao dos pipelines baseados em containers.

Danlong Yuan, Wei Wu, Zhengren Wang, Xueliang Zhao, Huishuai Zhang, Dongyan Zhao2026-03-09🤖 cs.AI

MiDAS: A Multimodal Data Acquisition System and Dataset for Robot-Assisted Minimally Invasive Surgery

O artigo apresenta o MiDAS, um sistema de código aberto e agnóstico à plataforma que permite a aquisição não invasiva e sincronizada de dados multimodais para cirurgia robótica minimamente invasiva, validado em robôs Raven-II e da Vinci Xi e acompanhado de um novo conjunto de dados anotados que inclui tarefas de sutura de reparo de hérnia.

Keshara Weerasinghe (MD), Seyed Hamid Reza Roodabeh (MD), Andrew Hawkins (MD), Zhaomeng Zhang, Zachary Schrader, Homa Alemzadeh2026-03-09🤖 cs.LG

An Adaptive Model Selection Framework for Demand Forecasting under Horizon-Induced Degradation to Support Business Strategy and Operations

Este estudo propõe o AHSIV, um framework adaptativo de seleção de modelos para previsão de demanda que integra métricas de erro ajustadas ao horizonte de previsão e classificação estrutural da demanda para resolver a instabilidade de rankings em ambientes heterogêneos, oferecendo uma solução operacionalmente coerente para decisões multi-SKU.

Adolfo González, Víctor Parada2026-03-09🤖 cs.AI

GaiaFlow: Semantic-Guided Diffusion Tuning for Carbon-Frugal Search

O artigo apresenta o GaiaFlow, um framework inovador que utiliza ajuste de difusão guiado semanticamente e protocolos de saída adaptativa para otimizar a busca neural, reduzindo significativamente a pegada de carbono enquanto mantém alta precisão em diversas infraestruturas computacionais.

Rong Fu, Jia Yee Tan, Chunlei Meng, Shuo Yin, Xiaowen Ma, Wangyu Wu, Muge Qi, Guangzhen Yao, Zhaolu Kang, Zeli Su, Simon Fong2026-03-09🤖 cs.LG

MolCrystalFlow: Molecular Crystal Structure Prediction via Flow Matching

O artigo apresenta o MolCrystalFlow, um modelo generativo baseado em fluxo que prevê estruturas de cristais moleculares ao desacoplar a complexidade intramolecular do empacotamento intermolecular, representando centros e orientações em variedades Riemannianas para respeitar simetrias geométricas e acelerar a descoberta de materiais.

Cheng Zeng, Harry W. Sullivan, Thomas Egg, Maya M. Martirossyan, Philipp Höllmer, Jirui Jin, Richard G. Hennig, Adrian Roitberg, Stefano Martiniani, Ellad B. Tadmor, Mingjie Liu2026-03-09🔬 cond-mat.mtrl-sci

The Limits of Long-Context Reasoning in Automated Bug Fixing

Este estudo demonstra que, apesar do desempenho promissor de modelos de linguagem em fluxos de trabalho agênicos para correção de bugs, a capacidade de raciocínio em contextos longos é limitada, pois o sucesso depende da decomposição de tarefas em etapas de contexto curto, enquanto a geração de patches em contextos genuinamente longos (64k tokens) resulta em degradação severa de desempenho devido a falhas sistemáticas.

Ravi Raju, Mengmeng Ji, Shubhangi Upasani, Bo Li, Urmish Thakker2026-03-09🤖 cs.LG

FLoRG: Federated Fine-tuning with Low-rank Gram Matrices and Procrustes Alignment

O artigo apresenta o FLoRG, um framework de ajuste fino federado que utiliza agregação de matrizes de Gram de baixa ordem e alinhamento de Procrustes para eliminar erros de agregação, reduzir a deriva de decomposição e diminuir significativamente a sobrecarga de comunicação, superando os métodos existentes em precisão e eficiência.

Chuiyang Meng, Ming Tang, Vincent W. S. Wong2026-03-09🤖 cs.AI

Conditionally Site-Independent Neural Evolution of Antibody Sequences

O artigo apresenta o CoSiNE, um modelo que combina cadeias de Markov contínuas com redes neurais para capturar a dinâmica evolutiva e as interações epistáticas em anticorpos, superando os métodos atuais na previsão de efeitos de variantes e permitindo a otimização direcionada da afinidade de ligação.

Stephen Zhewen Lu, Aakarsh Vermani, Kohei Sanno, Jiarui Lu, Frederick A Matsen, Milind Jagota, Yun S. Song2026-03-09🤖 cs.LG

← Anterior Próximo →