cs.CL artigos | Gist.Science

Stochastic Self-Organization in Multi-Agent Systems

O artigo apresenta o SelfOrg, um framework de auto-organização estocástica para sistemas multiagentes baseados em LLMs que otimiza dinamicamente a comunicação entre agentes sem supervisão externa, utilizando valores de Shapley para construir grafos direcionados que garantem a propagação eficiente de respostas de alta qualidade e demonstram ganhos significativos de desempenho, especialmente com modelos mais fracos.

Nurbek Tastan, Samuel Horvath, Karthik NandakumarTue, 10 Ma🤖 cs.LG

FOR-Prompting: From Objection to Revision via an Asymmetric Prompting Protocol

O artigo apresenta o FOR-Prompting, um protocolo de prompt assimétrico que melhora a precisão e a qualidade de respostas de modelos de linguagem, inclusive em dispositivos com recursos limitados, ao estruturar uma interação onde um "Defensor" propõe soluções e um "Debatedor" formula objeções sem oferecer correções diretas, permitindo refinamento iterativo sem necessidade de treinamento ou acesso aos parâmetros internos do modelo.

He Zhang, Anzhou Zhang, Jian DaiTue, 10 Ma💬 cs.CL

Tree-based Dialogue Reinforced Policy Optimization for Red-Teaming Attacks

O artigo apresenta o DialTree, um framework de otimização de política reforçada baseado em árvores que descobre autonomamente estratégias de ataque multi-turno mais eficazes para testar a segurança de modelos de linguagem, superando significativamente os métodos existentes em taxa de sucesso.

Ruohao Guo, Afshin Oroojlooy, Roshan Sridhar, Miguel Ballesteros, Alan Ritter, Dan RothTue, 10 Ma🤖 cs.LG

Idiom Understanding as a Tool to Measure the Dialect Gap

Este artigo propõe o uso de expressões idiomáticas regionais como um novo benchmark para medir a lacuna dialetal em modelos de linguagem, demonstrando através de três novos conjuntos de dados em francês que a proficiência no padrão metropolitano não garante a compreensão do dialeto quebequense, onde a maioria dos modelos apresenta desempenho significativamente inferior.

David Beauchemin, Yan Tremblay, Mohamed Amine Youssef, Richard KhouryTue, 10 Ma💬 cs.CL

Tiny but Mighty: A Software-Hardware Co-Design Approach for Efficient Multimodal Inference on Battery-Powered Small Devices

O artigo apresenta o NANOMIND, um framework de co-design hardware-software que otimiza a inferência de Modelos Multimodais Grandes em dispositivos portáteis com bateria, dividindo os modelos em módulos executados em aceleradores heterogêneos para reduzir o consumo de energia e o uso de memória, permitindo assistentes inteligentes autônomos e totalmente locais.

Yilong Li, Shuai Zhang, Yijing Zeng, Hao Zhang, Xinmiao Xiong, Jingyu Liu, Pan Hu, Suman BanerjeeTue, 10 Ma💬 cs.CL

ACE: Attribution-Controlled Knowledge Editing for Multi-hop Factual Recall

O artigo propõe o ACE, um framework de edição de conhecimento baseado em atribuição neuronal que identifica e edita caminhos de consulta-valor críticos para melhorar significativamente a recuperação de fatos em múltiplas etapas em Grandes Modelos de Linguagem, superando os métodos atuais ao abordar a representação dinâmica de sujeitos implícitos nas cadeias de raciocínio.

Jiayu Yang, Yuxuan Fan, Songning Lai, Shengen Wu, Jiaqi Tang, Chun Kang, Zhijiang Guo, Yutao YueTue, 10 Ma💬 cs.CL

R-WoM: Retrieval-augmented World Model For Computer-use Agents

O artigo propõe o R-WoM, um modelo de mundo aumentado por recuperação que integra conhecimento factual externo para mitigar alucinações e melhorar a precisão de simulações de longo prazo em agentes de uso de computador, superando as limitações dos Grandes Modelos de Linguagem tradicionais.

Kai Mei, Jiang Guo, Shuaichen Chang, Mingwen Dong, Dongkyu Lee, Xing Niu, Jiarong JiangTue, 10 Ma💬 cs.CL

HypoSpace: Evaluating LLM Creativity as Set-Valued Hypothesis Generators under Underdetermination

O artigo apresenta o HypoSpace, uma nova suite de diagnóstico que avalia a criatividade de modelos de linguagem ao gerar conjuntos de hipóteses em problemas subdeterminados, revelando que, embora a precisão das propostas seja alta, a diversidade e a cobertura das explicações admissíveis degradam-se significativamente à medida que o espaço de soluções cresce.

Tingting Chen, Beibei Lin, Zifeng Yuan, Qiran Zou, Hongyu He, Anirudh Goyal, Yew-Soon Ong, Dianbo LiuTue, 10 Ma💬 cs.CL

KrishokBondhu: A Retrieval-Augmented Voice-Based Agricultural Advisory Call Center for Bengali Farmers

O artigo apresenta o KrishokBondhu, um sistema de consultoria agrícola baseado em voz e no framework de Geração Aumentada por Recuperação (RAG) para agricultores bengali, que integra manuais especializados e inteligência artificial para fornecer orientações em tempo real via telefone, demonstrando no piloto uma melhoria significativa na qualidade e riqueza contextual das respostas em comparação com benchmarks existentes.

Mohd Ruhul Ameen, Akif Islam, Farjana Aktar, M. Saifuzzaman RafatTue, 10 Ma💬 cs.CL

SwiftEmbed: Ultra-Fast Text Embeddings via Static Token Lookup for Real-Time Applications

O SwiftEmbed é um sistema de inferência em Rust que utiliza a busca estática de tokens para oferecer embeddings de texto ultra-rápidos com latência de 1,12 ms e 50.000 requisições por segundo, sendo ideal para aplicações em tempo real que priorizam a velocidade em detrimento da precisão em tarefas complexas de classificação.

Edouard Lansiaux, Antoine Simonet, Eric WielTue, 10 Ma💬 cs.CL

Jr. AI Scientist and Its Risk Report: Autonomous Scientific Exploration from a Baseline Paper

Este artigo apresenta o "Jr. AI Scientist", um sistema autônomo de ponta que simula o fluxo de trabalho de um pesquisador iniciante para gerar contribuições científicas válidas a partir de artigos de base, demonstrando desempenho superior em avaliações automatizadas enquanto identifica riscos e limitações críticos para a aplicação futura desses sistemas.

Atsuyuki Miyai, Mashiro Toyooka, Takashi Otonari, Zaiying Zhao, Kiyoharu AizawaTue, 10 Ma🤖 cs.LG

HatePrototypes: Interpretable and Transferable Representations for Implicit and Explicit Hate Speech Detection

O artigo "HatePrototypes" propõe representações vetoriais interpretáveis e transferíveis, derivadas de poucos exemplos por classe, que permitem a detecção eficiente de discurso de ódio explícito e implícito sem a necessidade de repetidos ajustes finos, utilizando uma abordagem de saída antecipada sem parâmetros.

Irina Proskurina, Marc-Antoine Carpentier, Julien VelcinTue, 10 Ma💬 cs.CL

SPOT: An Annotated French Corpus and Benchmark for Detecting Critical Interventions in Online Conversations

O artigo apresenta o SPOT, o primeiro corpus anotado em francês e benchmark para detectar "pontos de parada" (intervenções críticas sutis) em conversas online, demonstrando que modelos codificadores supervisionados superam grandes modelos de linguagem em tarefas de classificação de comentários em redes sociais.

Manon Berriche, Célia Nouri, Chloée Clavel, Jean-Philippe CointetTue, 10 Ma💬 cs.CL

Multimodal LLMs Do Not Compose Skills Optimally Across Modalities

O artigo demonstra que os Modelos de Linguagem Grandes Multimodais (MLLMs) atuais apresentam uma lacuna significativa na composição de habilidades entre modalidades, a qual permanece substancial mesmo após a aplicação de técnicas de prompting e ajuste fino.

Paula Ontalvilla, Aitor Ormazabal, Gorka AzkuneTue, 10 Ma💬 cs.CL

Stealth Fine-Tuning: Efficiently Breaking Alignment in RVLMs Using Self-Generated CoT

Este artigo apresenta o "Stealth Fine-Tuning", um método de baixo custo que quebra a segurança de Modelos de Linguagem Visão-Raciocínio (RVLMs) ao induzir traços de raciocínio prejudiciais e utilizá-los para ajuste fino, superando significativamente os métodos de ataque existentes enquanto preserva a capacidade geral de raciocínio.

Le Yu, Zhengyue Zhao, Yawen Zheng, Yunhao LiuTue, 10 Ma💬 cs.CL

Process-Centric Analysis of Agentic Software Systems

Este artigo apresenta o Graphectory, uma abordagem centrada em processos para analisar e monitorar em tempo real sistemas de software agênticos, permitindo a identificação e correção de trajetórias ineficientes, o que resulta em taxas de resolução significativamente maiores e trajetórias mais curtas.

Shuyang Liu, Yang Chen, Rahul Krishna, Saurabh Sinha, Jatin Ganhotra, Reyhan JabbarvandTue, 10 Ma💬 cs.CL

SETUP: Sentence-level English-To-Uniform Meaning Representation Parser

Este artigo apresenta o SETUP, um novo parser para representação de significado uniforme (UMR) em inglês que combina métodos de ajuste fino e conversão de dependências universais para alcançar ganhos substanciais na precisão da geração automática de gráficos semânticos.

Emma Markle, Javier Gutierrez Bach, Shira WeinTue, 10 Ma💬 cs.CL

Parallel Decoder Transformer: Planner-Seeded Latent Coordination for Synchronized Parallel Decoding

O artigo apresenta o Parallel Decoder Transformer (PDT), uma arquitetura que internaliza a coordenação de geração paralela em modelos de linguagem congelados, utilizando um planejador inicial e um mecanismo de "Dynamic Notes Bus" para sincronizar múltiplos fluxos de decodificação sem depender de orquestração externa.

Logan RobbinsTue, 10 Ma💬 cs.CL

CompanionCast: Toward Social Collaboration with Multi-Agent Systems in Shared Experiences

O artigo apresenta o CompanionCast, um quadro geral que orquestra múltiplos agentes de IA especializados para simular dinâmicas de grupo autênticas em experiências compartilhadas, demonstrando através de estudos com torcedores de futebol que o sistema melhora significativamente a presença social e o compartilhamento emocional em comparação com o consumo solitário de mídia.

Yiyang Wang, Chen Chen, Tica Lin, Vishnu Raj, Josh Kimball, Alex Cabral, Josiah HesterTue, 10 Ma💬 cs.CL

Adaptation of Agentic AI: A Survey of Post-Training, Memory, and Skills

Este artigo apresenta uma pesquisa abrangente sobre a adaptação de agentes de IA pós-treinamento, organizando o campo fragmentado em um framework de quatro paradigmas que engloba a adaptação do agente e das ferramentas, analisando métodos de pós-treinamento, arquiteturas de memória adaptativa e habilidades de agentes, além de discutir suas compensações, práticas de avaliação e desafios futuros.

Pengcheng Jiang, Jiacheng Lin, Zhiyi Shi, Zifeng Wang, Luxi He, Yichen Wu, Ming Zhong, Peiyang Song, Qizheng Zhang, Heng Wang, Xueqiang Xu, Hanwen Xu, Pengrui Han, Dylan Zhang, Jiashuo Sun, Chaoqi Yang, Kun Qian, Tian Wang, Changran Hu, Manling Li, Quanzheng Li, Hao Peng, Sheng Wang, Jingbo Shang, Chao Zhang, Jiaxuan You, Liyuan Liu, Pan Lu, Yu Zhang, Heng Ji, Yejin Choi, Dawn Song, Jimeng Sun, Jiawei HanTue, 10 Ma💬 cs.CL

← Anterior Próximo →