Enhancing Heterogeneous Multi-Agent Cooperation in Decentralized MARL via GNN-driven Intrinsic Rewards

이 논문은 부분 관측성과 희소한 보상 신호 하에서 분산형 환경에 있는 이종 다중 에이전트의 협력을 향상시키기 위해 그래프 신경망 (GNN) 기반의 내재적 보상을 활용하는 'CoHet' 알고리즘을 제안하고, 이를 통해 기존 최첨단 방법보다 우수한 성능을 입증합니다.

Jahir Sadik Monon, Deeparghya Dutta Barua, Md. Mosaddek KhanWed, 11 Ma🤖 cs.AI

Sparse Variational Student-t Processes for Heavy-tailed Modeling

이 논문은 대규모 데이터셋에서 이상치와 heavy-tail 분포를 효과적으로 모델링하기 위해 희소 유도점 방법을 Student-t 프로세스로 확장한 'Sparse Variational Student-t Processes(SVTP)' 프레임워크와 두 가지 새로운 추론 알고리즘을 제안하며, 이를 통해 기존 희소 가우시안 프로세스 대비 뛰어난 예측 정확도와 수렴 속도를 달성함을 보여줍니다.

Jian Xu, Delu Zeng, John PaisleyWed, 11 Ma🤖 cs.AI

Robust Training of Neural Networks at Arbitrary Precision and Sparsity

이 논문은 양자화와 희소화 연산에서 발생하는 불연속성 문제를 해결하기 위해 양자화를 첨가 노이즈로 모델링하고, 이를 보정하는 정교한 기울기 경로를 제공하는 통합 프레임워크를 제안하여 임의의 정밀도와 희소성 수준에서 안정적으로 신경망을 학습시키는 방법을 제시합니다.

Chengxi Ye, Grace Chu, Yanfeng Liu, Yichi Zhang, Lukasz Lew, Li Zhang, Mark Sandler, Andrew HowardWed, 11 Ma🤖 cs.AI

DRUPI: Dataset Reduction Using Privileged Information

이 논문은 기존 데이터 축소 기법에 특징 또는 주의 주석과 같은 '우월 정보(Privileged Information)'를 추가로 합성하여 모델 학습을 보조함으로써, ImageNet-1K 등 다양한 데이터셋에서 기존 방법들의 성능을 획기적으로 향상시킨 'DRUPI' 방법을 제안합니다.

Shaobo Wang, Youxin Jiang, Tianle Niu, Yantai Yang, Ruiji Zhang, Shuhao Hu, Shuaiyu Zhang, Chenghao Sun, Weiya Li, Conghui He, Xuming Hu, Linfeng ZhangWed, 11 Ma🤖 cs.AI

On the Impact of the Utility in Semivalue-based Data Valuation

이 논문은 시미밸류 기반 데이터 가치 평가의 유틸리티 선택에 따른 민감도 문제를 해결하기 위해 데이터 포인트를 저차원 공간에 매핑하는 '공간 서명' 개념을 도입하고, 이를 통해 유틸리티 변경에 따른 평가 결과의 강건성을 정량적으로 측정하는 실용적인 방법론을 제시합니다.

Mélissa Tamine, Benjamin Heymann, Maxime Vono, Patrick LoiseauWed, 11 Ma🤖 cs.AI

MKE-Coder: Multi-Axial Knowledge with Evidence Verification in ICD Coding for Chinese EMRs

이 논문은 중국어 전자 의료 기록 (EMR) 의 간결한 작성 스타일과 구조적 복잡성, 그리고 기존 방법의 한계를 극복하기 위해 4 가지 코딩 축의 다차원 지식과 임상 증거 검증을 통합한 새로운 ICD 자동 코딩 프레임워크인 MKE-Coder 를 제안하고, 대규모 데이터셋 실험을 통해 코딩 정확도와 속도의 향상을 입증했습니다.

Xinxin You, Xien Liu, Xue Yang, Ziyi Wang, Ji WuWed, 11 Ma🤖 cs.AI

LLM-Advisor: An LLM Benchmark for Cost-efficient Path Planning across Multiple Terrains

이 논문은 다양한 지형에서의 비용 효율적 경로 계획 문제를 해결하기 위해 기존 플래너를 수정하지 않고 LLM 을 후처리 어드바이저로 활용하는 'LLM-Advisor' 프레임워크와 새로운 평가 데이터셋을 제안하며, 이를 통해 기존 최선 경로 알고리즘의 비용 효율성을 상당 부분 개선할 수 있음을 입증합니다.

Ling Xiao, Toshihiko YamasakiWed, 11 Ma🤖 cs.AI

GateLens: A Reasoning-Enhanced LLM Agent for Automotive Software Release Analytics

이 논문은 자연어 쿼리를 관계 대수 (Relational Algebra) 를 통한 중간 표현으로 변환하여 실행 가능한 코드를 생성하는 'GateLens'라는 LLM 에이전트 아키텍처를 제안함으로써, 자동차 소프트웨어 릴리스 분석에서 기존 CoT 기반 시스템보다 복잡한 질의 처리 정확도와 속도를 획기적으로 개선하고 분석 시간을 80% 이상 단축하는 성과를 입증했습니다.

Arsham Gholamzadeh Khoee, Shuai Wang, Robert Feldt, Dhasarathy Parthasarathy, Yinan YuWed, 11 Ma🤖 cs.AI

A Consequentialist Critique of Binary Classification Evaluation: Theory, Practice, and Tools

이 논문은 기계 학습의 이진 분류 평가가 임계값과 기저율 전반에 걸친 예측 품질을 우선시하는 결과주의적 관점 (적절한 스코어링 규칙 등) 으로 전환해야 함을 주장하며, 현재 관행과의 간극을 해소하기 위한 이론적 프레임워크, 새로운 평가 지표, 그리고 실용적 Python 도구인 `briertools`를 제시합니다.

Gerardo Flores, Abigail Schiff, Alyssa H. Smith, Julia A Fukuyama, Ashia C. WilsonWed, 11 Ma🤖 cs.AI

Let's Verify Math Questions Step by Step

이 논문은 수학 문제의 유효성을 검증하기 위해 형식 검증, 조건 분해, 모순 탐지, 완전성 확인의 5 단계 파이프라인을 제안하고, 이를 통해 기존 벤치마크에서 최첨단 성능을 달성하여 신뢰할 수 있는 수학 데이터셋 구축을 가능하게 하는 'MathQ-Verify'를 소개합니다.

Chengyu Shen, Zhen Hao Wong, Runming He, Hao Liang, Meiyi Qiang, Zimo Meng, Zhengyang Zhao, Bohan Zeng, Zhengzhou Zhu, Bin Cui, Wentao ZhangWed, 11 Ma🤖 cs.AI

UltraEdit: Training-, Subject-, and Memory-Free Lifelong Editing in Language Models

이 논문은 기존 방법론보다 7 배 이상 빠르고 VRAM 사용량을 4 분의 1 로 줄여 24GB 소비자용 GPU 에서 7B 크기의 언어 모델을 편집할 수 있을 뿐만 아니라, 200 만 건 이상의 편집을 지원하면서도 정확도를 유지하는 'UltraEdit'라는 새로운 효율적이고 확장 가능한 평생 학습 기반 모델 편집 프레임워크를 제안합니다.

Xiaojie Gu, Ziying Huang, Jia-Chen Gu, Kai ZhangWed, 11 Ma🤖 cs.AI

Cooperative Game-Theoretic Credit Assignment for Multi-Agent Policy Gradients via the Core

이 논문은 협력적 다중 에이전트 강화학습의 신용 할당 문제를 해결하기 위해 협력 게임 이론의 코어 (core) 개념을 도입하여 연합별 기여도를 평가하고 할당하는 CORA 알고리즘을 제안하며, 이를 통해 에이전트 간 조율된 최적 행동을 유도하고 기존 방법들보다 우수한 성능을 입증합니다.

Mengda Ji, Genjiu Xu, Keke Jia, Zekun Duan, Yong Qiu, Jianjun Ge, Mingqiang LiWed, 11 Ma🤖 cs.AI

Towards Robust Real-World Multivariate Time Series Forecasting: A Unified Framework for Dependency, Asynchrony, and Missingness

이 논문은 실제 세계의 다변량 시계열 데이터에서 발생하는 채널 간 의존성, 비동기적 샘플링, 결측치 문제를 동시에 해결하기 위해 제안된 'ChannelTokenFormer'라는 트랜스포머 기반 프레임워크를 소개하고, 이를 통해 다양한 실제 환경에서 뛰어난 예측 성능과 견고성을 입증했습니다.

Jinkwan Jang, Hyungjin Park, Jinmyeong Choi, Taesup KimWed, 11 Ma🤖 cs.AI