cs.AI 편의 논문 | Gist.Science

PnLCalib: Sports Field Registration via Points and Lines Optimization

이 논문은 다양한 카메라 각도와 가려짐으로 인한 어려움을 극복하기 위해 3D 축구장 모델과 검출된 필드 라인을 비선형 최적화 과정에 활용하는 'PnLCalib'라는 새로운 최적화 기반 보정 파이프라인을 제안하여 기존 방법들보다 향상된 정확도와 견고성을 달성했다고 설명합니다.

Marc Gutiérrez-Pérez, Antonio AgudoWed, 11 Ma🤖 cs.AI

Enhancing Heterogeneous Multi-Agent Cooperation in Decentralized MARL via GNN-driven Intrinsic Rewards

이 논문은 부분 관측성과 희소한 보상 신호 하에서 분산형 환경에 있는 이종 다중 에이전트의 협력을 향상시키기 위해 그래프 신경망 (GNN) 기반의 내재적 보상을 활용하는 'CoHet' 알고리즘을 제안하고, 이를 통해 기존 최첨단 방법보다 우수한 성능을 입증합니다.

Jahir Sadik Monon, Deeparghya Dutta Barua, Md. Mosaddek KhanWed, 11 Ma🤖 cs.AI

Sparse Variational Student-t Processes for Heavy-tailed Modeling

이 논문은 대규모 데이터셋에서 이상치와 heavy-tail 분포를 효과적으로 모델링하기 위해 희소 유도점 방법을 Student-t 프로세스로 확장한 'Sparse Variational Student-t Processes(SVTP)' 프레임워크와 두 가지 새로운 추론 알고리즘을 제안하며, 이를 통해 기존 희소 가우시안 프로세스 대비 뛰어난 예측 정확도와 수렴 속도를 달성함을 보여줍니다.

Jian Xu, Delu Zeng, John PaisleyWed, 11 Ma🤖 cs.AI

Robust Training of Neural Networks at Arbitrary Precision and Sparsity

이 논문은 양자화와 희소화 연산에서 발생하는 불연속성 문제를 해결하기 위해 양자화를 첨가 노이즈로 모델링하고, 이를 보정하는 정교한 기울기 경로를 제공하는 통합 프레임워크를 제안하여 임의의 정밀도와 희소성 수준에서 안정적으로 신경망을 학습시키는 방법을 제시합니다.

Chengxi Ye, Grace Chu, Yanfeng Liu, Yichi Zhang, Lukasz Lew, Li Zhang, Mark Sandler, Andrew HowardWed, 11 Ma🤖 cs.AI

DRUPI: Dataset Reduction Using Privileged Information

이 논문은 기존 데이터 축소 기법에 특징 또는 주의 주석과 같은 '우월 정보(Privileged Information)'를 추가로 합성하여 모델 학습을 보조함으로써, ImageNet-1K 등 다양한 데이터셋에서 기존 방법들의 성능을 획기적으로 향상시킨 'DRUPI' 방법을 제안합니다.

Shaobo Wang, Youxin Jiang, Tianle Niu, Yantai Yang, Ruiji Zhang, Shuhao Hu, Shuaiyu Zhang, Chenghao Sun, Weiya Li, Conghui He, Xuming Hu, Linfeng ZhangWed, 11 Ma🤖 cs.AI

On the Impact of the Utility in Semivalue-based Data Valuation

이 논문은 시미밸류 기반 데이터 가치 평가의 유틸리티 선택에 따른 민감도 문제를 해결하기 위해 데이터 포인트를 저차원 공간에 매핑하는 '공간 서명' 개념을 도입하고, 이를 통해 유틸리티 변경에 따른 평가 결과의 강건성을 정량적으로 측정하는 실용적인 방법론을 제시합니다.

Mélissa Tamine, Benjamin Heymann, Maxime Vono, Patrick LoiseauWed, 11 Ma🤖 cs.AI

MKE-Coder: Multi-Axial Knowledge with Evidence Verification in ICD Coding for Chinese EMRs

이 논문은 중국어 전자 의료 기록 (EMR) 의 간결한 작성 스타일과 구조적 복잡성, 그리고 기존 방법의 한계를 극복하기 위해 4 가지 코딩 축의 다차원 지식과 임상 증거 검증을 통합한 새로운 ICD 자동 코딩 프레임워크인 MKE-Coder 를 제안하고, 대규모 데이터셋 실험을 통해 코딩 정확도와 속도의 향상을 입증했습니다.

Xinxin You, Xien Liu, Xue Yang, Ziyi Wang, Ji WuWed, 11 Ma🤖 cs.AI

LLM-Advisor: An LLM Benchmark for Cost-efficient Path Planning across Multiple Terrains

이 논문은 다양한 지형에서의 비용 효율적 경로 계획 문제를 해결하기 위해 기존 플래너를 수정하지 않고 LLM 을 후처리 어드바이저로 활용하는 'LLM-Advisor' 프레임워크와 새로운 평가 데이터셋을 제안하며, 이를 통해 기존 최선 경로 알고리즘의 비용 효율성을 상당 부분 개선할 수 있음을 입증합니다.

Ling Xiao, Toshihiko YamasakiWed, 11 Ma🤖 cs.AI

HyConEx: Hypernetwork classifier with counterfactual explanations for tabular data

이 논문은 표 형식 데이터를 위해 설계된 하이퍼네트워크 기반의 분류기인 HyConEx 를 제안하여, 정확도 높은 예측과 동시에 모델의 결정 근거를 설명하는 반사실적 예제를 생성하는 통합 딥러닝 모델을 제시합니다.

Patryk Marszałek, Kamil Ksi\k{a}\.zek, Oleksii Furman, Ulvi Movsum-zada, Przemysław Spurek, Marek SmiejaWed, 11 Ma🤖 cs.AI

GateLens: A Reasoning-Enhanced LLM Agent for Automotive Software Release Analytics

이 논문은 자연어 쿼리를 관계 대수 (Relational Algebra) 를 통한 중간 표현으로 변환하여 실행 가능한 코드를 생성하는 'GateLens'라는 LLM 에이전트 아키텍처를 제안함으로써, 자동차 소프트웨어 릴리스 분석에서 기존 CoT 기반 시스템보다 복잡한 질의 처리 정확도와 속도를 획기적으로 개선하고 분석 시간을 80% 이상 단축하는 성과를 입증했습니다.

Arsham Gholamzadeh Khoee, Shuai Wang, Robert Feldt, Dhasarathy Parthasarathy, Yinan YuWed, 11 Ma🤖 cs.AI

A Consequentialist Critique of Binary Classification Evaluation: Theory, Practice, and Tools

이 논문은 기계 학습의 이진 분류 평가가 임계값과 기저율 전반에 걸친 예측 품질을 우선시하는 결과주의적 관점 (적절한 스코어링 규칙 등) 으로 전환해야 함을 주장하며, 현재 관행과의 간극을 해소하기 위한 이론적 프레임워크, 새로운 평가 지표, 그리고 실용적 Python 도구인 `briertools`를 제시합니다.

Gerardo Flores, Abigail Schiff, Alyssa H. Smith, Julia A Fukuyama, Ashia C. WilsonWed, 11 Ma🤖 cs.AI

MCP Bridge: A Lightweight, LLM-Agnostic RESTful Proxy for Model Context Protocol Servers

이 논문은 모바일 및 엣지 환경에서도 MCP 서버를 안전하게 활용할 수 있도록 RESTful 프록시인 'MCP Bridge'를 제안하고, 강화학습을 통해 MCP 도구 호출 성능을 대폭 향상시킨 경량 Qwen 모델을 개발하여 이를 MCPToolBench++ 벤치마크에서 검증했습니다.

Arash Ahmadi, Sarah Sharif, Yaser M. BanadWed, 11 Ma🤖 cs.AI

Stepwise Guided Policy Optimization: Coloring your Incorrect Reasoning in GRPO

이 논문은 그룹 내 모든 응답이 틀린 경우에도 학습 신호를 활용할 수 있도록 단계별 판정 모델을 도입하여 그룹 상대 정책 최적화 (GRPO) 의 한계를 극복하고 추론 능력을 향상시키는 '단계별 유도 정책 최적화 (SGPO)' 프레임워크를 제안합니다.

Peter Chen, Xiaopeng Li, Ziniu Li, Xi Chen, Tianyi LinWed, 11 Ma🤖 cs.AI

Let's Verify Math Questions Step by Step

이 논문은 수학 문제의 유효성을 검증하기 위해 형식 검증, 조건 분해, 모순 탐지, 완전성 확인의 5 단계 파이프라인을 제안하고, 이를 통해 기존 벤치마크에서 최첨단 성능을 달성하여 신뢰할 수 있는 수학 데이터셋 구축을 가능하게 하는 'MathQ-Verify'를 소개합니다.

Chengyu Shen, Zhen Hao Wong, Runming He, Hao Liang, Meiyi Qiang, Zimo Meng, Zhengyang Zhao, Bohan Zeng, Zhengzhou Zhu, Bin Cui, Wentao ZhangWed, 11 Ma🤖 cs.AI

UltraEdit: Training-, Subject-, and Memory-Free Lifelong Editing in Language Models

이 논문은 기존 방법론보다 7 배 이상 빠르고 VRAM 사용량을 4 분의 1 로 줄여 24GB 소비자용 GPU 에서 7B 크기의 언어 모델을 편집할 수 있을 뿐만 아니라, 200 만 건 이상의 편집을 지원하면서도 정확도를 유지하는 'UltraEdit'라는 새로운 효율적이고 확장 가능한 평생 학습 기반 모델 편집 프레임워크를 제안합니다.

Xiaojie Gu, Ziying Huang, Jia-Chen Gu, Kai ZhangWed, 11 Ma🤖 cs.AI

SATURN: SAT-based Reinforcement Learning to Unleash LLMs Reasoning

이 논문은 확장성, 검증 가능성, 그리고 난이도 조절이 가능한 부울 만족도 (SAT) 문제를 기반으로 한 강화 학습 프레임워크인 'SATURN'을 제안하여, LLM 의 추론 능력을 체계적으로 향상시키고 수학 및 프로그래밍 태스크에서도 우수한 성능을 입증했습니다.

Huanyu Liu, Ge Li, Jia Li, Hao Zhu, Kechi Zhang, Yihong DongWed, 11 Ma🤖 cs.AI

Daily-Omni: Towards Audio-Visual Reasoning with Temporal Alignment across Modalities

이 논문은 오디오와 비디오 간의 명시적인 시간적 추론을 요구하는 새로운 벤치마크 'Daily-Omni'를 제안하고, 이를 통해 다양한 멀티모달 대규모 언어 모델들이 교차 모달 시간 정합성 처리에 여전히 어려움을 겪고 있음을 규명했습니다.

Ziwei Zhou, Rui Wang, Zuxuan Wu, Yu-Gang JiangWed, 11 Ma🤖 cs.AI

Rating Quality of Diverse Time Series Data by Meta-learning from LLM Judgment

이 논문은 대규모 언어 모델 (LLM) 의 사전 지식과 메타 러닝을 활용하여 다양한 도메인의 시계열 데이터 품질을 효율적이고 정확하게 평가하는 통합 프레임워크인 'TSRating'을 제안합니다.

Shunyu Wu, Dan Li, Wenjie Feng, Haozheng Ye, Jian Lou, See-Kiong NgWed, 11 Ma🤖 cs.AI

Cooperative Game-Theoretic Credit Assignment for Multi-Agent Policy Gradients via the Core

이 논문은 협력적 다중 에이전트 강화학습의 신용 할당 문제를 해결하기 위해 협력 게임 이론의 코어 (core) 개념을 도입하여 연합별 기여도를 평가하고 할당하는 CORA 알고리즘을 제안하며, 이를 통해 에이전트 간 조율된 최적 행동을 유도하고 기존 방법들보다 우수한 성능을 입증합니다.

Mengda Ji, Genjiu Xu, Keke Jia, Zekun Duan, Yong Qiu, Jianjun Ge, Mingqiang LiWed, 11 Ma🤖 cs.AI

Towards Robust Real-World Multivariate Time Series Forecasting: A Unified Framework for Dependency, Asynchrony, and Missingness

이 논문은 실제 세계의 다변량 시계열 데이터에서 발생하는 채널 간 의존성, 비동기적 샘플링, 결측치 문제를 동시에 해결하기 위해 제안된 'ChannelTokenFormer'라는 트랜스포머 기반 프레임워크를 소개하고, 이를 통해 다양한 실제 환경에서 뛰어난 예측 성능과 견고성을 입증했습니다.

Jinkwan Jang, Hyungjin Park, Jinmyeong Choi, Taesup KimWed, 11 Ma🤖 cs.AI