On the Impact of the Utility in Semivalue-based Data Valuation

이 논문은 시미밸류 기반 데이터 가치 평가의 유틸리티 선택에 따른 민감도 문제를 해결하기 위해 데이터 포인트를 저차원 공간에 매핑하는 '공간 서명' 개념을 도입하고, 이를 통해 유틸리티 변경에 따른 평가 결과의 강건성을 정량적으로 측정하는 실용적인 방법론을 제시합니다.

Mélissa Tamine, Benjamin Heymann, Maxime Vono, Patrick LoiseauWed, 11 Ma🤖 cs.AI

A Distributional Treatment of Real2Sim2Real for Object-Centric Agent Adaptation in Vision-Driven Deformable Linear Object Manipulation

이 논문은 가소성 선형 물체 (DLO) 의 물리적 매개변수에 대한 확률적 추정을 통해 시뮬레이션과 현실 간의 차이를 해소하고, 이를 기반으로 학습된 제어가 추가 미세 조정 없이도 실제 환경에서 성공적으로 적용될 수 있는 통합된 Real2Sim2Real 프레임워크를 제안합니다.

Georgios Kamaras, Subramanian RamamoorthyWed, 11 Ma🤖 cs.LG

Improving clustering quality evaluation in noisy Gaussian mixtures

이 논문은 노이즈가 포함된 가우시안 혼합 모델에서 클러스터링 품질 평가의 신뢰성을 높이기 위해 특징의 분산에 기반한 특징 중요도 재조정 (FIR) 방법을 제안하고, 이를 통해 무지도 학습 환경에서 클러스터링 유효성 지수와 실제 정답 간의 상관관계를 개선한다는 것을 보여줍니다.

Renato Cordeiro de Amorim, Vladimir MakarenkovWed, 11 Ma🤖 cs.LG

A Consequentialist Critique of Binary Classification Evaluation: Theory, Practice, and Tools

이 논문은 기계 학습의 이진 분류 평가가 임계값과 기저율 전반에 걸친 예측 품질을 우선시하는 결과주의적 관점 (적절한 스코어링 규칙 등) 으로 전환해야 함을 주장하며, 현재 관행과의 간극을 해소하기 위한 이론적 프레임워크, 새로운 평가 지표, 그리고 실용적 Python 도구인 `briertools`를 제시합니다.

Gerardo Flores, Abigail Schiff, Alyssa H. Smith, Julia A Fukuyama, Ashia C. WilsonWed, 11 Ma🤖 cs.AI

Concept Drift Guided LayerNorm Tuning for Efficient Multimodal Metaphor Identification

이 논문은 CLIP 인코더의 교차 모달 임베딩에 대한 구형 선형 보간 (SLERP) 을 활용한 '개념 드리프트' 메커니즘과 적응형 레이어노름 튜닝을 결합하여, 멀티모달 은유 식별의 정확도를 높이고 기존 생성 모델 대비 학습 비용을 대폭 절감한 효율적인 프레임워크인 CDGLT 를 제안합니다.

Wenhao Qian, Zhenzhen Hu, Zijie Song, Jia LiWed, 11 Ma🤖 cs.LG

The Gaussian-Multinoulli Restricted Boltzmann Machine: A Potts Model Extension of the GRBM

이 논문은 이진 은닉 유닛을 q-상태 범주형 (포츠) 유닛으로 대체하여 이산적 구조 표현 능력을 향상시킨 가우시안-멀티노이리 제한 볼츠만 머신 (GM-RBM) 을 제안하고, 용량 및 파라미터 매칭 조건 하에서 아날로그 회상 및 구조적 기억 벤치마크에서 기존 모델과 경쟁력 있거나 더 나은 성능을 보임을 입증합니다.

Nikhil Kapasi, Mohamed Elfouly, William Whitehead, Luke TheogarajanWed, 11 Ma🤖 cs.LG

UltraEdit: Training-, Subject-, and Memory-Free Lifelong Editing in Language Models

이 논문은 기존 방법론보다 7 배 이상 빠르고 VRAM 사용량을 4 분의 1 로 줄여 24GB 소비자용 GPU 에서 7B 크기의 언어 모델을 편집할 수 있을 뿐만 아니라, 200 만 건 이상의 편집을 지원하면서도 정확도를 유지하는 'UltraEdit'라는 새로운 효율적이고 확장 가능한 평생 학습 기반 모델 편집 프레임워크를 제안합니다.

Xiaojie Gu, Ziying Huang, Jia-Chen Gu, Kai ZhangWed, 11 Ma🤖 cs.AI

A Systematic Evaluation of On-Device LLMs: Quantization, Performance, and Resources

이 논문은 엣지 장치에서 LLM 을 배포할 때 3.5 비트 이하의 양자화를 적용한 대규모 모델이 작은 고정밀 모델보다 성능이 우수하며, 모델 크기 감소에 따른 처리량 병목 현상이 통신 오버헤드에서 계산 지연으로 전환된다는 것을 체계적인 평가를 통해 규명하고 최적화 가이드라인을 제시합니다.

Qingyu Song, Rui Liu, Wei Lin, Peiyu Liao, Wenqian Zhao, Yiwen Wang, Shoubo Hu, Yining Jiang, Mochun Long, Hui-Ling Zhen, Ning Jiang, Mingxuan Yuan, Qiao Xiang, Hong XuWed, 11 Ma🤖 cs.LG

Semi-Supervised Conformal Prediction With Unlabeled Nonconformity Score

이 논문은 제한된 라벨 데이터 환경에서 커버리지 안정성을 향상시키기 위해 라벨링되지 않은 데이터의 유사한 의사-라벨 샘플을 기반으로 한 '가장 인접한 이웃 매칭 (NNM)' 점수를 도입하여, 라벨과 라벨 없는 데이터를 모두 활용하는 새로운 준지도 conformal 예측 방법인 SemiCP 를 제안하고 그 이론적 수렴성과 실험적 유효성을 입증합니다.

Xuanning Zhou, Zihao Shi, Hao Zeng, Xiaobo Xia, Bingyi Jing, Hongxin WeiWed, 11 Ma🤖 cs.LG

Cooperative Game-Theoretic Credit Assignment for Multi-Agent Policy Gradients via the Core

이 논문은 협력적 다중 에이전트 강화학습의 신용 할당 문제를 해결하기 위해 협력 게임 이론의 코어 (core) 개념을 도입하여 연합별 기여도를 평가하고 할당하는 CORA 알고리즘을 제안하며, 이를 통해 에이전트 간 조율된 최적 행동을 유도하고 기존 방법들보다 우수한 성능을 입증합니다.

Mengda Ji, Genjiu Xu, Keke Jia, Zekun Duan, Yong Qiu, Jianjun Ge, Mingqiang LiWed, 11 Ma🤖 cs.AI