cs.LG 편의 논문 | Gist.Science

Information Routing in Atomistic Foundation Models: How Task Alignment and Equivariance Shape Linear Disentanglement

이 논문은 분자 속성 예측 모델에서 작업 정렬과 대칭성이 표현의 선형 분리성을 어떻게 결정하는지 규명하기 위해 새로운 분석 기법인 CPD 를 제안하고, 작업 정렬이 아키텍처보다 정보 분리 효율에 더 지배적인 영향을 미친다는 사실을 입증합니다.

Joshua Steier2026-03-10🤖 cs.LG

XInsight: Integrative Stage-Consistent Psychological Counseling Support Agents for Digital Well-Being

이 논문은 웹 기반 디지털 웰빙을 위해 '탐색 - 통찰 - 행동' 치료 패러다임에 부합하는 다중 에이전트 프레임워크인 XInsight 와 이를 평가하기 위한 벤치마크 XInsight-Bench 를 제안하며, 기존 시스템 대비 치료적 일관성, 해석 가능성 및 개입 깊이를 크게 향상시켰음을 보여줍니다.

Fei Wang, Jiangnan Yang, Junjie Chen, Yuxin Liu, Kun Li, Yanyan Wei, Dan Guo, Meng Wang2026-03-10🤖 cs.LG

vLLM Hook v0: A Plug-in for Programming Model Internals on vLLM

이 논문은 vLLM 의 내부 상태를 프로그래밍할 수 있게 하여 적대적 프롬프트 탐지, 향상된 RAG, 활성화 조향 등 다양한 테스트 시간 모델 정렬 및 개선 기법을 가능하게 하는 오픈소스 플러그인 'vLLM Hook'을 제안합니다.

Ching-Yun Ko, Pin-Yu Chen2026-03-10🤖 cs.LG

Isotonic Layer: A Universal Framework for Generic Recommendation Debiasing

이 논문은 추천 시스템의 편향을 완화하고 보정 정확도를 향상시키기 위해 신경망 아키텍처에 통합된 미분 가능한 '등적층 (Isotonic Layer)'을 제안하며, 이를 통해 특징 공간의 단조성을 보장하고 컨텍스트별 왜곡을 적응적으로 보정하는 것을 목표로 합니다.

Hailing Cheng, Yafang Yang, Hemeng Tao, Fengyu Zhang2026-03-10🤖 cs.LG

How Attention Sinks Emerge in Large Language Models: An Interpretability Perspective

이 논문은 대규모 언어 모델에서 의미 정보 없이도 입력 시퀀스의 첫 번째 토큰에 집중되는 '어텐션 싱크'가 P0 싱크 회로를 통해 어떻게 형성되고 학습 초기에 두 번째 레이어까지 집중되며 사전 학습 수렴 상태를 추적하는 신호가 될 수 있는지를 규명합니다.

Runyu Peng, Ruixiao Li, Mingshu Chen, Yunhua Zhou, Qipeng Guo, Xipeng Qiu2026-03-10🤖 cs.LG

Hierarchical Latent Structures in Data Generation Process Unify Mechanistic Phenomena across Scale

이 논문은 확률적 문맥 자유 문법 (PCFG) 을 기반으로 한 위계적 데이터 생성 과정이 인덕션 헤드, 함수 벡터, 하이드라 효과 등 거대언어모델의 서로 다른 기계적 현상들을 통합적으로 설명하는 핵심 요인임을 이론적 근거와 실험을 통해 규명합니다.

Jonas Rohweder, Subhabrata Dutta, Iryna Gurevych2026-03-10🤖 cs.LG

Hierarchical Embedding Fusion for Retrieval-Augmented Code Generation

이 논문은 대규모 코드 저장소의 정보를 고정된 수의 의사 토큰으로 압축하여 지연 시간을 획기적으로 줄이면서도 저장소 수준의 맥락을 유지하는 계층적 임베딩 융합 (HEF) 방식을 제안합니다.

Nikita Sorokin, Ivan Sedykh, Valentin Malykh2026-03-10🤖 cs.LG

FuzzingRL: Reinforcement Fuzz-Testing for Revealing VLM Failures

이 논문은 퍼징과 강화 학습 미세 조정을 결합하여 시각 언어 모델 (VLM) 이 의도적으로 오답을 내도록 유도하는 질문을 자동 생성함으로써 모델의 취약점을 효과적으로 발견하고 성능을 저하시키는 'FuzzingRL' 방법을 제안합니다.

Jiajun Xu, Jiageng Mao, Ang Qi, Weiduo Yuan, Alexander Romanus, Helen Xia, Vitor Campagnolo Guizilini, Yue Wang2026-03-10🤖 cs.LG

Switchable Activation Networks

이 논문은 각 신경 단위에 입력에 의존하는 이진 게이트를 도입하여 계산 자원을 적응적으로 할당하면서도 정확도를 유지하는 'SWAN(Switchable Activation Networks)' 프레임워크를 제안함으로써, 기존 효율화 기법의 한계를 극복하고 동적 추론과 경량 배포를 가능하게 하는 새로운 패러다임을 제시합니다.

Laha Ale, Ning Zhang, Scott A. King, Pingzhi Fan2026-03-10🤖 cs.LG

Khatri-Rao Clustering for Data Summarization

이 논문은 기존 중심점 기반 클러스터링의 중복성을 해결하고 데이터 요약의 간결성과 정확성 간의 균형을 개선하기 위해, 중심점이 두 개 이상의 간결한 프로토중심점 집합의 상호작용에서 비롯된다는 가정을 바탕으로 'Khatri-Rao k-Means' 알고리즘과 'Khatri-Rao 심층 클러스터링' 프레임워크를 제안합니다.

Martino Ciaperoni, Collin Leiber, Aristides Gionis, Heikki Mannila2026-03-10🤖 cs.LG

Scale Dependent Data Duplication

이 논문은 모델의 규모가 커질수록 의미적으로 유사한 문서들이 표면적 중복과 유사하게 작용하여 학습에 해로운 영향을 미치고 스케일링 법칙을 왜곡한다는 점을 규명하여, 데이터의 의미적 중복이 모델 성능 예측에 미치는 규모 의존적 영향을 분석하고 이를 보정하는 스케일링 법칙을 제시합니다.

Joshua Kazdan, Noam Levi, Rylan Schaeffer, Jessica Chudnovsky, Abhay Puri, Bo He, Mehmet Donmez, Sanmi Koyejo, David Donoho2026-03-10🤖 cs.LG

Know When You're Wrong: Aligning Confidence with Correctness for LLM Error Detection

이 논문은 구조화된 태스크의 분류 레이블과 개방형 생성의 자기평가 응답을 기반으로 정규화된 신뢰도 점수를 도입하여 LLM 의 오류와 환각을 외부 검증 없이 탐지하는 프레임워크를 제시하고, 강화학습이 신뢰도를 저하시키는 반면 자기교란을 통한 사후 SFT 가 이를 회복시켜 RAG 시스템의 효율성을 극대화함을 증명합니다.

Xie Xiaohu, Liu Xiaohu, Yao Benjamin2026-03-10🤖 cs.LG

Structure-Aware Set Transformers: Temporal and Variable-Type Attention Biases for Asynchronous Clinical Time Series

이 논문은 비동기적 임상 시계열 데이터의 구조적 특성을 보존하면서도 효율적인 어텐션 편향을 도입하여 기존 그리드 또는 포인트셋 기반 모델보다 우수한 성능을 보이는 'STAR Set Transformer'를 제안합니다.

Joohyung Lee, Kwanhyung Lee, Changhun Kim, Eunho Yang2026-03-10🤖 cs.LG

LegoNet: Memory Footprint Reduction Through Block Weight Clustering

이 논문은 재학습이나 데이터 없이도 가중치 제거 없이 레고넷 (LegoNet) 이라는 블록 가중치 클러스터링 기법을 통해 ResNet-50 모델의 메모리 사용량을 64 배 이상 줄이고 정확도는 유지하거나 128 배 압축 시 3% 미만의 정확도 손실만 발생하는 방법을 제안합니다.

Joseph Bingham, Noah Green, Saman Zonouz2026-03-10🤖 cs.LG

Multi-Agent DRL for V2X Resource Allocation: Disentangling Challenges and Benchmarking Solutions

이 논문은 C-V2X 무선 자원 할당 문제를 다중 에이전트 강화 학습의 주요 난제를 분리하여 평가할 수 있는 일련의 간섭 게임과 대규모 데이터셋으로 체계화하고, 다양한 차량 토폴로지에서의 정책 견고성과 일반화가 가장 큰 도전 과제임을 규명하며 관련 코드와 벤치마크를 오픈소스로 공개합니다.

Siyuan Wang, Lei Lei, Pranav Maheshwari, Sam Bellefeuille, Kan Zheng, Dusit Niyato2026-03-10🤖 cs.LG

Scaling Strategy, Not Compute: A Stand-Alone, Open-Source StarCraft II Benchmark for Accessible Reinforcement Learning Research

이 논문은 스타크래프트 II 의 풀 게임과 미니 게임 사이의 간극을 해소하기 위해 경제 및 건설 요소를 제거하고 전술적 기동과 전투에 집중하도록 설계된 오픈소스 중간 난이도 벤치마크 '투브리지 (Two-Bridge)'를 제안합니다.

Sourav Panda, Shreyash Kale, Tanmay Ambadkar, Abhinav Verma, Jonathan Dodge2026-03-10🤖 cs.LG

Valid Feature-Level Inference for Tabular Foundation Models via the Conditional Randomization Test

이 논문은 TabPFN 기반의 조건부 무작위화 검정 (CRT) 을 통해 모델 재학습이나 모수적 가정 없이도 비선형 및 상관관계가 있는 환경에서 개별 특징의 조건부 관련성에 대한 유한 표본 유효 p-값을 제공하는 실용적인 가설 검정 절차를 제시합니다.

Mohamed Salem2026-03-10🤖 cs.LG

CapTrack: Multifaceted Evaluation of Forgetting in LLM Post-Training

이 논문은 LLM 후학습에서 발생하는 망각을 단순한 지식 손실이 아닌 행동과 사용자 경험을 저해하는 체계적인 모델 드리프트로 재정의하고, 이를 분석하기 위한 'CapTrack'이라는 능력 중심 평가 프레임워크를 제안하여 다양한 후학습 알고리즘과 모델에 대한 대규모 실증 연구를 수행했습니다.

Lukas Thede, Stefan Winzeck, Zeynep Akata, Jonathan Richard Schwarz2026-03-10🤖 cs.LG

A Novel Approach for Testing Water Safety Using Deep Learning Inference of Microscopic Images of Unincubated Water Samples

이 논문은 배양 과정 없이 현미경 이미지와 딥러닝을 활용해 수질 안전을 98% 이상 빠르게(\$0.44) 진단하는 'DeepScope' 시스템을 개발하여 기존 테스트의 시간과 비용 문제를 해결하고 높은 정확도를 입증했습니다.

Sanjay Srinivasan2026-03-10🤖 cs.LG

Consensus is Not Verification: Why Crowd Wisdom Strategies Fail for LLM Truthfulness

이 논문은 수학이나 코드와 같은 검증 가능한 영역에서는 추론 계산량을 늘려 성능을 향상시킬 수 있지만, 사실성 검증이 어려운 영역에서는 모델 간 오류가 강하게 상관되어 있어 다수결 전략이나 신뢰도 기반 가중치가 오히려 공유된 오개념을 강화할 뿐 진실성을 개선하지 못함을 보여줍니다.

Yegor Denisov-Blanch, Joshua Kazdan, Jessica Chudnovsky, Rylan Schaeffer, Sheng Guan, Soji Adeshina, Sanmi Koyejo2026-03-10🤖 cs.LG

← 이전 다음 →