cs.LG 편의 논문 | Gist.Science

ConfHit: Conformal Generative Design with Oracle Free Guarantees

이 논문은 실험적 오라클 접근 없이도 생성된 분자 후보군에 대해 통계적으로 유효한 보장과 함께 타겟 속성을 만족하는 '히트' 화합물을 포함할 확신을 제공하는 새로운 분포 무관 프레임워크인 ConfHit 을 제안합니다.

Siddhartha Laghuvarapu, Ying Jin, Jimeng Sun2026-03-10🤖 cs.LG

Domain-Specific Quality Estimation for Machine Translation in Low-Resource Scenarios

이 논문은 저자원 언어와 도메인별 기계 번역 품질 평가를 위해 오픈 가중치 LLM 에 중간 레이어 적응 기법 (ALOPE 및 LoRMA) 을 적용함으로써 프롬프트 기반 방법의 한계를 극복하고 견고한 품질 추정 성능을 달성하는 방안을 제시합니다.

Namrata Patil Gurav, Akashdeep Ranu, Archchana Sindhujan, Diptesh Kanojia2026-03-10🤖 cs.LG

Sparsity and Out-of-Distribution Generalization

이 논문은 세계가 구별된 특징을 통해 경험되며, Occam's 칼날에 따라 최소한의 특징에 의존하는 '희소성' 가설이 훈련 분포와 테스트 분포의 관련 특징 영역이 겹칠 때만 Out-of-Distribution 일반화가 가능하다는 원리를 제안하고 이를 수학적으로 증명합니다.

Scott Aaronson, Lin Lin Lee, Jiawei Li2026-03-10🤖 cs.LG

Feed m Birds with One Scone: Accelerating Multi-task Gradient Balancing via Bi-level Optimization

이 논문은 다중 작업 학습에서 MGDA 계열 방법의 계산 비효율성을 해결하기 위해, 모델 학습과 그래디언트 균형 조정을 결합된 바이-레벨 최적화 문제로 재해석하고 제로차 최적화 기법을 활용하여 효율적으로 해결하는 통합 프레임워크인 MARIGOLD 를 제안합니다.

Xuxing Chen, Yun He, Jiayi Xu, Minhui Huang, Xiaoyi Liu, Boyang Liu, Fei Tian, Xiaohan Wei, Rong Jin, Sem Park, Bo Long, Xue Feng2026-03-10🤖 cs.LG

Deterministic Fuzzy Triage for Legal Compliance Classification and Evidence Retrieval

이 논문은 HIPAA 및 NERC-CIP 와 같은 법적 준수 프레임워크와 정렬하기 위해, 투명하고 재현 가능한 결정론적 퍼지 분류 밴드와 이중 인코더를 활용하여 대규모 계약 증거를 자동 분류하고 인간 검토가 필요한 사례를 식별하는 실용적인 시스템을 제안합니다.

Rian Atri2026-03-10🤖 cs.LG

Generalizing Linear Autoencoder Recommenders with Decoupled Expected Quadratic Loss

이 논문은 기존 선형 오토인코더 추천 시스템의 제한된 하이퍼파라미터 범위를 확장하고 $b>0$ 조건에서 더 나은 성능을 내는 해를 도출하기 위해 '분리된 기대 2 차 손실 (DEQL)'을 제안하고 효율적인 알고리즘을 제시합니다.

Ruixin Guo, Xinyu Li, Hao Zhou, Yang Zhou, Ruoming Jin2026-03-10🤖 cs.LG

Context Channel Capacity: An Information-Theoretic Framework for Understanding Catastrophic Forgetting

이 논문은 '맥락 채널 용량'이라는 정보이론적 프레임워크를 제시하여, continual learning 에서의 catastrophic forgetting 이 알고리즘이 아닌 아키텍처의 구조적 한계에서 기인함을 증명하고, 이를 해결하기 위한 새로운 설계 원칙과 진단 도구를 제안합니다.

Ran Cheng2026-03-10🤖 cs.LG

DualSpec: Accelerating Deep Research Agents via Dual-Process Action Speculation

이 논문은 검색과 방문 행동의 이질성을 분석하여 경량화 검증기를 도입한 'DualSpec' 프레임워크를 제안함으로써, 심층 연구 에이전트의 정확도를 유지하면서 최대 3.28 배의 종단 간 속도 향상을 달성했습니다.

Shuzhang Zhong, Baotong Lu, Qi Chen, Chuanjie Liu, Fan Yang, Meng Li2026-03-10🤖 cs.LG

OrthoFormer: Instrumental Variable Estimation in Transformer Hidden States via Neural Control Functions

이 논문은 잠재 교란변수로 인한 상관관계 학습의 한계를 극복하기 위해 신경 제어 함수를 통해 도구변수 추정을 트랜스포머의 은닉 상태에 직접 통합한 'OrthoFormer'를 제안하여, 분포 변화 하에서도 견고한 인과적 시퀀스 모델링을 가능하게 한다고 요약할 수 있습니다.

Charles Luo2026-03-10🤖 cs.LG

Generalization in Online Reinforcement Learning for Mobile Agents

이 논문은 모바일 GUI 에이전트의 일반화 능력을 평가하기 위한 새로운 벤치마크 'AndroidWorld-Generalization'과 확장 가능한 RL 학습 시스템을 제안하고, 그룹 상대적 정책 최적화 (GRPO) 를 적용한 실험을 통해 일반화 문제의 현재 한계와 잠재력을 규명했습니다.

Li Gu, Zihuan Jiang, Zhixiang Chi, Huan Liu, Ziqiang Wang, Yuanhao Yu, Glen Berseth, Yang Wang2026-03-10🤖 cs.LG

Data Agent: Learning to Select Data via End-to-End Dynamic Optimization

이 논문은 손실 기반의 난이도와 신뢰도 기반의 불확실성 신호를 통합한 보상 메커니즘을 통해 모델 최적화와 함께 진화하는 샘플별 선택 정책을 학습함으로써, 다양한 작업과 데이터셋에서 손실 없는 성능 유지 하에 훈련 비용을 50% 이상 절감하는 종단간 동적 데이터 선택 프레임워크인 'Data Agent'를 제안합니다.

Suorong Yang, Fangjian Su, Hai Gan, Ziqi Ye, Jie Li, Baile Xu, Furao Shen, Soujanya Poria2026-03-10🤖 cs.LG

Cost-Driven Representation Learning for Linear Quadratic Gaussian Control: Part II

이 논문은 부분 관측 및 고차원 데이터에서 누적 비용을 예측하여 잠재 상태 공간의 동역학 모델을 학습하는 비용 주도 표현 학습을 통해 무한 시간 선형 2 차 가우시안 (LQG) 제어에 대한 유한 샘플 보장과 함께 명시적 및 암시적 (MuZero 유사) 두 가지 접근법을 제시합니다.

Yi Tian, Kaiqing Zhang, Russ Tedrake, Suvrit Sra2026-03-10🤖 cs.LG

Few Tokens, Big Leverage: Preserving Safety Alignment by Constraining Safety Tokens during Fine-tuning

이 논문은 파인튜닝 중 안전 관련 토큰의 신뢰도만 참조 모델과 일치하도록 제한하는 'PACT' 프레임워크를 제안하여, 모델의 유용성을 해치지 않으면서도 안전 정렬의 붕괴를 방지하는 방법을 제시합니다.

Guoli Wang, Haonan Shi, Tu Ouyang, An Wang2026-03-10🤖 cs.LG

Discrete Tokenization Unlocks Transformers for Calibrated Tabular Forecasting

이 논문은 의도적으로 단순화된 이산 토큰화 기법과 적응형 가우시안 평활화를 결합하여 트랜스포머가 기존 그라디언트 부스팅보다 탁월한 보정된 확률 밀도 함수 예측 성능을 달성할 수 있음을 입증합니다.

Yael S. Elmatad2026-03-10🤖 cs.LG

Dial: A Knowledge-Grounded Dialect-Specific NL2SQL System

이 논문은 이기종 데이터베이스 시스템의 각기 다른 SQL 문법과 제약 조건을 고려하여 자연어에서 실행 가능한 SQL 쿼리를 생성하는 지식 기반 프레임워크 'Dial'을 제안하고, 논리적 쿼리 계획, 계층적 지식 베이스, 실행 기반 디버깅 루프를 통해 기존 방법론 대비 번역 정확도와 기능 커버리지를 크게 향상시켰음을 보여줍니다.

Xiang Zhang, Hongming Xu, Le Zhou, Wei Zhou, Xuanhe Zhou, Guoliang Li, Yuyu Luo, Changdong Liu, Guorun Chen, Jiang Liao, Fan Wu2026-03-10🤖 cs.LG

SLNet: A Super-Lightweight Geometry-Adaptive Network for 3D Point Cloud Recognition

이 논문은 NAPE 와 GMU 라는 두 가지 간단한 아이디어를 기반으로 0.14M~0.55M 개의 파라미터만 사용하면서도 PointMLP 나 Point Transformer V3 와 같은 기존 모델들을 파라미터 수와 연산량 측면에서 압도적으로 줄이면서 높은 정확도를 달성하는 초경량 3D 포인트 클라우드 인식 네트워크인 SLNet 을 제안합니다.

Mohammad Saeid, Amir Salarpour, Pedram MohajerAnsari, Mert D. Pesé2026-03-10🤖 cs.LG

The Dual-Stream Transformer: Channelized Architecture for Interpretable Language Modeling

이 논문은 어텐션과 피드포워드 네트워크를 각각 토큰 스트림과 컨텍스트 스트림으로 분리하여 해석 가능성과 성능 사이의 조절 가능한 균형을 제공하는 '듀얼-스트림 트랜스포머' 아키텍처를 제안하고, 이를 통해 내부 구조가 설계 단계에서 노출되는 해석 가능한 언어 모델의 기반을 마련했다고 요약할 수 있습니다.

J. Clayton Kerce, Alexis Fox2026-03-10🤖 cs.LG

Trusting What You Cannot See: Auditable Fine-Tuning and Inference for Proprietary AI

이 논문은 대규모 언어 모델의 클라우드 기반 미세 조정 및 추론 과정에서 발생하는 신뢰 격차와 보안 위험을 해결하기 위해, 실행의 무결성을 보장하고 클라이언트가 추후 검증 가능한 기록을 통해 프로세스를 감사할 수 있도록 하는 경량화된 프레임워크인 'AFTUNE'을 제안합니다.

Heng Jin, Chaoyu Zhang, Hexuan Yu, Shanghao Shi, Ning Zhang, Y. Thomas Hou, Wenjing Lou2026-03-10🤖 cs.LG

Probabilistic Inference and Learning with Stein's Method

이 논문은 스타인 (Stein) 방법을 활용한 확률적 추론과 학습의 이론적·방법론적 측면을 엄밀하게 개괄하며, 스타인 연산자와 스타인 집합을 기반으로 한 스타인 불일치 (discrepancy) 의 구성법과 그 성질, 그리고 스타인 변분 경사 하강법과의 연관성을 체계적으로 다룹니다.

Qiang Liu, Lester Mackey, Chris Oates2026-03-10🤖 cs.LG

Towards Lightweight Adaptation of Speech Enhancement Models in Real-World Environments

이 논문은 실시간 환경 변화에 대응하여 기존 음성 향상 모델의 1% 미만 파라미터만 업데이트하는 경량 자기지도 학습 어댑터 프레임워크를 제안함으로써, 온디바이스 배포에 적합한 실시간 적응을 가능하게 하고 성능을 크게 향상시킵니다.

Longbiao Cheng, Shih-Chii Liu2026-03-10🤖 cs.LG

← 이전 다음 →