Feed m Birds with One Scone: Accelerating Multi-task Gradient Balancing via Bi-level Optimization

이 논문은 다중 작업 학습에서 MGDA 계열 방법의 계산 비효율성을 해결하기 위해, 모델 학습과 그래디언트 균형 조정을 결합된 바이-레벨 최적화 문제로 재해석하고 제로차 최적화 기법을 활용하여 효율적으로 해결하는 통합 프레임워크인 MARIGOLD 를 제안합니다.

Xuxing Chen, Yun He, Jiayi Xu, Minhui Huang, Xiaoyi Liu, Boyang Liu, Fei Tian, Xiaohan Wei, Rong Jin, Sem Park, Bo Long, Xue Feng2026-03-10🤖 cs.LG

Generalization in Online Reinforcement Learning for Mobile Agents

이 논문은 모바일 GUI 에이전트의 일반화 능력을 평가하기 위한 새로운 벤치마크 'AndroidWorld-Generalization'과 확장 가능한 RL 학습 시스템을 제안하고, 그룹 상대적 정책 최적화 (GRPO) 를 적용한 실험을 통해 일반화 문제의 현재 한계와 잠재력을 규명했습니다.

Li Gu, Zihuan Jiang, Zhixiang Chi, Huan Liu, Ziqiang Wang, Yuanhao Yu, Glen Berseth, Yang Wang2026-03-10🤖 cs.LG

Data Agent: Learning to Select Data via End-to-End Dynamic Optimization

이 논문은 손실 기반의 난이도와 신뢰도 기반의 불확실성 신호를 통합한 보상 메커니즘을 통해 모델 최적화와 함께 진화하는 샘플별 선택 정책을 학습함으로써, 다양한 작업과 데이터셋에서 손실 없는 성능 유지 하에 훈련 비용을 50% 이상 절감하는 종단간 동적 데이터 선택 프레임워크인 'Data Agent'를 제안합니다.

Suorong Yang, Fangjian Su, Hai Gan, Ziqi Ye, Jie Li, Baile Xu, Furao Shen, Soujanya Poria2026-03-10🤖 cs.LG

Cost-Driven Representation Learning for Linear Quadratic Gaussian Control: Part II

이 논문은 부분 관측 및 고차원 데이터에서 누적 비용을 예측하여 잠재 상태 공간의 동역학 모델을 학습하는 비용 주도 표현 학습을 통해 무한 시간 선형 2 차 가우시안 (LQG) 제어에 대한 유한 샘플 보장과 함께 명시적 및 암시적 (MuZero 유사) 두 가지 접근법을 제시합니다.

Yi Tian, Kaiqing Zhang, Russ Tedrake, Suvrit Sra2026-03-10🤖 cs.LG

Dial: A Knowledge-Grounded Dialect-Specific NL2SQL System

이 논문은 이기종 데이터베이스 시스템의 각기 다른 SQL 문법과 제약 조건을 고려하여 자연어에서 실행 가능한 SQL 쿼리를 생성하는 지식 기반 프레임워크 'Dial'을 제안하고, 논리적 쿼리 계획, 계층적 지식 베이스, 실행 기반 디버깅 루프를 통해 기존 방법론 대비 번역 정확도와 기능 커버리지를 크게 향상시켰음을 보여줍니다.

Xiang Zhang, Hongming Xu, Le Zhou, Wei Zhou, Xuanhe Zhou, Guoliang Li, Yuyu Luo, Changdong Liu, Guorun Chen, Jiang Liao, Fan Wu2026-03-10🤖 cs.LG

SLNet: A Super-Lightweight Geometry-Adaptive Network for 3D Point Cloud Recognition

이 논문은 NAPE 와 GMU 라는 두 가지 간단한 아이디어를 기반으로 0.14M~0.55M 개의 파라미터만 사용하면서도 PointMLP 나 Point Transformer V3 와 같은 기존 모델들을 파라미터 수와 연산량 측면에서 압도적으로 줄이면서 높은 정확도를 달성하는 초경량 3D 포인트 클라우드 인식 네트워크인 SLNet 을 제안합니다.

Mohammad Saeid, Amir Salarpour, Pedram MohajerAnsari, Mert D. Pesé2026-03-10🤖 cs.LG

The Dual-Stream Transformer: Channelized Architecture for Interpretable Language Modeling

이 논문은 어텐션과 피드포워드 네트워크를 각각 토큰 스트림과 컨텍스트 스트림으로 분리하여 해석 가능성과 성능 사이의 조절 가능한 균형을 제공하는 '듀얼-스트림 트랜스포머' 아키텍처를 제안하고, 이를 통해 내부 구조가 설계 단계에서 노출되는 해석 가능한 언어 모델의 기반을 마련했다고 요약할 수 있습니다.

J. Clayton Kerce, Alexis Fox2026-03-10🤖 cs.LG

Trusting What You Cannot See: Auditable Fine-Tuning and Inference for Proprietary AI

이 논문은 대규모 언어 모델의 클라우드 기반 미세 조정 및 추론 과정에서 발생하는 신뢰 격차와 보안 위험을 해결하기 위해, 실행의 무결성을 보장하고 클라이언트가 추후 검증 가능한 기록을 통해 프로세스를 감사할 수 있도록 하는 경량화된 프레임워크인 'AFTUNE'을 제안합니다.

Heng Jin, Chaoyu Zhang, Hexuan Yu, Shanghao Shi, Ning Zhang, Y. Thomas Hou, Wenjing Lou2026-03-10🤖 cs.LG