cs.LG 편의 논문 | Gist.Science

An AI-powered Bayesian Generative Modeling Approach for Arbitrary Conditional Inference

이 논문은 학습된 단일 모델로 재학습 없이도 임의의 조건부 추론을 수행하고 불확실성을 정량화할 수 있도록, 확률적 반복 베이지안 업데이트 알고리즘을 기반으로 한 새로운 베이지안 생성 모델링 (BGM) 프레임워크를 제안합니다.

Qiao Liu, Wing Hung Wong2026-03-11🤖 cs.AI

Automating Forecasting Question Generation and Resolution for AI Evaluation

이 논문은 대규모 언어 모델 (LLM) 기반 웹 연구 에이전트를 활용하여 자동화되고 검증 가능한 다양한 미래 예측 질문 생성 및 해결 시스템을 구축하고, 이를 통해 AI 예측 모델의 성능 평가와 예측 정확도 향상을 입증했습니다.

Nikos I. Bosse, Peter Mühlbacher, Jack Wildman, Lawrence Phillips, Dan Schwarz2026-03-11🤖 cs.AI

Infusion: Shaping Model Behavior by Editing Training Data via Influence Functions

이 논문은 영향 함수를 활용하여 훈련 데이터에 미세한 교란을 가해 모델의 행동을 의도적으로 조작하는 'Infusion' 프레임워크를 제안하고, 이를 통해 소량의 훈련 데이터만으로도 다양한 아키텍처에 걸쳐 모델 행동을 효과적으로 변화시킬 수 있음을 입증합니다.

J Rosser, Robert Kirk, Edward Grefenstette, Jakob Foerster, Laura Ruis2026-03-11🤖 cs.AI

Robust Assortment Optimization from Observational Data

이 논문은 고객 선호도 변화와 모델 오차로 인한 일반화 실패를 해결하기 위해, 관찰 데이터에서 최악의 경우 기대 수익을 최대화하는 통계적 효율성과 견고함을 동시에 보장하는 새로운 강건한 품목 최적화 프레임워크를 제안합니다.

Miao Lu, Yuxuan Han, Han Zhong, Zhengyuan Zhou, Jose Blanchet2026-03-11🤖 cs.LG

Bottleneck Transformer-Based Approach for Improved Automatic STOI Score Prediction

이 논문은 청각적 참조 신호 없이도 기존 최첨단 모델보다 높은 상관관계와 낮은 평균 제곱 오차를 보이는 새로운 병목 트랜스포머 아키텍처를 통해 STOI 점수를 정확하게 예측하는 방법을 제안합니다.

Amartyaveer, Murali Kadambi, Chandra Mohan Sharma, Anupam Mondal, Prasanta Kumar Ghosh2026-03-11🤖 cs.LG

B-DENSE: Branching For Dense Ensemble Network Supervision Efficiency

이 논문은 확산 모델의 고해상도 추론 지연과 희소 감독의 한계를 해결하기 위해, 교사의 궤적 중간 단계를 모두 학습하는 밀집 앙상블 네트워크 (B-DENSE) 를 제안하여 이미지 생성 품질을 향상시킵니다.

Cherish Puniani, Tushar Kumar, Arnav Bendre, Gaurav Kumar, Shree Singhi2026-03-11🤖 cs.AI

Missing-by-Design: Certifiable Modality Deletion for Revocable Multimodal Sentiment Analysis

이 논문은 민감한 개인 데이터를 처리하는 다중 모달 감정 분석 시스템에서 특정 모달리티의 삭제를 인증 가능하게 수행하면서도 예측 성능을 유지하는 'Missing-by-Design (MBD)' 프레임워크를 제안합니다.

Rong Fu, Ziming Wang, Chunlei Meng, Jiaxuan Lu, Jiekai Wu, Kangan Qian, Hao Zhang, Simon Fong2026-03-11🤖 cs.LG

Continual uncertainty learning

이 논문은 비선형 동역학과 다양한 불확실성이 공존하는 기계 시스템의 강인한 제어를 위해, 불확실성 소스를 점진적으로 확장하는 커리큘럼 기반 지속 학습 프레임워크와 모델 기반 제어기를 결합하여 시뮬레이션과 현실 간의 격차를 효과적으로 해소하는 새로운 방법을 제안하고 자동차 동력계 진동 제어에 적용하여 검증했습니다.

Heisei Yonezawa, Ansei Yonezawa, Itsuro Kajiwara2026-03-11🤖 cs.AI

Breaking the Factorization Barrier in Diffusion Language Models

이 논문은 확산 언어 모델의 '분해 장벽'을 해결하기 위해 완전 분해된 출력 분포를 경량화되고 다루기 쉬운 확률적 추론 계층으로 대체하는 '결합 이산 확산 (CoDD)' 프레임워크를 제안하여, 적은 비용으로 복잡한 토큰 간 종속성을 모델링하고 고품질의 병렬 생성을 가능하게 합니다.

Ian Li, Zilei Shao, Benjie Wang, Rose Yu, Guy Van den Broeck, Anji Liu2026-03-11🤖 cs.AI

Detecting Transportation Mode Using Dense Smartphone GPS Trajectories and Transformer Models

이 논문은 스마트폰의 밀집된 GPS 궤적 데이터에서 속도 정보만을 입력으로 활용하는 새로운 트랜스포머 기반 모델인 'SpeedTransformer'를 제안하여, 기존 LSTM 모델보다 우수한 성능과 지역 간 전이 학습 능력을 입증하고 복잡한 실제 환경에서도 높은 정확도를 보였다고 요약할 수 있습니다.

Yuandong Zhang, Othmane Echchabi, Tianshu Feng, Wenyi Zhang, Hsuai-Kai Liao, Charles Chang2026-03-11🤖 cs.LG

Non-Rectangular Average-Reward Robust MDPs: Optimal Policies and Their Transient Values

이 논문은 직사각형 가정을 요구하지 않는 비직사각형 평균 보상 강건 MDP 에서 최적 정책의 존재성을 증명하고, 평균 보상 최적성만으로는 과도기적 성능이 나쁠 수 있음을 보여주며, 이를 해결하는 상수 차수의 과도기적 성능을 갖는 에포크 기반 정책을 제안합니다.

Shengbo Wang, Nian Si2026-03-11🤖 cs.LG

DUEL: Exact Likelihood for Masked Diffusion via Deterministic Unmasking

이 논문은 결정적 언마킹을 통해 마스킹 확산 모델 (MDM) 에 정확한 가능도 계산과 퍼플렉시티 평가를 가능하게 하는 'DUEL' 프레임워크를 제안하여, 기존 ELBO 의 한계를 극복하고 MDM 의 성능이 autoregressive 모델보다 훨씬 우수할 수 있음을 입증합니다.

Gilad Turok, Chris De Sa, Volodymyr Kuleshov2026-03-11🤖 cs.LG

Reasoning as Gradient: Scaling MLE Agents Beyond Tree Search

이 논문은 LLM 기반의 머신러닝 엔지니어링 에이전트가 기존 트리 탐색 방식보다 강화된 추론 능력을 가진 모델에서 더 효율적인 경사 하강 기반 최적화 패러다임인 'Gome'을 도입하여 MLE-Bench 에서 최상의 성능을 달성하고, 모델의 추론 능력이 향상됨에 따라 경사 기반 최적화가 트리 탐색을 능가하는 전환점이 도래함을 보여줍니다.

Yifei Zhang, Xu Yang, Xiao Yang, Bowen Xian, Qizheng Li, Shikai Fang, Jingyuan Li, Jian Wang, Mingrui Xu, Weiqing Liu, Jiang Bian2026-03-11🤖 cs.AI

FinTexTS: Financial Text-Paired Time-Series Dataset via Semantic-Based and Multi-Level Pairing

이 논문은 단순한 키워드 매칭의 한계를 극복하기 위해 의미 기반 및 다수준 매칭 프레임워크를 제안하여, SEC filing 과 LLM 을 활용하여 뉴스와 주가 데이터를 정교하게 연결한 대규모 금융 텍스트-시계열 데이터셋 'FinTexTS'를 구축하고 주가 예측 성능을 입증했습니다.

Jaehoon Lee, Suhwan Park, Tae Yoon Lim, Seunghan Lee, Jun Seo, Dongwan Kang, Hwanil Choi, Minjae Kim, Sungdong Yoo, SoonYoung Lee, Yongjae Lee, Wonbin Ahn2026-03-11🤖 cs.AI

Unveiling the Potential of Quantization with MXFP4: Strategies for Quantization Error Reduction

이 논문은 하드웨어 변경 없이 소프트웨어 기법인 오버플로우 인식 스케일링 (OAS) 과 매크로 블록 스케일링 (MBS) 을 도입하여 MXFP4 의 양자화 오차를 줄이고 NVFP4 와의 정확도 격차를 10% 에서 1% 미만으로 축소함으로써, MXFP4 를 하드웨어 효율성을 유지하면서 NVFP4 에 버금가는 성능을 내는 실용적인 대안으로 재탄생시켰음을 보여줍니다.

Jatin Chhugani, Geonhwa Jeong, Bor-Yiing Su, Yunjie Pan, Hanmei Yang, Aayush Ankit, Jiecao Yu, Summer Deng, Yunqing Chen, Nadathur Satish, Changkyu Kim2026-03-11🤖 cs.AI

Equitable Multi-Task Learning for AI-RANs

이 논문은 공유 에지 리소스 하에서 다양한 사용자를 위한 AI-RAN 의 공정한 추론 성능을 보장하기 위해 효율성과 공정성 간의 균형을 조절하며 장기적 형평성을 달성하는 온라인 - within-온라인 공평 다중 태스크 학습 (OWO-FMTL) 프레임워크를 제안하고 그 유효성을 입증합니다.

Panayiotis Raptis, Fatih Aslan, George Iosifidis2026-03-11🤖 cs.LG

KernelCraft: Benchmarking for Agentic Close-to-Metal Kernel Generation on Emerging Hardware

이 논문은 새로운 명령어 집합 구조 (ISA) 를 가진 차세대 AI 가속기용 저수준 커널을 자동으로 생성하고 최적화할 수 있는 에이전트형 LLM 의 능력을 평가하기 위해, 컴파일 및 시뮬레이션 피드백을 활용한 'KernelCraft'라는 첫 번째 벤치마크를 제안하고 이를 통해 커널 개발 비용 절감 가능성을 입증했습니다.

Jiayi Nie, Haoran Wu, Yao Lai, Zeyu Cao, Cheng Zhang, Binglei Lou, Erwei Wang, Jianyi Cheng, Timothy M. Jones, Robert Mullins, Rika Antonova, Yiren Zhao2026-03-11🤖 cs.LG

ALADIN: Accuracy-Latency-Aware Design-space Inference Analysis for Embedded AI Accelerators

이 논문은 임베디드 AI 가속기를 위한 정밀도-지연 시간 인식 설계 공간 추론 분석 프레임워크인 ALADIN 을 제안하여, 실제 플랫폼 배포 없이도 혼합 정밀도 양자화 신경망의 추론 병목 현상과 설계 트레이드오프를 정량적으로 평가하고 하드웨어 - 소프트웨어 공동 설계를 지원할 수 있음을 보여줍니다.

T. Baldi, D. Casini, A. Biondi2026-03-11🤖 cs.AI

Performance Analysis of Edge and In-Sensor AI Processors: A Comparative Review

이 논문은 GAP9, STM32N6, Sony IMX500 등 상용 및 연구용 엣지 및 인-센서 AI 프로세서 아키텍처를 비교 검토하고, PicoSAM2 모델을 통한 벤치마크를 통해 지연 시간, 에너지 효율성 및 에너지 - 지연 곱 측면에서 각 플랫폼의 성능과 트레이드오프를 분석합니다.

Luigi Capogrosso, Pietro Bonazzi, Michele Magno2026-03-11🤖 cs.LG

Data-Rate-Aware High-Speed CNN Inference on FPGAs

이 논문은 풀링 및 스트라이드 컨볼루션으로 인한 데이터율 감소로 인한 하드웨어 비효율성을 해결하기 위해, 다중 픽셀 처리와 데이터율 인식 설계 공간 탐색을 통해 FPGA 기반 CNN 가속기의 자원 효율성과 활용도를 극대화하는 아키텍처를 제안합니다.

Tobias Habermann, Martin Kumm2026-03-11🤖 cs.LG

← 이전 다음 →