cs.AI 편의 논문 | Gist.Science

When Drafts Evolve: Speculative Decoding Meets Online Learning

이 논문은 스펙큘레이티브 디코딩 과정에서 발생하는 검증 피드백을 온라인 학습 패러다임으로 활용하여 드래프트 모델을 지속적으로 진화시키는 'OnlineSpec' 프레임워크를 제안하고, 이를 통해 추론 속도를 최대 24% 향상시키는 이론적 근거와 알고리즘을 제시합니다.

Yu-Yang Qian, Hao-Cong Wu, Yichao Fu, Hao Zhang, Peng Zhao2026-03-16🤖 cs.LG

VLM4Rec: Multimodal Semantic Representation for Recommendation with Large Vision-Language Models

이 논문은 시각적 특징의 직접적인 융합 대신 대규모 시각 - 언어 모델을 활용해 아이템을 자연어 설명으로 변환하고 이를 의미적 공간에 정렬함으로써 추천 성능을 향상시키는 경량 프레임워크 'VLM4Rec'을 제안합니다.

Ty Valencia, Burak Barlas, Varun Singhal, Ruchir Bhatia, Wei Yang2026-03-16🤖 cs.AI

Towards unified brain-to-text decoding across speech production and perception

이 논문은 음절 단위 신경 신호를 분류하고 대규모 언어 모델을 결합하여 Mandarin(중국어) 의 화성과 지각을 통합적으로 텍스트로 해독하는 새로운 프레임워크를 제시하며, 이를 통해 뇌-텍스트 해독의 일반화 능력을 입증하고 두 모달리티 간 신경 역학의 특징을 규명했습니다.

Zhizhang Yuan, Yang Yang, Gaorui Zhang, Baowen Cheng, Zehan Wu, Yuhao Xu, Xiaoying Liu, Liang Chen, Ying Mao, Meng Li2026-03-16🧬 q-bio

The Economics of AI Supply Chain Regulation

본 논문은 게임 이론 모델을 통해 AI 공급망에서 가격 경쟁 촉진 정책과 컴퓨팅 보조금이 비용 조건에 따라 상호 보완적으로 소비자 후생을 증대시키는 반면, 품질 경쟁 촉진 정책은 항상 소비자 후생을 개선하지만 하류 기업의 이익을 감소시킨다는 것을 규명했습니다.

Sihan Qian, Amit Mehra, Dengpan Liu2026-03-16📈 econ

Spend Less, Reason Better: Budget-Aware Value Tree Search for LLM Agents

이 논문은 LLM 에이전트의 추론 신뢰성을 높이기 위해 미세 조정 없이 단계별 가치 추정과 예산 조건부 노드 선택 메커니즘을 통해 자원을 효율적으로 관리하는 '예산 인식 가치 트리 (BAVT)' 탐색 프레임워크를 제안하며, 이는 단순한 계산량 증가보다 지능적인 예산 관리가 더 뛰어난 성능을 보임을 입증합니다.

Yushu Li, Wenlong Deng, Jiajin Li, Xiaoxiao Li2026-03-16🤖 cs.LG

LightMoE: Reducing Mixture-of-Experts Redundancy through Expert Replacing

이 논문은 기존 MoE 모델의 메모리 과부하 문제를 해결하기 위해 중복 전문가를 효율적인 모듈로 대체하고 적응적 선택 및 점진적 복구 전략을 도입한 'LightMoE' 프레임워크를 제안하며, 이는 기존 압축 방법보다 뛰어난 성능과 효율성을 입증합니다.

Jiawei Hao, Zhiwei Hao, Jianyuan Guo, Li Shen, Yong Luo, Han Hu, Dan Zeng2026-03-16🤖 cs.LG

LR-SGS: Robust LiDAR-Reflectance-Guided Salient Gaussian Splatting for Self-Driving Scene Reconstruction

이 논문은 LiDAR 반사도 정보를 활용하여 구조 인식형 Salient Gaussian 표현과 경계 일관성 정합을 도입함으로써, 복잡한 조명 및 고자율 주행 환경에서도 기존 방법보다 우수한 재구성 성능과 효율성을 달성한 'LR-SGS'를 제안합니다.

Ziyu Chen, Fan Zhu, Hui Zhu, Deyi Kong, Xinkai Kuang, Yujia Zhang, Chunmao Jiang2026-03-16🤖 cs.AI

Continual Learning in Large Language Models: Methods, Challenges, and Opportunities

이 논문은 대규모 언어 모델의 파레스트포링을 완화하고 진화하는 지식에 적응하기 위한 지속적 학습 방법론을 세 가지 주요 학습 단계와 기존 분류 체계를 바탕으로 종합적으로 검토하며, 전통적 기계학습과의 차이점, 평가 지표, 그리고 향후 기회와 과제를 체계적으로 분석합니다.

Hongyang Chen, Zhongwu Sun, Hongfei Ye, Kunchi Li, Xuemin Lin2026-03-16💬 cs.CL

From Text to Forecasts: Bridging Modality Gap with Temporal Evolution Semantic Space

이 논문은 텍스트의 암시적 의미와 시계열 예측의 명시적 수치 간 모달리티 격차를 해소하기 위해, LLM 을 통해 추출한 해석 가능한 시간적 원시 데이터를 중간 매개체로 활용하는 TESS 모델을 제안하여 예측 오차를 최대 29% 감소시킨 결과를 보여줍니다.

Lehui Li, Yuyao Wang, Jisheng Yan, Wei Zhang, Jinliang Deng, Haoliang Sun, Zhongyi Han, Yongshun Gong2026-03-16💬 cs.CL

RetroReasoner: A Reasoning LLM for Strategic Retrosynthesis Prediction

이 논문은 화학자의 전략적 사고를 모방하고 합성-역합성 일관성 보상을 강화학습에 적용하여, 기존 모델보다 더 넓은 범위의 실행 가능한 반응물 제안과 명확한 결합 절단 논리를 제공하는 'RetroReasoner'라는 새로운 역합성 예측 모델을 제안합니다.

Hanbum Ko, Chanhui Lee, Ye Rin Kim, Rodrigo Hormazabal, Sehui Han, Sungbin Lim, Sungwoong Kim2026-03-16🤖 cs.LG

Marker-Based 3D Reconstruction of Aggregates with a Comparative Analysis of 2D and 3D Morphologies

이 논문은 마커 기반의 유연하고 비용 효율적인 사진측량 기법을 통해 골재의 고품질 3D 모델을 재구성하고, 이를 통해 2D 와 3D 형태학적 특성 간의 유의미한 차이를 규명하여 골재 품질 관리 및 분석을 용이하게 하는 방법을 제시합니다.

Haohang Huang, Jiayi Luo, Issam Qamhia, Erol Tutumluer, John M. Hart, Andrew J. Stolba2026-03-16⚡ eess

MetaKE: Meta-learning Aligned Knowledge Editing via Bi-level Optimization

이 논문은 지식 편집 (KE) 을 이계 최적화 문제로 재정의하고, 구조적 그래디언트 프록시를 통해 의미적 목표와 실행 가능 영역 간의 불일치를 해결하여 대규모 언어 모델의 지식 편집 성능을 획기적으로 개선하는 'MetaKE'프레임워크를 제안합니다.

Shuxin Liu, Ou Wu2026-03-16💬 cs.CL

Experimental evidence of progressive ChatGPT models self-convergence

이 논문은 인터넷에 유입된 LLM 생성 데이터가 학습에 포함되면서 최신 ChatGPT 모델들이 서로의 출력과 유사해지고 다양성이 감소하는 '모델 자기수렴' 현상이 발생한다는 실험적 증거를 제시합니다.

Konstantinos F. Xylogiannopoulos, Petros Xanthopoulos, Panagiotis Karampelas, Georgios A. Bakamitsos2026-03-16💬 cs.CL

Federated Hierarchical Clustering with Automatic Selection of Optimal Cluster Numbers

이 논문은 클라이언트 데이터의 분포를 기반으로 계층적 클러스터링을 수행하여 최적의 클러스터 수를 자동으로 결정하고, 다양한 크기와 형태의 클러스터를 효과적으로 처리할 수 있는 새로운 연방 클러스터링 프레임워크인 Fed- $k^*$ -HC 를 제안합니다.

Yue Zhang, Chuanlong Qiu, Xinfa Liao, Yiqun Zhang2026-03-16🤖 cs.LG

HSEmotion Team at ABAW-10 Competition: Facial Expression Recognition, Valence-Arousal Estimation, Action Unit Detection and Fine-Grained Violence Classification

이 논문은 ABAW-10 대회에서 프레임 단위 감정 인식, 가치 - 각성 추정, 행동 단위 감지 및 미세한 폭력 분류를 위해 사전 훈련된 EfficientNet 기반 임베딩 추출과 MLP, 슬라이딩 윈도우 평활화 기법을 결합한 새로운 접근법을 제안하고, 이를 통해 기존 베이스라인 대비 검증 지표가 크게 향상되었음을 보여줍니다.

Andrey V. Savchenko, Kseniia Tsypliakova2026-03-16🤖 cs.AI

← 이전 다음 →

cs.AI