cs.AI 편의 논문 | Gist.Science

Diffusion-Guided Pretraining for Brain Graph Foundation Models

이 논문은 기존 뇌 그래프 사전학습 방법의 한계를 극복하기 위해, 의미 있는 연결 패턴을 보존하고 전역 구조 정보를 포착하도록 확산 모델을 활용한 구조 인식 드롭 및 마스킹 전략과 토폴로지 인식 읽기 및 재구성 방식을 통합한 새로운 사전학습 프레임워크를 제안하고, 2 만 5 천 명 이상의 뇌 영상 데이터를 통해 그 유효성을 입증했습니다.

Xinxu Wei, Rong Zhou, Lifang He, Yu Zhang2026-03-10🤖 cs.LG

Listen to the Layers: Mitigating Hallucinations with Inter-Layer Disagreement

이 논문은 사전 훈련된 대규모 언어 모델의 환각 현상을 완화하기 위해 모델의 내부 계층 간 불일치를 감지하여 추론 시 사실성을 높이는 새로운 훈련 없는 디코딩 알고리즘인 'CoCoA'를 제안하고 다양한 작업에서 그 유효성을 입증합니다.

Koduvayur Subbalakshmi, Sabbir Hossain Ujjal, Venkata Krishna Teja Mangichetty, Nastaran Jamalipour Soofi2026-03-10💬 cs.CL

SToRM: Supervised Token Reduction for Multi-modal LLMs toward efficient end-to-end autonomous driving

이 논문은 자율주행 환경에서 다중 모달 LLM 의 연산 비용을 최대 30 배까지 줄이면서도 모든 토큰을 사용할 때와 동등한 성능을 유지하기 위해, 토큰 중요도 예측, 감독 학습, 그리고 어노커 - 컨텍스트 병합 모듈을 활용한 'SToRM'이라는 새로운 프레임워크를 제안합니다.

Seo Hyun Kim, Jin Bok Park, Do Yeon Koo, Hogun Park, Il Yong Chun2026-03-10💻 cs

Accelerating Robotic Reinforcement Learning with Agent Guidance

이 논문은 인간의 피로와 확장성 한계를 극복하기 위해 인간 대신 멀티모달 에이전트를 활용하여 내재적 가치 사전 지식을 제공하고 탐색을 정제함으로써 로봇 강화학습의 샘플 효율성을 획기적으로 개선하는 '에이전트 유도 정책 탐색 (AGPS)' 프레임워크를 제안합니다.

Haojun Chen, Zili Zou, Chengdong Ma, Yaoxiang Pu, Haotong Zhang, Yuanpei Chen, Yaodong Yang2026-03-10💻 cs

To Mix or To Merge: Toward Multi-Domain Reinforcement Learning for Large Language Models

이 논문은 검증 가능한 보상을 통한 강화학습 (RLVR) 에서 다중 도메인 성능 향상을 위해 혼합 학습과 모델 병합 두 가지 방식을 비교 분석하여, 도메인 간 간섭이 적고 상호 시너지 효과가 있음을 규명하고 M2RL 프로젝트를 제안합니다.

Haoqing Wang, Xiang Long, Ziheng Li, Yilong Xu, Tingguang Li, Yehui Tang2026-03-10💻 cs

SkillsBench: Benchmarking How Well Agent Skills Work Across Diverse Tasks

이 논문은 다양한 도메인에서 에이전트 기술 (Skills) 의 효과를 체계적으로 평가하기 위해 'SkillsBench'를 제안하고, 선별된 기술이 에이전트 성능을 평균 16.2%p 향상시키지만 도메인에 따라 편차가 크며 모델이 스스로 생성한 기술은 효과가 없음을 입증했습니다.

Xiangyi Li, Wenbo Chen, Yimin Liu, Shenghan Zheng, Xiaokun Chen, Yifeng He, Yubo Li, Bingran You, Haotian Shen, Jiankai Sun, Shuyi Wang, Binxu Li, Qunhong Zeng, Di Wang, Xuandong Zhao, Yuanli Wang, Roey Ben Chaim, Zonglin Di, Yipeng Gao, Junwei He, Yizhuo He, Liqiang Jing, Luyang Kong, Xin Lan, Jiachen Li, Songlin Li, Yijiang Li, Yueqian Lin, Xinyi Liu, Xuanqing Liu, Haoran Lyu, Ze Ma, Bowei Wang, Runhui Wang, Tianyu Wang, Wengao Ye, Yue Zhang, Hanwen Xing, Yiqi Xue, Steven Dillmann, Han-chung Lee2026-03-10💻 cs

A Geometric Taxonomy of Hallucinations in LLMs

이 논문은 LLM 의 환각 현상을 무신실성, 허구적 생성, 사실적 오류라는 세 가지 기하학적 유형으로 분류하고, 이를 기반으로 문맥 기반 및 문맥 없는 설정에서 각각의 오류를 탐지하는 새로운 지수 (SGI, DGI) 를 제안하며 TruthfulQA 와 같은 기존 벤치마크의 한계를 지적합니다.

Javier Marín2026-03-10💬 cs.CL

TrasMuon: Trust-Region Adaptive Scaling for Orthogonalized Momentum Optimizers

이 논문은 뉴턴-슈어츠 반복을 통한 직교화를 수행하는 Muon 옵티마이저의 크기 불안정성 문제를 해결하기 위해, 전역 RMS 보정과 에너지 기반 신뢰 영역 클리핑을 결합한 TrasMuon 을 제안하며, 이는 웜업 단계 없이도 기존 베이스라인보다 빠른 수렴과 향상된 안정성을 입증합니다.

Peng Cheng, Jiucheng Zang, Qingnan Li, Liheng Ma, Yufei Cui, Yingxue Zhang, Boxing Chen, Ming Jian, Wen Tong2026-03-10🤖 cs.LG

Can a Lightweight Automated AI Pipeline Solve Research-Level Mathematical Problems?

이 논문은 차세대 대규모 언어 모델을 인용 기반 검증에 최적화된 경량 자동화 파이프라인에 통합하여 ICCM 및 'First Proof'와 같은 연구 수준의 수학 문제들을 해결하고 그 증명을 검증 및 공개했다는 점을 보여줍니다.

Lve Meng (University of Science,Technology of China, Zhongguancun Academy), Weilong Zhao (Université Paris Cité), Yanzhi Zhang (Zhongguancun Academy), Haoxiang Guan (Zhongguancun Academy), Jiyan He (Zhongguancun Academy)2026-03-10🔢 math

Mean Flow Policy with Instantaneous Velocity Constraint for One-step Action Generation

이 논문은 학습 중 순간 속도 제약 (IVC) 을 통해 표현력을 보장하면서도 단일 단계로 행동을 생성할 수 있는 새로운 생성 정책인 평균 속도 정책 (MVP) 을 제안하여, 로봇 조작 작업에서 기존 흐름 기반 정책 대비 뛰어난 성공률과 빠른 추론 속도를 달성했습니다.

Guojian Zhan, Letian Tao, Pengcheng Wang, Yixiao Wang, Yiheng Li, Yuxin Chen, Hongyang Li, Masayoshi Tomizuka, Shengbo Eben Li2026-03-10🤖 cs.LG

Pawsterior: Variational Flow Matching for Structured Simulation-Based Inference

이 논문은 제약된 물리 파라미터와 이산적 잠재 구조를 모두 처리할 수 있도록 엔드포인트 유도 아핀 기하학적 구속과 변분 모델링을 도입하여 시뮬레이션 기반 추론 (SBI) 의 범위를 확장하고 정확도를 향상시킨 'Pawsterior'라는 새로운 변분 흐름 매칭 프레임워크를 제안합니다.

Jorge Carrasco-Pollo, Floor Eijkelboom, Jan-Willem van de Meent2026-03-10🤖 cs.LG

Explainable Token-level Noise Filtering for LLM Fine-tuning Datasets

이 논문은 문장 단위로 설계된 파인튜닝 데이터셋의 토큰 단위 노이즈를 '추론 중요도', '지식 신규성', '작업 관련성'이라는 세 가지 속성으로 분해하여 설명 가능한 필터링 프레임워크인 XTF 를 제안하고, 이를 통해 다양한 LLM 의 하위 작업 성능을 최대 13.7% 까지 향상시킨다는 것을 증명합니다.

Yuchen Yang, Wenze Lin, Enhao Huang, Zhixuan Chu, Hongbin Zhou, Lan Tao, Yiming Li, Zhan Qin, Kui Ren2026-03-10💬 cs.CL

LongAudio-RAG: Event-Grounded Question Answering over Multi-Hour Long Audio

이 논문은 수시간 분량의 오디오를 구조화된 사건 레코드로 변환하여 SQL 데이터베이스에 저장하고, 이를 기반으로 자연어 질문을 해결하는 하이브리드 RAG 프레임워크인 LongAudio-RAG 를 제안하며, 엣지-클라우드 환경에서의 실용성과 기존 방법 대비 향상된 정확도를 입증합니다.

Naveen Vakada, Kartik Hegde, Arvind Krishna Sridhar, Yinyi Guo, Erik Visser2026-03-10🤖 cs.LG

Understand Then Memory: A Cognitive Gist-Driven RAG Framework with Global Semantic Diffusion

이 논문은 인간의 에피소드 기억 메커니즘에서 영감을 받아 의미적 요점 (Semantic Gist) 추출과 글로벌 의미 확산을 통해 복잡한 지식 통합 및 추론 능력을 획기적으로 향상시킨 새로운 RAG 프레임워크인 'CogitoRAG'를 제안하고 그 우수성을 입증합니다.

Pengcheng Zhou, Haochen Li, Zhiqiang Nie, JiaLe Chen, Qing Gong, Weizhen Zhang, Chun Yu2026-03-10💬 cs.CL

Condition-Gated Reasoning for Context-Dependent Biomedical Question Answering

이 논문은 환자 상태에 따라 답변이 달라지는 조건부 추론을 평가하기 위한 새로운 벤치마크 'CondMedQA'와 조건에 따라 지식 그래프의 추론 경로를 선택적으로 활성화하거나 제거하는 '조건 게이트 추론 (CGR)' 프레임워크를 제안하여, 의료적 추론의 견고성을 높이는 방법을 제시합니다.

Jash Rajesh Parekh, Wonbin Kweon, Joey Chan, Rezarta Islamaj, Robert Leaman, Pengcheng Jiang, Chih-Hsuan Wei, Zhizheng Wang, Zhiyong Lu, Jiawei Han2026-03-10💬 cs.CL

Conformal Tradeoffs: Guarantees Beyond Coverage

이 논문은 분포 독립적 기준이 부재한 상황에서 분할 합동 예측 (split conformal prediction) 의 운영적 성과 (기여 빈도, 유보, 오류 노출 등) 를 보장하기 위해 소표본 베타 보정 (SSBC) 과 검증 및 감사 (Calibrate-and-Audit) 프레임워크를 제안하며, 이를 통해 운영 목표 간의 트레이드오프를 시각화하고 유한 시간 창에서의 불확실성을 정량화하는 방법을 제시합니다.

Petrus H. Zwart2026-03-10🤖 cs.LG

ABD: Default Exception Abduction in Finite First Order Worlds

이 논문은 유한 1 차 세계에서의 기본 - 예외 귀납을 위한 벤치마크인 ABD 를 제안하고, 10 개의 최첨단 LLM 을 평가하여 높은 유효성에도 불구하고 간결성 격차와 regimes 간 일반화 실패 양상이 있음을 밝혔습니다.

Serafim Batzoglou2026-03-10✓ Author reviewed ⓘ💻 cs

INDUCTION: Finite-Structure Concept Synthesis in First-Order Logic

이 논문은 정확성 검증과 문장 크기 제약을 통해 유한 구조에서의 개념 합성 능력을 평가하는 새로운 벤치마크 'INDUCTION'을 소개하고, 최신 모델들의 일반화 전략과 성능 차이를 분석합니다.

Serafim Batzoglou2026-03-10💻 cs

Characterizing MARL for Energy Control: A Multi-KPI Benchmark on the CityLearn Environment

이 논문은 CityLearn 환경을 활용하여 도시 에너지 관리에 대한 다중 에이전트 강화학습 (MARL) 알고리즘을 다양한 핵심 성과 지표 (KPI) 로 평가하고, 분산 훈련이 중앙 집중식 훈련보다 우수하며 시간적 의존성 학습이 배터리 수명 등 지속 가능성 지표 향상에 기여함을 입증했습니다.

Aymen Khouja, Imen Jendoubi, Oumayma Mahjoub, Oussama Mahfoudhi, Ruan De Kock, Siddarth Singh, Claude Formanek2026-03-10🤖 cs.LG

MrBERT: Modern Multilingual Encoders via Vocabulary, Domain, and Dimensional Adaptation

이 논문은 35 개 언어와 코드를 기반으로 현대적 아키텍처를 적용하고 Matryoshka 표현 학습을 통해 효율성을 높인 MrBERT 라는 다국어 인코더 모델 계열을 소개하며, 카탈로니아어 및 스페인어 특화 작업과 의료·법률 같은 전문 분야에서 최첨단 성능을 달성했다고 요약할 수 있습니다.

Daniel Tamayo, Iñaki Lacunza, Paula Rivera-Hidalgo, Severino Da Dalt, Javier Aula-Blasco, Aitor Gonzalez-Agirre, Marta Villegas2026-03-10🤖 cs.LG

← 이전 다음 →