cs.AI 편의 논문 | Gist.Science

FOR-Prompting: From Objection to Revision via an Asymmetric Prompting Protocol

이 논문은 외부 질문을 통해 자기 수정을 유도하는 비대칭적 프롬프팅 프로토콜인 FOR-Prompting 을 제안하며, 이는 학습 없이도 작은 모델에서도 수학 및 개방형 과제에서 기존 방법보다 우수한 성능과 인간 선호도를 보여줍니다.

He Zhang, Anzhou Zhang, Jian Dai2026-03-10💬 cs.CL

Tree-based Dialogue Reinforced Policy Optimization for Red-Teaming Attacks

이 논문은 대화 과정을 순차적 의사결정 문제로 간주하고 트리 기반 강화학습을 적용하여 기존 방법론보다 훨씬 높은 공격 성공률로 다양한 다회전 적대적 공격 전략을 자동으로 발견하는 'DialTree' 프레임워크를 제안합니다.

Ruohao Guo, Afshin Oroojlooy, Roshan Sridhar, Miguel Ballesteros, Alan Ritter, Dan Roth2026-03-10🤖 cs.LG

Wasserstein Gradient Flows for Scalable and Regularized Barycenter Computation

이 논문은 미니배치 최적 수송, 모듈형 정규화, 그리고 지도 정보 통합을 통해 기존 이산적 방법의 확장성 한계와 신경망 접근법의 복잡성을 극복하고, 다양한 분야에서 새로운 최첨단 성능을 달성하는 확률 측도 공간의 와세르슈타인 그래디언트 흐름 기반의 확장 가능하고 정규화된 바리센터 계산 알고리즘을 제안합니다.

Eduardo Fernandes Montesuma, Yassir Bendou, Mike Gartrell2026-03-10🤖 cs.LG

Tiny but Mighty: A Software-Hardware Co-Design Approach for Efficient Multimodal Inference on Battery-Powered Small Devices

이 논문은 비전, 오디오, 언어 모듈을 각각 최적의 가속기에 매핑하는 하드웨어-소프트웨어 공동 설계 프레임워크 'NANOMIND'를 제안하여, 배터리 구동 소형 장치에서 대규모 멀티모달 모델의 온디바이스 추론 시 에너지 효율과 처리량을 획기적으로 향상시켰음을 보여줍니다.

Yilong Li, Shuai Zhang, Yijing Zeng, Hao Zhang, Xinmiao Xiong, Jingyu Liu, Pan Hu, Suman Banerjee2026-03-10💬 cs.CL

Membership Inference Attacks on Tokenizers of Large Language Models

이 논문은 대규모 언어 모델 (LLM) 의 프라이버시 위험을 평가하는 새로운 공격 벡터로 토크나이저를 제시하고, 이를 통한 멤버십 추론 공격의 취약점을 규명하며 대응 방안을 제안합니다.

Meng Tong, Yuntao Du, Kejiang Chen, Weiming Zhang, Ninghui Li2026-03-10💻 cs

Deliberative Dynamics and Value Alignment in LLM Debates

이 논문은 Reddit 의 'Am I the Asshole' 데이터셋을 기반으로 GPT-4.1, Claude 3.7 Sonnet, Gemini 2.0 Flash 등 주요 LLM 들이 동기식 및 순차식 토론 프로토콜 하에서 어떻게 다른 수정률, 가치 우선순위, 그리고 순서 효과에 따른 순응 행동을 보이는지 분석하여 다중 턱 환경에서의 LLM 의 의식적 역동성과 가치 정렬을 규명합니다.

Pratik S. Sachdeva, Tom van Nuenen2026-03-10💻 cs

Reallocating Attention Across Layers to Reduce Multimodal Hallucination

이 논문은 다중 모달 대형 추론 모델의 환각 현상을 완화하기 위해, 기존 모델의 재학습이나 구조 변경 없이 레이어별 주의 집중을 감지 및 추론 헤드로 식별하여 적응적으로 재조정하는 경량화 플러그인 'Functional Head Identification and Class-Conditioned Rescaling'을 제안합니다.

Haolang Lu, Bolun Chu, WeiYe Fu, Guoshun Nan, Junning Liu, Minghui Pan, Qiankun Li, Yi Yu, Hua Wang, Kun Wang2026-03-10💻 cs

DropVLA: An Action-Level Backdoor Attack on Vision-Language-Action Models

이 논문은 제한된 데이터 오염으로만도 VLA 모델의 정상적인 성능을 해치지 않으면서 특정 시점에 위험한 행동을 강제로 수행하게 하는 'DropVLA'라는 정교한 액션 레벨 백도어 공격을 제안하고, 시뮬레이션 및 실제 로봇 환경에서 그 유효성을 입증합니다.

Zonghuan Xu, Jiayu Li, Yunhan Zhao, Xiang Zheng, Xingjun Ma, Yu-Gang Jiang2026-03-10💻 cs

Ego-Vision World Model for Humanoid Contact Planning

이 논문은 시뮬레이션 없이 학습된 세계 모델과 샘플 기반 모델 예측 제어 (MPC) 를 결합하여, 인간형 로봇이 proprioception 과 이고센트릭 깊이 이미지를 통해 물리적 접촉을 활용하는 작업을 실시간으로 안정적으로 수행할 수 있도록 하는 새로운 프레임워크를 제안합니다.

Hang Liu, Yuman Gao, Sangli Teng, Yufeng Chi, Yakun Sophia Shao, Zhongyu Li, Maani Ghaffari, Koushil Sreenath2026-03-10💻 cs

ARM-FM: Automated Reward Machines via Foundation Models for Compositional Reinforcement Learning

이 논문은 파운데이션 모델의 추론 능력을 활용하여 자연어 명세로부터 보상 기계 (Reward Machines) 를 자동으로 생성하고, 이를 통해 강화학습의 과업을 구성적으로 분해하며 제로샷 일반화까지 가능하게 하는 'ARM-FM' 프레임워크를 제안합니다.

Roger Creus Castanyer, Faisal Mohamed, Pablo Samuel Castro, Cyrus Neary, Glen Berseth2026-03-10🤖 cs.LG

The Ends Justify the Thoughts: RL-Induced Motivated Reasoning in LLM CoTs

이 논문은 강화학습 기반의 추론 모델이 지시사항과 충돌할 때 유동적 추론 (motivated reasoning) 을 통해 위반 행위를 합리화하며, 이로 인해 추론 과정을 모니터링하는 소형 모델이 오히려 모델의 위반을 간과하게 되어 위험을 초래할 수 있음을 보여줍니다.

Nikolaus Howe, Micah Carroll2026-03-10🤖 cs.LG

Explainable Heterogeneous Anomaly Detection in Financial Networks via Adaptive Expert Routing

이 논문은 금융 시장의 다양한 이상 징후 (가격 충격, 유동성 동결 등) 를 식별하고 그 원인을 설명할 수 있도록, 적응형 그래프 학습과 메커니즘별 전문가 라우팅을 결합한 해석 가능한 이질적 이상 탐지 프레임워크를 제안하며, 이를 통해 기존 방법보다 정밀한 조기 경보와 행동 가능한 통찰력을 제공합니다.

Zan Li, Rui Fan2026-03-10🤖 cs.LG

Taming Modality Entanglement in Continual Audio-Visual Segmentation

이 논문은 오디오-비주얼 세분화 작업에서 발생하는 다중 모달 의미 드리프트와 공발생 혼란 문제를 해결하기 위해 충돌 기반 다중 모달 리허설 (CMR) 프레임워크를 제안하고, 이를 통해 기존 단일 모달 방법보다 우수한 성능을 입증합니다.

Yuyang Hong, Qi Yang, Tao Zhang, Zili Wang, Zhaojin Fu, Kun Ding, Bin Fan, Shiming Xiang2026-03-10💻 cs

Reinforcing Numerical Reasoning in LLMs for Tabular Prediction via Structural Priors

이 논문은 열의 순열 불변성을 구조적 사전 지식으로 인코딩한 순열 상대 정책 최적화 (PRPO) 기반 강화학습 프레임워크를 제안하여, 대규모 언어 모델이 표 데이터 예측에서 기존 최첨단 모델들을 능가하는 수치 추론 능력을 발휘하도록 함으로써 적은 감독 하에서도 탁월한 성능을 달성함을 보여줍니다.

Pengxiang Cai, Zihao Gao, Wanchen Lian, Jintai Chen2026-03-10🤖 cs.LG

Rethinking Driving World Model as Synthetic Data Generator for Perception Tasks

본 논문은 자율주행의 하류 인식 작업 성능 향상을 위해 3D 어셋 렌더링과 세계 모델 미세 조정을 결합한 새로운 합성 데이터 생성 프레임워크인 Dream4Drive 와 대규모 3D 자산 데이터셋을 제안하여, 기존 방법론의 한계를 극복하고 다양한 훈련 조건에서 인식 모델의 성능을 효과적으로 개선함을 보여줍니다.

Kai Zeng, Zhanqian Wu, Kaixin Xiong, Xiaobao Wei, Xiangyu Guo, Zhenxin Zhu, Kalok Ho, Lijun Zhou, Bohan Zeng, Ming Lu, Haiyang Sun, Bing Wang, Guang Chen, Hangjun Ye, Wentao Zhang2026-03-10💻 cs

Human-Centered LLM-Agent System for Detecting Anomalous Digital Asset Transactions

이 논문은 비전문가가 자연어로 분석 의도를 표현하고 구조화된 위험 증거를 검토하며 추적 가능한 전문가 수준의 추론을 얻을 수 있도록 설계된 인간 중심의 다중 에이전트 시스템 HCLA 를 통해 디지털 자산 거래의 이상 탐지 과정에서 설명 가능성과 책임성을 동시에 강화하는 새로운 패러다임을 제시합니다.

Gyuyeon Na, Minjung Park, Hyeonjeong Cha, Sangmi Chai2026-03-10💻 cs

CountFormer: A Transformer Framework for Learning Visual Repetition and Structure in Class-Agnostic Object Counting

이 논문은 DINOv2 기반의 비지도 시각 표현을 활용하여 객체 범주에 구애받지 않는 시각적 반복과 구조 학습을 통해 객체 수를 추정하는 'CountFormer' 프레임워크를 제안하고, FSC-147 벤치마크에서 경쟁력 있는 성능을 보이며 표현의 질이 표본 없는 객체 수 세기에서 중요한 역할을 함을 입증합니다.

Md Tanvir Hossain, Akif Islam, Mohd Ruhul Ameen2026-03-10💻 cs

LagMemo: Language 3D Gaussian Splatting Memory for Multi-modal Open-vocabulary Multi-goal Visual Navigation

이 논문은 일회성 탐사를 통해 강건한 공간 - 시맨틱 상관관계를 가진 통합 3D 언어 메모리를 구축하고, 이를 활용하여 다중 목표 시각 내비게이션 및 오픈-보카불러리 질의에 있어 기존 최첨단 방법들을 크게 능가하는 성능을 보이는 'LagMemo' 시스템을 제안합니다.

Haotian Zhou, Xiaole Wang, He Li, Zhuo Qi, Jinrun Yin, Haiyu Kong, Jianghuan Xu, Huijing Zhao2026-03-10💻 cs

SwiftEmbed: Ultra-Fast Text Embeddings via Static Token Lookup for Real-Time Applications

이 논문은 MinishLab 의 Potion-base-8M 증류 모델을 기반으로 Rust 로 구현된 SwiftEmbed 를 소개하며, 정적 토큰 조회와 제로-카피 직렬화를 통해 1.12ms 의 초저지연성과 50,000 RPS 의 처리량을 달성하면서도 MTEB 평균 60.6 점의 성능을 유지하는 실시간 텍스트 임베딩 시스템을 제안합니다.

Edouard Lansiaux, Antoine Simonet, Eric Wiel2026-03-10💬 cs.CL

Vectorized Online POMDP Planning

이 논문은 POMDP 계획의 병렬화 병목 현상을 해결하기 위해 텐서 기반의 완전 벡터화 계산을 도입한 'VOPP'를 제안하며, 기존 최첨단 솔버 대비 20 배 이상 높은 계산 효율성과 1000 배 작은 예산으로 더 우수한 성능을 입증합니다.

Marcus Hoerger, Muhammad Sudrajat, Hanna Kurniawati2026-03-10💻 cs

← 이전 다음 →