cs.AI 편의 논문 | Gist.Science

ELLA: Generative AI-Powered Social Robots for Early Language Development at Home

이 논문은 가정에서 유아의 언어 발달을 지원하기 위해 생성형 AI 를 활용한 사회적 로봇 'ELLA'를 설계·배포하고, 부모와 교육자 인터뷰 및 가정 내 워크숍을 통해 얻은 인사이트와 아동의 참여 양상을 분석하여 향후 설계 시사점을 제시합니다.

Victor Nikhil Antony, Shiye Cao, Shuning Wang, Chien-Ming Huang2026-03-16🤖 cs.AI

Red-Teaming Vision-Language-Action Models via Quality Diversity Prompt Generation for Robust Robot Policies

이 논문은 품질 다양성 (Quality Diversity) 기법과 비전 - 언어 모델을 결합하여 VLA 기반 로봇의 취약점을 발견하고 다양한 자연어 지시문을 생성함으로써 로봇 정책의 견고성을 향상시키는 Q-DIG 프레임워크를 제안합니다.

Siddharth Srikanth, Freddie Liang, Sophie Hsu, Varun Bhatt, Shihan Zhao, Henry Chen, Bryon Tjanaka, Minjune Hwang, Akanksha Saran, Daniel Seita, Aaquib Tabrez, Stefanos Nikolaidis2026-03-16💬 cs.CL

When LLM Judge Scores Look Good but Best-of-N Decisions Fail

이 논문은 LLM 평가자가 전역 상관관계는 높게 나타내도 실제 '베스트 오브 N' 선택 작업에서는 within-prompt 순위 능력 부족과 동점 발생으로 인해 성능이 크게 저하될 수 있음을 지적하며, 이를 해결하기 위해 전역 일치도 대신 쌍별 비교와 within-prompt 신호를 평가 지표로 삼아야 함을 주장합니다.

Eddie Landesberg2026-03-16🤖 cs.LG

LLM BiasScope: A Real-Time Bias Analysis Platform for Comparative LLM Evaluation

이 논문은 구글 제미니, 메타 라마 등 다양한 대형 언어 모델 (LLM) 의 출력을 실시간으로 비교하고 문장 수준의 편향을 탐지하여 시각화하는 오픈소스 웹 플랫폼인 'LLM BiasScope'를 소개합니다.

Himel Ghosh, Nick Elias Werner2026-03-16💬 cs.CL

TERMINATOR: Learning Optimal Exit Points for Early Stopping in Chain-of-Thought Reasoning

이 논문은 대형 추론 모델의 과도한 추론을 방지하고 추론 길이를 14%~55% 단축하면서도 성능을 유지하기 위해, 최종 답변이 처음 나타나는 시점을 예측하여 최적의 중단 지점을 학습하는 새로운 조기 종료 전략 'TERMINATOR'를 제안합니다.

Alliot Nagle, Jakhongir Saydaliev, Dhia Garbaya, Michael Gastpar, Ashok Vardhan Makkuva, Hyeji Kim2026-03-16🤖 cs.LG

Spatio-Semantic Expert Routing Architecture with Mixture-of-Experts for Referring Image Segmentation

이 논문은 사전 학습된 비전 - 언어 모델의 고정된 백본을 활용하면서도 참조 이미지 분할의 정밀한 공간 위치 파악과 경계 선정을 위해 경량화된 표현 인식 전문가 어댑터와 퓨전 모듈을 도입한 SERA 아키텍처를 제안합니다.

Alaa Dalaq, Muzammil Behzad2026-03-16🤖 cs.AI

Embedded Quantum Machine Learning in Embedded Systems: Feasibility, Hybrid Architectures, and Quantum Co-Processors

이 논문은 2026 년 기준 리소스가 제한된 엣지 플랫폼에 양자 머신러닝을 적용하는 것의 실현 가능성과 하이브리드 아키텍처 및 양자 코프로세서 구현 경로를 분석하고, 주요 기술적 장벽을 극복하기 위한 공학적 방향과 책임 있는 배포를 위한 거버넌스 방안을 제시합니다.

Somdip Dey, Syed Muhammad Raza2026-03-16🤖 cs.LG

CALF: Communication-Aware Learning Framework for Distributed Reinforcement Learning

이 논문은 엣지 디바이스와 클라우드 서버 간의 네트워크 지연 및 손실과 같은 현실적인 통신 제약 조건을 시뮬레이션 중 학습 과정에 명시적으로 반영하여 분산 강화학습 정책의 배포 성능 격차를 획기적으로 줄이는 'CALF(Communication-Aware Learning Framework)'를 제안합니다.

Carlos Purves, Pietro Lio'2026-03-16🤖 cs.LG

Reinforcement Learning for Diffusion LLMs with Entropy-Guided Step Selection and Stepwise Advantages

이 논문은 확산 언어 모델 (DLM) 에 적용하기 위해 엔트로피 기반 단계 선택과 단계별 이득을 활용한 효율적인 강화 학습 알고리즘을 제안하여, 기존 방법의 편향을 해소하고 코딩 및 논리적 추론 분야에서 최첨단 성능을 달성했습니다.

Vishnu Teja Kunde, Fatemeh Doudi, Mahdi Farahbakhsh, Dileep Kalathil, Krishna Narayanan, Jean-Francois Chamberland2026-03-16🤖 cs.LG

AgentDrift: Unsafe Recommendation Drift Under Tool Corruption Hidden by Ranking Metrics in LLM Agents

이 논문은 도구 오염 하에서도 기존 랭킹 지표가 안전성 저하를 감지하지 못해 위험한 추천이 지속되는 'AgentDrift' 현상을 규명하고, 이를 해결하기 위해 안전성을 명시적으로 반영한 평가 지표와 궤적 수준의 모니터링이 필요함을 주장합니다.

Zekun Wu, Adriano Koshiyama, Sahan Bulathwela, Maria Perez-Ortiz2026-03-16💬 cs.CL

Multiscale Structure-Guided Latent Diffusion for Multimodal MRI Translation

이 논문은 기존 다중 모달 MRI 번역 방법의 해부학적 불일치와 질감 저하 문제를 해결하기 위해 잠재 공간에서 스타일과 구조를 분리하고 다중 스케일 특징을 활용하여 MSG-LDM 이라는 새로운 프레임워크를 제안하고, BraTS2020 및 WMH 데이터셋에서 기존 방법보다 우수한 구조 재구성 성능을 입증했습니다.

Jianqiang Lin (Northeastern University, Shenyang, China, Key Laboratory of Intelligent Computing in Medical Image, Shenyang, China), Zhiqiang Shen (Northeastern University, Shenyang, China, Key Laboratory of Intelligent Computing in Medical Image, Shenyang, China), Peng Cao (Northeastern University, Shenyang, China, National Frontiers Science Center for Industrial Intelligence and Systems Optimization, Shenyang, China), Jinzhu Yang (Northeastern University, Shenyang, China, National Frontiers Science Center for Industrial Intelligence and Systems Optimization, Shenyang, China), Osmar R. Zaiane (University of Alberta, Edmonton, Canada), Xiaoli Liu (AiShiWeiLai AI Research, Beijing, China)2026-03-16⚡ eess

CA-HFP: Curvature-Aware Heterogeneous Federated Pruning with Model Reconstruction

이 논문은 이기종 엣지 디바이스 환경에서 곡률 기반 중요도 점수와 경량 재구성을 통해 개인화된 구조적 가지치기를 수행하면서도 전역 모델의 수렴성과 정확도를 보장하는 'CA-HFP' 프레임워크를 제안하고, 이를 통해 통신 및 계산 비용을 크게 절감하면서도 기존 방법보다 우수한 성능을 입증합니다.

Gang Hu, Yinglei Teng, Pengfei Wu, Shijun Ma2026-03-16🤖 cs.LG

Early Pruning for Public Transport Routing

이 논문은 RAPTOR 기반 대중교통 경로 탐색 알고리즘의 성능 병목 현상을 해결하기 위해, 최적성을 유지하면서 쿼리 시간을 최대 57% 단축하는 '조기 가지치기 (Early Pruning)' 기법을 제안합니다.

Andrii Rohovyi, Abdallah Abuaisha, Toby Walsh2026-03-16🤖 cs.AI

Swap-guided Preference Learning for Personalized Reinforcement Learning from Human Feedback

이 논문은 개인화된 RLHF 에서 발생하는 후방 붕괴 (posterior collapse) 문제를 해결하기 위해 가상의 스왑 주석자와 그 선호도의 대칭성을 활용한 '스왑 유도 선호 학습 (SPL)'을 제안하여 사용자별 잠재 변수의 표현력을 강화하고 선호도 예측 성능을 개선합니다.

Gihoon Kim, Euntai Kim2026-03-16🤖 cs.LG

Optimize Wider, Not Deeper: Consensus Aggregation for Policy Optimization

이 논문은 PPO 의 반복 학습에서 발생하는 노이즈 문제를 해결하기 위해 여러 모델의 예측을 평균화하는 'CAPO' 알고리즘을 제안하여, 추가적인 환경 상호작용 없이도 계산 자원을 깊게가 아닌 넓게 활용함으로써 샘플 효율성을 극대화함을 보여줍니다.

Zelal Su (Lain), Mustafaoglu, Sungyoung Lee, Eshan Balachandar, Risto Miikkulainen, Keshav Pingali2026-03-16🤖 cs.LG

Feynman: Knowledge-Infused Diagramming Agent for Scalable Visual Designs

이 논문은 Feynman 이라는 에이전트를 통해 도메인 지식과 코드를 결합하여 대량의 정렬된 다이어그램 - 캡션 데이터셋과 시각적 추론 평가 벤치마크인 Diagramma 를 생성하는 확장 가능한 시각 디자인 파이프라인을 제안합니다.

Zixin Wen, Yifu Cai, Kyle Lee, Sam Estep, Josh Sunshine, Aarti Singh, Yuejie Chi, Wode Ni2026-03-16🤖 cs.LG

Mastering Negation: Boosting Grounding Models via Grouped Opposition-Based Learning

이 논문은 부정적 의미를 명시적으로 포함하는 새로운 데이터셋 'D-Negation'과 그룹화된 반대 기반 학습 프레임워크를 제안하여, 기존 비전 - 언어 모델이 부정 표현을 처리하는 능력을 획기적으로 향상시켰음을 보여줍니다.

Zesheng Yang, Xi Jiang, Bingzhang Hu, Weili Guan, Runmin Cong, Guo-Jun Qi, Feng Zheng2026-03-16🤖 cs.AI

CarPLAN: Context-Adaptive and Robust Planning with Dynamic Scene Awareness for Autonomous Driving

이 논문은 자율주행의 모방 학습 기반 계획 성능을 향상시키기 위해 미래 변위 예측을 통한 공간 인식 강화와 다양한 주행 상황에 적응하는 다중 전문가 디코더를 도입한 'CarPLAN' 프레임워크를 제안하고, nuPlan 및 Waymax 벤치마크에서 최첨단 성능을 입증합니다.

Junyong Yun, Jungho Kim, ByungHyun Lee, Dongyoung Lee, Sehwan Choi, Seunghyeop Nam, Kichun Jo, Jun Won Choi2026-03-16🤖 cs.AI

FastDSAC: Unlocking the Potential of Maximum Entropy RL in High-Dimensional Humanoid Control

이 논문은 차원별 엔트로피 조절과 연속 분포 비평가라는 새로운 기법을 통해 최대 엔트로피 강화학습이 고차원 인간형 로봇 제어에서 결정적 정책 기반 방법과 경쟁하거나 이를 능가할 수 있음을 입증하는 'FastDSAC' 프레임워크를 제안합니다.

Jun Xue, Junze Wang, Xinming Zhang, Shanze Wang, Yanjun Chen, Wei Zhang2026-03-16🤖 cs.LG

Literary Narrative as Moral Probe : A Cross-System Framework for Evaluating AI Ethical Reasoning and Refusal Behavior

이 논문은 문학 서사를 활용한 새로운 평가 프레임워크를 통해 기존 AI 윤리 평가가 표면적 답변 생성에 그치는 반면, 본 연구는 다양한 AI 시스템에서 진정한 도덕적 추론 능력과 거부 행동을 측정할 수 있음을 입증하고, 시스템 능력 향상과 함께 정교해지는 반성적 실패 모드를 규명하여 고위험 분야 배포 결정에 중요한 함의를 제시합니다.

David C. Flynn2026-03-16💬 cs.CL

← 이전 다음 →