cs.AI 편의 논문 | Gist.Science

MA-EgoQA: Question Answering over Egocentric Videos from Multiple Embodied Agents

이 논문은 다수의 embodied 에이전트로부터 수집된 장기 시점의 이기중심 비디오를 동시에 이해하는 새로운 문제를 정의하고, 이를 평가하기 위한 MA-EgoQA 벤치마크와 공유 메모리 및 동적 검색을 활용한 EgoMAS 기반 모델을 제안하며, 현재 모델들이 다중 스트림 처리에 한계가 있음을 보여줍니다.

Kangsan Kim, Yanlai Yang, Suji Kim, Woongyeong Yeo, Youngwan Lee, Mengye Ren, Sung Ju Hwang2026-03-11🤖 cs.AI

SCENEBench: An Audio Understanding Benchmark Grounded in Assistive and Industrial Use Cases

이 논문은 접근성 기술과 산업용 소음 모니터링의 필요성에 기반하여 음성 인식 외의 오디오 이해 능력을 평가하기 위해 SCENEBench 라는 새로운 벤치마크를 제안하고, 최신 대규모 오디오 언어 모델 (LALM) 들의 성능과 한계를 분석합니다.

Laya Iyer, Angelina Wang, Sanmi Koyejo2026-03-11🤖 cs.AI

A Graph-Based Approach to Spectrum Demand Prediction Using Hierarchical Attention Networks

이 논문은 지리 공간 데이터를 활용하여 복잡한 공간 수요 패턴과 공간 자기상관 문제를 해결하고 기존 모델 대비 21% 높은 예측 정확도를 달성한 계층적 해상도 그래프 어텐션 네트워크 (HR-GAT) 를 제안합니다.

Mohamad Alkadamani, Halim Yanikomeroglu, Amir Ghasemi2026-03-11🤖 cs.AI

Emerging Extrinsic Dexterity in Cluttered Scenes via Dynamics-aware Policy Learning

이 논문은 복잡한 환경에서 물체 간 접촉으로 인한 역학을 명시적으로 모델링한 '동역학 인식 정책 학습 (DAPL)' 프레임워크를 제안하여, 수동적 조작의 한계를 극복하고 혼잡한 장면에서도 성공적인 외재적 민첩성을 실현하는 방법을 제시합니다.

Yixin Zheng, Jiangran Lyu, Yifan Zhang, Jiayi Chen, Mi Yan, Yuntian Deng, Xuesong Shi, Xiaoguang Zhao, Yizhou Wang, Zhizheng Zhang, He Wang2026-03-11🤖 cs.AI

LCA: Local Classifier Alignment for Continual Learning

이 논문은 continual learning 환경에서 백본과 분류기 간의 불일치 문제를 해결하기 위해 'Local Classifier Alignment(LCA)' 손실 함수를 제안하고, 이를 모델 병합 접근법과 결합하여 기존 최첨단 방법보다 우수한 성능을 달성하는 새로운 continual learning 솔루션을 제시합니다.

Tung Tran, Danilo Vasconcellos Vargas, Khoat Than2026-03-11🤖 cs.AI

Influencing LLM Multi-Agent Dialogue via Policy-Parameterized Prompts

이 논문은 강화학습 없이도 프롬프트를 매개변수화하여 에이전트의 대화 행동을 체계적으로 제어하는 경량 정책 프레임워크를 제안하고, 이를 통해 다중 에이전트 대화의 역동성을 효과적으로 조절할 수 있음을 실험을 통해 입증합니다.

Hongbo Bo, Jingyu Hu, Weiru Liu2026-03-11🤖 cs.AI

MSSR: Memory-Aware Adaptive Replay for Continual LLM Fine-Tuning

이 논문은 연속적인 LLM 파인튜닝 중 발생하는 catastrophic forgetting 을 완화하면서도 빠른 적응을 유지하기 위해, 샘플 수준의 기억 강도를 추정하고 적응형 간격으로 재연습을 스케줄링하는 메모리 인식 적응형 재연습 프레임워크인 MSSR 을 제안하고 다양한 벤치마크에서 기존 방법들을 능가하는 성능을 입증합니다.

Yiyang Lu, Yu He, Jianlong Chen, Hongyuan Zha2026-03-11🤖 cs.AI

MedMASLab: A Unified Orchestration Framework for Benchmarking Multimodal Medical Multi-Agent Systems

이 논문은 비동일한 데이터 파이프라인과 표준화된 평가 부재라는 한계를 해결하기 위해, 24 가지 의료 모달리티와 11 가지 이기종 다중 에이전트 아키텍처를 통합하고 자동화된 임상 추론 평가 체계를 갖춘 멀티모달 의료 다중 에이전트 시스템 벤치마킹 프레임워크인 MedMASLab 을 제안합니다.

Yunhang Qian, Xiaobin Hu, Jiaquan Yu, Siyang Xin, Xiaokun Chen, Jiangning Zhang, Peng-Tao Jiang, Jiawei Liu, Hongwei Bran Li2026-03-11🤖 cs.AI

AI-Enabled Data-driven Intelligence for Spectrum Demand Estimation

이 논문은 크라우드소싱 데이터와 사이트 라이선스 데이터를 기반으로 한 AI 및 머신러닝 모델을 통해 스펙트럼 수요를 정확히 예측하고, 캐나다 주요 5 개 도시에서 검증된 이 접근법이 주파수 자원 할당 및 정책 수립을 지원함을 제시합니다.

Colin Brown, Mohamad Alkadamani, Halim Yanikomeroglu2026-03-11🤖 cs.AI

Adaptive Clinical-Aware Latent Diffusion for Multimodal Brain Image Generation and Missing Modality Imputation

이 논문은 알츠하이머병 진단을 위한 다중 모달 뇌 영상 데이터의 결측을 해결하기 위해, 임상 메타데이터와 가용 영상을 적응적으로 융합하는 잠재 확산 모델 (ACADiff) 을 제안하여 sMRI, FDG-PET, AV45-PET 간의 고품질 상호 생성 및 결측 모달리티 보강을 가능하게 함을 보여줍니다.

Rong Zhou, Houliang Zhou, Yao Su, Brian Y. Chen, Yu Zhang, Lifang He, Alzheimer's Disease Neuroimaging Initiative2026-03-11🤖 cs.AI

Towards Flexible Spectrum Access: Data-Driven Insights into Spectrum Demand

이 논문은 머신러닝과 지리 공간 분석을 활용하여 캐나다 도시 지역의 6G 네트워크 스펙트럼 수요 패턴을 추정하고 주요 영향 요인을 규명함으로써, 유연한 스펙트럼 접근 정책 수립을 위한 데이터 기반 통찰력을 제공합니다.

Mohamad Alkadamani, Amir Ghasemi, Halim Yanikomeroglu2026-03-11🤖 cs.AI

PathMem: Toward Cognition-Aligned Memory Transformation for Pathology MLLMs

이 논문은 병리학 전문 지식과 시각적 패턴 인식을 통합하여 진단 추론의 정확성과 해석 가능성을 향상시키기 위해, 병리학자의 계층적 기억 과정을 모방한 메모리 중심 멀티모달 프레임워크 'PathMem'을 제안하고 이를 통해 기존 모델 대비 성능을 크게 개선했음을 보여줍니다.

Jinyue Li, Yuci Liang, Qiankun Li, Xinheng Lyu, Jiayu Qian, Huabao Chen, Kun Wang, Zhigang Zeng, Anil Anthony Bharath, Yang Liu2026-03-11🤖 cs.AI

No Image, No Problem: End-to-End Multi-Task Cardiac Analysis from Undersampled k-Space

이 논문은 undersampled k-space 데이터에서 직접 심장의 생리학적 라벨을 추출하는 'k-MTR' 프레임워크를 제안하여, 기존 '재구성 후 분석' 방식의 한계를 극복하고 다양한 심장 MRI 분석 작업에서 최첨단 성능을 달성함을 보여줍니다.

Yundi Zhang, Sevgi Gokce Kafali, Niklas Bubeck, Daniel Rueckert, Jiazhen Pan2026-03-11🤖 cs.AI

The Confidence Gate Theorem: When Should Ranked Decision Systems Abstain?

이 논문은 순위 기반 의사결정 시스템에서 불확실성 유형 (구조적 대 문맥적) 에 따라 신뢰도 기반 기각 (abstention) 전략의 유효성이 달라지며, 특히 문맥적 불확실성 하에서는 기존 기법들이 한계를 보임을 실증적으로 규명하고 배포 전 진단 기준을 제시합니다.

Ronald Doku2026-03-11🤖 cs.AI

When Learning Rates Go Wrong: Early Structural Signals in PPO Actor-Critic

이 논문은 PPO actor-critic 학습에서 학습률 선택의 실패를 조기에 감지하기 위해 은닉 뉴런의 활성화 패턴 균형을 측정하는 OUI (Overfitting-Underfitting Indicator) 지표를 제안하고, 이를 통해 학습 초기 단계에서 성공적인 학습률을 효과적으로 선별할 수 있음을 실증합니다.

Alberto Fernández-Hernández, Cristian Pérez-Corral, Jose I. Mestre, Manuel F. Dolz, Jose Duato, Enrique S. Quintana-Ortí2026-03-11🤖 cs.AI

Towards a Neural Debugger for Python

이 논문은 기존 신경 해석기의 한계를 극복하고 프론트 및 백워드 실행을Debugger 동작에 따라 모델링하는 '신경 디버거'를 제안하여, 향후 에이전트 기반 코딩 시스템 및 자동화된 디버깅의 기반을 마련했다고 요약할 수 있습니다. 더 간결하게 한 문장으로 정리하면 다음과 같습니다: **이 논문은 프론트 및 백워드 실행을 디버거 동작에 따라 모델링하는 '신경 디버거'를 제안하여 향후 에이전트 기반 코딩 시스템과 자동화된 디버깅의 기반을 마련했습니다.**

Maximilian Beck, Jonas Gehring, Jannik Kossen, Gabriel Synnaeve2026-03-11🤖 cs.AI

Think Before You Lie: How Reasoning Improves Honesty

이 논문은 기존 연구와 달리 인간과 달리 대형 언어 모델 (LLM) 은 추론 과정을 거칠수록 정직해지며, 이는 추론 내용 자체보다는 정직한 답변이 속한 표현 공간이 기만적인 영역보다 더 안정적이기 때문임을 규명했습니다.

Ann Yuan, Asma Ghandeharioun, Carter Blum, Alicia Machado, Jessica Hoffmann, Daphne Ippolito, Martin Wattenberg, Lucas Dixon, Katja Filippova2026-03-11🤖 cs.AI

BEACON: Language-Conditioned Navigation Affordance Prediction under Occlusion

이 논문은 가려진 영역을 포함한 국소 이동 가능 영역을 예측하기 위해 시각 - 언어 모델에 공간 단서를 주입하고 깊이 기반 특징을 융합하는 BEACON 을 제안하여, 가려진 목표 위치가 있는 환경에서 기존 이미지 공간 기반 방법보다 이동성 예측 정확도를 크게 향상시킨다고 설명합니다.

Xinyu Gao, Gang Chen, Javier Alonso-Mora2026-03-11🤖 cs.AI

Emotional Modulation in Swarm Decision Dynamics

이 논문은 벌의 군집 의사결정 방정식을 확장하여 감정적 가치와 각성 수준이 상호작용률을 조절함으로써 집단적 합의의 결과와 속도에 미치는 영향을 분석하고, 감정 전염과 비선형 증폭이 어떻게 집단적 선택을 형성하는지 규명합니다.

David Freire-Obregón2026-03-11🤖 cs.AI

Understanding the Use of a Large Language Model-Powered Guide to Make Virtual Reality Accessible for Blind and Low Vision People

이 논문은 16 명의 시각장애인 참가자를 대상으로 한 연구를 통해, 가상현실 환경에서 AI 안내자가 고립된 상태에서는 도구로 인식되지만 타인과 함께 있을 때는 동반자로서 대우받으며 사회적 상호작용을 유도한다는 점을 발견하고 향후 설계 방향을 제시합니다.

Jazmin Collins, Sharon Y Lin, Tianqi Liu, Andrea Stevenson Won, Shiri Azenkot2026-03-11🤖 cs.AI

← 이전 다음 →