MedPruner: Training-Free Hierarchical Token Pruning for Efficient 3D Medical Image Understanding in Vision-Language Models

이 논문은 3D 의료 영상 이해를 위한 비효율적인 계산 과부하를 해결하기 위해, 슬라이드 수준 및 토큰 수준의 중복성을 제거하는 훈련 불필요 계층적 토큰 가지치기 프레임워크 'MedPruner'를 제안하며, 이를 통해 시각 토큰을 5% 미만으로 줄이면서도 성능을 유지하거나 향상시킬 수 있음을 입증했습니다.

Shengyuan Liu, Zanting Ye, Yunrui Lin, Chen Hu, Wanting Geng, Xu Han, Bulat Ibragimov, Yefeng Zheng, Yixuan Yuan2026-03-13🤖 cs.AI

VisDoT : Enhancing Visual Reasoning through Human-Like Interpretation Grounding and Decomposition of Thought

본 논문은 그래픽 지각 이론에 기반한 인간 유사 해석 그라운딩과 사고 분해 (DoT) 프롬핑팅을 도입하여 차트 기반 시각 추론의 한계를 극복하고, InternVL 기반의 VisDoT 프레임워크를 통해 ChartQA 및 ChartQAPro 등 다양한 벤치마크에서 최첨단 성능을 달성한 연구입니다.

Eunsoo Lee, Jeongwoo Lee, Minki Hong, Jangho Choi, Jihie Kim2026-03-13🤖 cs.AI

Stable Spike: Dual Consistency Optimization via Bitwise AND Operations for Spiking Neural Networks

이 논문은 비트 단위 AND 연산을 통해 안정적인 스파이크 골격과 불안정한 스파이크 맵을 분리하고 일관성을 최적화하는 'Stable Spike' 방법을 제안하여, 초저지연 환경에서 스파이킹 신경망 (SNN) 의 인식 정확도와 일반화 성능을 크게 향상시킵니다.

Yongqi Ding, Kunshan Yang, Linze Li, Yiyang Zhang, Mengmeng Jing, Lin Zuo2026-03-13🤖 cs.AI

Entropy-Preserving Reinforcement Learning

이 논문은 정책 경사 알고리즘이 학습 과정에서 엔트로피가 감소하여 탐색 다양성이 저하되는 문제를 지적하고, REPO 와 ADAPO 와 같은 엔트로피 보존 메커니즘을 제안하여 학습 중 다양성을 유지함으로써 최종 성능과 새로운 환경에서의 연속 학습 능력을 향상시키는 방법을 제시합니다.

Aleksei Petrenko, Ben Lipkin, Kevin Chen, Erik Wijmans, Marco Cusumano-Towner, Raja Giryes, Philipp Krähenbühl2026-03-13🤖 cs.LG

Causal Prosody Mediation for Text-to-Speech:Counterfactual Training of Duration, Pitch, and Energy in FastSpeech2

이 논문은 FastSpeech2 아키텍처에 명시적인 감정 조건부와 반사실적 훈련 목표를 도입하여 텍스트, 감정, 화자가 말초리 (지속 시간, 피치, 에너지) 를 통해 음성 파형에 미치는 인과적 관계를 모델링함으로써, 언어적 내용과 감정적 프로소디를 분리하고 자연스러운 감정 표현과 정교한 프로소디 제어가 가능한 새로운 TTS 프레임워크를 제안합니다.

Suvendu Sekhar Mohanty2026-03-13🤖 cs.AI

STAIRS-Former: Spatio-Temporal Attention with Interleaved Recursive Structure Transformer for Offline Multi-task Multi-agent Reinforcement Learning

이 논문은 다양한 에이전트 수와 미시적 관측 환경에서 장기적 시간 의존성과 에이전트 간 협력을 효과적으로 포착하기 위해 공간 및 시간 계층 구조와 인터리브드 재귀적 구조를 도입한 STAIRS-Former 를 제안하고, 이를 통해 오프라인 다중 작업 다중 에이전트 강화학습에서 기존 방법들을 능가하는 새로운 최고 성능을 달성했음을 보여줍니다.

Jiwon Jeon, Myungsik Cho, Youngchul Sung2026-03-13🤖 cs.AI

OSCBench: Benchmarking Object State Change in Text-to-Video Generation

이 논문은 텍스트 기반 비디오 생성 모델의 객체 상태 변화 (OSC) 능력을 평가하기 위해 요리 데이터를 기반으로 한 새로운 벤치마크인 OSCBench 를 제안하고, 기존 모델들이 의미적 정합성은 우수하지만 새로운 및 복합적인 상황에서의 객체 상태 변화 구현에는 여전히 한계가 있음을 밝힙니다.

Xianjing Han, Bin Zhu, Shiqi Hu, Franklin Mingzhe Li, Patrick Carrington, Roger Zimmermann, Jingjing Chen2026-03-13💬 cs.CL

Scaling Laws for Educational AI Agents

이 논문은 모델 크기뿐만 아니라 역할 정의, 기술 깊이, 도구 완성도 등 구조적 차원을 체계적으로 확장하는 '에이전트 스케일링 법칙'을 제안하고, 이를 구현한 EduClaw 플랫폼을 통해 교육용 AI 에이전트의 성능이 프로필의 구조적 풍부함에 따라 예측 가능하게 향상됨을 실증합니다.

Mengsong Wu, Hao Hao, Shuzhen Bi, Keqian Li, Wentao Liu, Siyu Song, Hongbo Zhao, Aimin Zhou2026-03-13🤖 cs.AI

Affect Decoding in Phonated and Silent Speech Production from Surface EMG

이 논문은 발화 및 무성 발화 중 얼굴과 목의 표면 근전도 (sEMG) 신호를 분석하여 좌절감을 포함한 감정을 0.845 AUC 의 정확도로 식별할 수 있음을 입증하고, 무성 발화에서도 감정 신호가 유지됨을 보여줌으로써 감성 인식 무성 발화 인터페이스의 가능성을 제시합니다.

Simon Pistrosch, Kleanthis Avramidis, Tiantian Feng, Jihwan Lee, Monica Gonzalez-Machorro, Shrikanth Narayanan, Björn W. Schuller2026-03-13⚡ eess

When OpenClaw Meets Hospital: Toward an Agentic Operating System for Dynamic Clinical Workflows

이 논문은 안전성, 투명성, 감사 가능성을 보장하기 위해 제한된 실행 환경, 문서 중심 상호작용, 페이지 인덱싱 메모리, 그리고 커스텀 의료 기술 라이브러리를 통합하여 병원 환경에 적합한 '에이전트 운영체제'를 제안합니다.

Wenxian Yang, Hanzheng Qiu, Bangqun Zhang, Chengquan Li, Zhiyong Huang, Xiaobin Feng, Rongshan Yu, Jiahong Dong2026-03-13🤖 cs.AI

Gender Bias in Generative AI-assisted Recruitment Processes

이 논문은 GPT-5 를 활용한 시뮬레이션 연구를 통해 채용 과정에서 성별에 따른 직무 추천 차이는 없었으나, 여성에게는 감정적·공감적 특성을, 남성에게는 전략적·분석적 특성을 부여하는 언어적 편향이 존재함을 발견하고 Generative AI 의 채용 활용에 대한 윤리적 투명성과 공정성의 필요성을 강조합니다.

Martina Ullasci, Marco Rondina, Riccardo Coppola, Antonio Vetrò2026-03-13🤖 cs.AI

CINDI: Conditional Imputation and Noisy Data Integrity with Flows in Power Grid Data

이 논문은 전력망과 같은 복잡한 시계열 데이터의 노이즈와 이상치를 처리하기 위해 이상 탐지와 결측치 보정을 단일 엔드투엔드 시스템으로 통합한 확률적 프레임워크 'CINDI'를 제안하고, 이를 통해 데이터의 물리적 및 통계적 특성을 보존하면서 강건한 성능을 입증합니다.

David Baumgartner, Helge Langseth, Heri Ramampiaro2026-03-13🤖 cs.AI