Language-Grounded Decoupled Action Representation for Robotic Manipulation

이 논문은 고수준의 언어 이해와 저수준의 로봇 제어 간의 간극을 해소하기 위해 번역, 회전, 그리퍼 제어라는 세 가지 해석 가능한 행동 원시 (primitives) 를 중간 계층으로 도입하고, 의미 기반 소프트 라벨 대비 학습 및 적응형 가중치 전략을 통해 새로운 작업에 대한 강력한 일반화 성능을 달성하는 'LaDA' 프레임워크를 제안합니다.

Wuding Weng, Tongshu Wu, Liucheng Chen + 5 more2026-03-16💻 cs

Route Fragmentation Based on Resource-centric Prioritisation for Efficient Multi-Robot Path Planning in Agricultural Environments

이 논문은 농업 환경의 공간적 병목 현상을 해결하기 위해 자원 중심 우선순위 기반 경로 분할 전략을 도입한 새로운 다중 로봇 경로 계획 알고리즘을 제안하고, 기존 방법 대비 작업 처리량을 크게 향상시켰음을 시뮬레이션을 통해 입증합니다.

James R. Heselden, Gautham P. Das2026-03-16💻 cs

A Closed-Form Solution for Debiasing Vision-Language Models with Utility Guarantees Across Modalities and Tasks

이 논문은 학습 데이터에서 파생된 편향을 교정하면서도 모델의 유용성을 이론적으로 보장하는 폐형식 (closed-form) 해법을 제시하여, 주석 데이터 없이 시각 및 텍스트 모달리티의 교차적 편향을 제거하고 다양한 다운스트림 작업에서 편향 완화와 성능 유지 간의 최적 균형을 달성하는 훈련 없는 방법을 제안합니다.

Tangzheng Lian, Guanyu Hu, Yijing Ren + 2 more2026-03-16💻 cs

Before and After ChatGPT: Revisiting AI-Based Dialogue Systems for Emotional Support

이 논문은 2020 년부터 2024 년 5 월까지의 연구를 분석하여, 정서적 지원을 위한 AI 대화 시스템이 과업 특화형 딥러닝 모델에서 대규모 언어 모델 (LLM) 기반 접근법으로 전환됨에 따라 언어적 유연성과 일반화 능력이 향상되었으나 신뢰성과 안전성 문제가 대두되었음을 규명하고 향후 발전 방향을 제시합니다.

Daeun Lee, Dongje Yoo, Migyeong Yang + 3 more2026-03-16💻 cs

Reference-Free Image Quality Assessment for Virtual Try-On via Human Feedback

이 논문은 지상참조 이미지 없이도 인간 지각과 정렬된 가상 의상 착용 (VTON) 이미지 품질 평가를 가능하게 하는 참조 없는 프레임워크 'VTON-IQA'와 대규모 인간 주석 데이터셋 'VTON-QBench'를 제안하고, 이를 통해 14 개의 대표 VTON 모델에 대한 포괄적인 벤치마크 평가를 수행합니다.

Yuki Hirakawa, Takashi Wada, Ryotaro Shimizu + 6 more2026-03-16💻 cs

Mitigating Memorization in Text-to-Image Diffusion via Region-Aware Prompt Augmentation and Multimodal Copy Detection

이 논문은 텍스트-이미지 확산 모델의 저작권 및 개인정보 침해 위험을 완화하기 위해, 훈련 중 의미론적 정렬을 유지하면서 과적합을 줄이는 '지역 인식 프롬프트 증강 (RAPTA)'과 대규모 주석 데이터 없이도 복제를 효과적으로 탐지하는 '주도 멀티모달 복제 탐지 (ADMCD)'라는 두 가지 방법을 제안하고 그 유효성을 입증합니다.

Yunzhuo Chen, Jordan Vice, Naveed Akhtar + 2 more2026-03-16💻 cs

Reasoning over Video: Evaluating How MLLMs Extract, Integrate, and Reconstruct Spatiotemporal Evidence

이 논문은 기존 벤치마크가 주로 다루는 추출적 추론을 넘어, MLLM 이 비디오에서 분산된 단서를 통합하고 암시적 구조를 추론하는 '추상적 시공간 추론' 능력을 평가하기 위한 새로운 분류 체계와 VAEX-BENCH 벤치마크를 제안하고, 이를 통해 최신 모델들의 한계와 병목 현상을 분석합니다.

Seunghwan Bang, Hwanjun Song2026-03-16💻 cs

Goal-Oriented Learning at the Edge: Graph Neural Networks Over-the-Air for Blockage Prediction

이 논문은 6G 네트워크의 목표 지향적 학습을 위해 무선 채널을 아날로그 집계 레이어로 활용하는 그래프 신경망 기반의 오버더에어 (Over-the-Air) 프레임워크를 제안하여, 밀리미터파 네트워크의 차단 예측 성능을 유지하면서 통신 오버헤드를 획기적으로 줄인다는 점을 강조합니다.

Lorenzo Mario Amorosa, Zhan Gao, Tony Chahoud + 4 more2026-03-16💻 cs