VIRD: View-Invariant Representation through Dual-Axis Transformation for Cross-View Pose Estimation

이 논문은 지상 및 위성 이미지 간의 시점 차이를 극적으로 줄이기 위해 극좌표 변환과 컨텍스트 강화 위치 어텐션을 결합한 'VIRD'라는 새로운 교차 시점 포즈 추정 방법을 제안하고, KITTI 및 VIGOR 데이터셋에서 기존 최첨단 방법보다 훨씬 높은 정확도를 입증했습니다.

Juhye Park, Wooju Lee, Dasol Hong + 4 more2026-03-16💻 cs

Can Fairness Be Prompted? Prompt-Based Debiasing Strategies in High-Stakes Recommendations

이 논문은 고위험 추천 시스템에서 대규모 언어 모델 (LLM) 의 편향을 완화하기 위해 모델 가중치 접근 없이도 적용 가능한 경량 프롬프트 기반 편향 제거 전략을 제안하며, 실험을 통해 제안된 방법이 추천 효과성을 유지하면서 공정성을 최대 74% 까지 향상시킬 수 있음을 입증했습니다.

Mihaela Rotar, Theresia Veronika Rampisela, Maria Maistro2026-03-16💻 cs

RoboStream: Weaving Spatio-Temporal Reasoning with Memory in Vision-Language Models for Robotics

이 논문은 비전 - 언어 모델 기반 로봇 계획이 장기 작업 수행 시 공간 - 시간적 추론과 인과적 기억 부재로 인한 실패를 겪는 문제를 해결하기 위해, 추가 학습 없이 3D 기하학적 속성을 시각 증거에 결합하는 '공간 - 시간 융합 토큰'과 행동 유발 상태 전이를 기록하는 '인과적 공간 - 시간 그래프'를 도입한 RoboStream 프레임워크를 제안하고, 이를 통해 장기 작업 및 실제 환경에서의 성능을 획기적으로 개선했음을 보여줍니다.

Yuzhi Huang, Jie Wu, Weijue Bu + 9 more2026-03-16💻 cs

Coordinated Manipulation of Hybrid Deformable-Rigid Objects in Constrained Environments

이 논문은 변형 가능한 선형 요소와 강체 요소로 구성된 하이브리드 물체를 제약된 환경에서 조작하기 위해 변형률 기반 코세라 막대 모델을 활용한 최적화 기반 계획 알고리즘을 제안하고, 이를 통해 기존 방법 대비 계산 속도를 획기적으로 향상시키며 시뮬레이션 및 실증 실험을 통해 그 유효성을 입증했습니다.

Anees Peringal, Anup Teejo Mathew, Panagiotis liatsis + 1 more2026-03-16💻 cs

Language-Grounded Decoupled Action Representation for Robotic Manipulation

이 논문은 고수준의 언어 이해와 저수준의 로봇 제어 간의 간극을 해소하기 위해 번역, 회전, 그리퍼 제어라는 세 가지 해석 가능한 행동 원시 (primitives) 를 중간 계층으로 도입하고, 의미 기반 소프트 라벨 대비 학습 및 적응형 가중치 전략을 통해 새로운 작업에 대한 강력한 일반화 성능을 달성하는 'LaDA' 프레임워크를 제안합니다.

Wuding Weng, Tongshu Wu, Liucheng Chen + 5 more2026-03-16💻 cs

Route Fragmentation Based on Resource-centric Prioritisation for Efficient Multi-Robot Path Planning in Agricultural Environments

이 논문은 농업 환경의 공간적 병목 현상을 해결하기 위해 자원 중심 우선순위 기반 경로 분할 전략을 도입한 새로운 다중 로봇 경로 계획 알고리즘을 제안하고, 기존 방법 대비 작업 처리량을 크게 향상시켰음을 시뮬레이션을 통해 입증합니다.

James R. Heselden, Gautham P. Das2026-03-16💻 cs

A Closed-Form Solution for Debiasing Vision-Language Models with Utility Guarantees Across Modalities and Tasks

이 논문은 학습 데이터에서 파생된 편향을 교정하면서도 모델의 유용성을 이론적으로 보장하는 폐형식 (closed-form) 해법을 제시하여, 주석 데이터 없이 시각 및 텍스트 모달리티의 교차적 편향을 제거하고 다양한 다운스트림 작업에서 편향 완화와 성능 유지 간의 최적 균형을 달성하는 훈련 없는 방법을 제안합니다.

Tangzheng Lian, Guanyu Hu, Yijing Ren + 2 more2026-03-16💻 cs

Before and After ChatGPT: Revisiting AI-Based Dialogue Systems for Emotional Support

이 논문은 2020 년부터 2024 년 5 월까지의 연구를 분석하여, 정서적 지원을 위한 AI 대화 시스템이 과업 특화형 딥러닝 모델에서 대규모 언어 모델 (LLM) 기반 접근법으로 전환됨에 따라 언어적 유연성과 일반화 능력이 향상되었으나 신뢰성과 안전성 문제가 대두되었음을 규명하고 향후 발전 방향을 제시합니다.

Daeun Lee, Dongje Yoo, Migyeong Yang + 3 more2026-03-16💻 cs

Reference-Free Image Quality Assessment for Virtual Try-On via Human Feedback

이 논문은 지상참조 이미지 없이도 인간 지각과 정렬된 가상 의상 착용 (VTON) 이미지 품질 평가를 가능하게 하는 참조 없는 프레임워크 'VTON-IQA'와 대규모 인간 주석 데이터셋 'VTON-QBench'를 제안하고, 이를 통해 14 개의 대표 VTON 모델에 대한 포괄적인 벤치마크 평가를 수행합니다.

Yuki Hirakawa, Takashi Wada, Ryotaro Shimizu + 6 more2026-03-16💻 cs