cs.RO 편의 논문 | Gist.Science

FlowTouch: View-Invariant Visuo-Tactile Prediction

이 논문은 카메라 시점과 센서 설정에 구애받지 않고 시각 정보를 기반으로 접촉 패턴을 예측하여 시뮬레이션과 현실 간의 격차를 해소하고 그립 안정성 예측에 활용 가능한 새로운 모델 'FlowTouch'를 제안합니다.

Seongjin Bien, Carlo Kneissl, Tobias Jülg, Frank Fundel, Thomas Ressler-Antal, Florian Walter, Björn Ommer, Gitta Kutyniok, Wolfram Burgard2026-03-10🤖 cs.LG

Seed2Scale: A Self-Evolving Data Engine for Embodied AI via Small to Large Model Synergy and Multimodal Evaluation

Seed2Scale 는 소량의 시드 데이터에서 시작해 경량 모델이 데이터를 수집하고 대형 모델이 이를 평가하는 이질적 시너지 메커니즘을 통해 embodied AI 의 데이터 병목 현상을 해결하고 모델 붕괴를 방지하며 성능을 131.2% 향상시키는 자기 진화형 데이터 엔진을 제안합니다.

Cong Tai, Zhaoyu Zheng, Haixu Long, Hansheng Wu, Zhengbin Long, Haodong Xiang, Rong Shi, Zhuo Cui, Shizhuang Zhang, Gang Qiu, He Wang, Ruifeng Li, Biao Liu, Zhenzhe Sun, Tao Shen2026-03-10💻 cs

SAIL: Test-Time Scaling for In-Context Imitation Learning with VLM

이 논문은 VLM 기반의 점수 매김과 자동 아카이브를 활용하여 몬테카를로 트리 탐색을 통해 테스트 시간 계산량을 늘림으로써 로봇 모방 학습의 성공률을 크게 향상시키는 'SAIL' 프레임워크를 제안합니다.

Makoto Sato, Yusuke Iwasawa, Yujin Tang, So Kuroki2026-03-10💻 cs

Less is More: Robust Zero-Communication 3D Pursuit-Evasion via Representational Parsimony

이 논문은 통신 지연과 부분 관측성 환경에서 3 차원 추격 - 도주 문제를 해결하기 위해, 불필요한 에이전트 간 정보 채널을 제거하고 국소적 기여도 기반의 신용 할당 기법을 도입함으로써 오히려 시스템의 강건성과 성공률을 향상시킬 수 있음을 보여줍니다.

Jialin Ying, Zhihao Li, Zicheng Dong, Guohua Wu, Yihuan Liao2026-03-10💻 cs

EndoSERV: A Vision-based Endoluminal Robot Navigation System

이 논문은 조직 변형과 랜드마크 부재로 인한 어려움을 극복하기 위해, 실제 이미지와 가상 도메인을 매핑하고 하위 세그먼트별 오도메트리를 추정하는 비전 기반 내강 로봇 항법 시스템인 EndoSERV 를 제안하여 실제 포즈 레이블 없이도 정확한 위치 추정이 가능함을 입증합니다.

Junyang Wu, Fangfang Xie, Minghui Zhang, Hanxiao Zhang, Jiayuan Sun, Yun Gu, Guang-Zhong Yang2026-03-10💻 cs

Hierarchical Multi-Modal Planning for Fixed-Altitude Sparse Target Search and Sampling

이 논문은 산호 군집과 같은 희귀 해저 현상을 효율적으로 탐지하고 샘플링하기 위해, 수직 기동을 배제하고 전역 경로 최적화와 지역적 확률적 추정을 결합한 고정 고도 계층형 다중 모달 계획 프레임워크인 HIMoS 를 제안하고 고충실도 시뮬레이션을 통해 기존 방법보다 우수한 성능을 입증합니다.

Lingpeng Chen, Yuchen Zheng, Apple Pui-Yi Chui, Junfeng Wu, Ziyang Hong2026-03-10💻 cs

PhaForce: Phase-Scheduled Visual-Force Policy Learning with Slow Planning and Fast Correction for Contact-Rich Manipulation

이 논문은 저주파 시각 기반 계획과 고주파 힘 기반 보정을 통합한 위상 기반 시각 - 힘 정책 'PhaForce'를 제안하여, 접촉이 풍부한 조작 작업에서 기존 방법 대비 성공률을 40% 포인트 향상시키고 접촉 품질과 적응성을 크게 개선했음을 보여줍니다.

Mingxin Wang, Zhirun Yue, Renhao Lu, Yizhe Li, Zihan Wang, Guoping Pan, Kangkang Dong, Jun Cheng, Yi Cheng, Houde Liu2026-03-10💻 cs

Perception-Aware Communication-Free Multi-UAV Coordination in the Wild

이 논문은 GNSS 가 불가능한 밀집된 숲과 같은 복잡한 환경에서 통신 없이 onboard 3D LiDAR 와 지향성 센서 기반의 SLAM 및 장애물 탐지를 활용하여 제한된 센서 시야에서도 안전하고 효과적으로 목표 지점까지 이동할 수 있는 새로운 지각 인식형 3D 항법 프레임워크를 제안하고, 이를 다양한 시뮬레이션과 실제 현장 실험을 통해 검증했습니다.

Manuel Boldrer, Michal Kamler, Afzal Ahmad, Martin Saska2026-03-10💻 cs

MoMaStage: Skill-State Graph Guided Planning and Closed-Loop Execution for Long-Horizon Indoor Mobile Manipulation

이 논문은 명시적인 환경 매핑 없이 계층적 기술 라이브러리와 위상 인식 기술 - 상태 그래프를 활용하여 장기적 실내 이동 조작 작업의 논리적 일관성과 실행 견고성을 향상시키는 MoMaStage 프레임워크를 제안합니다.

Chenxu Li, Zixuan Chen, Yetao Li, Jiapeng Xu, Hongyu Ding, Jieqi Shi, Jing Huo, Yang Gao2026-03-10💻 cs

StructBiHOI: Structured Articulation Modeling for Long--Horizon Bimanual Hand--Object Interaction Generation

이 논문은 장기적인 양손 손-물체 상호작용 생성의 안정성과 물리적 타당성을 향상시키기 위해 시간적 관절 계획과 프레임 단위 정제 계층을 분리하고 Mamba 기반 확산 모델을 도입한 StructBiHOI 프레임워크를 제안합니다.

Zhi Wang, Liu Liu, Ruonan Liu, Dan Guo, Meng Wang2026-03-10💻 cs

A Recipe for Stable Offline Multi-agent Reinforcement Learning

이 논문은 오프라인 다중 에이전트 강화학습에서 비선형 가치 분해의 불안정성을 해결하기 위해 스케일 불변 가치 정규화 (SVN) 를 제안하고, 이를 통해 오프라인 MARL 의 안정성을 확보하는 실용적인 레시피를 제시합니다.

Dongsu Lee, Daehee Lee, Amy Zhang2026-03-10🤖 cs.LG

Human-Aware Robot Behaviour in Self-Driving Labs

이 논문은 인간과 로봇이 공유하는 실험실 환경에서 로봇이 단순한 장애물 감지를 넘어 인간 의도를 예측하여 능동적으로 상호작용함으로써 자율 과학 실험실의 효율성을 높이는 AI 기반 지각 방법을 제안합니다.

Satheeshkumar Veeramani, Anna Kisil, Abigail Bentley, Hatem Fakhruldeen, Gabriella Pizzuto, Andrew I. Cooper2026-03-10💻 cs

Tactile Recognition of Both Shapes and Materials with Automatic Feature Optimization-Enabled Meta Learning

이 논문은 데이터 부족과 학습 시간 문제를 해결하기 위해 자동 특징 최적화가 가능한 프로토타입 네트워크 기반 메타러닝 프레임워크 (AFOP-ML) 를 제안하여, 소량의 데이터로도 다양한 물체의 모양과 재질을 높은 정확도로 인식하고 일반화 능력을 입증한 연구입니다.

Hongliang Zhao, Wenhui Yang, Yang Chen, Zhuorui Wang, Baiheng Liu, Longhui Qin2026-03-10💻 cs

FoMo: A Multi-Season Dataset for Robot Navigation in Forêt Montmorency

이 논문은 캐나다 보레알 숲의 계절적 변화 (심한 적설 및 식생 성장 등) 를 포함한 다양한 환경에서 로봇 내비게이션 알고리즘의 견고성을 평가하기 위해 1 년 동안 수집된 다계절형 로봇 데이터셋 'FoMo'를 소개하고, 계절 변화가 최신 국지화 및 매핑 기술에 미치는 심각한 영향을 분석합니다.

Matej Boxan, Gabriel Jeanson, Alexander Krawciw, Effie Daum, Xinyuan Qiao, Sven Lilge, Timothy D. Barfoot, François Pomerleau2026-03-10💻 cs

Adaptive Entropy-Driven Sensor Selection in a Camera-LiDAR Particle Filter for Single-Vessel Tracking

이 논문은 카메라와 LiDAR 의 상호 보완적 특성을 활용하여 정보 이득 (엔트로피 감소) 기반의 적응형 센서 선택 정책을 도입한 파티클 필터 추적기를 제안하고, 키프로스 아이나 나파 마리나에서의 실증 실험을 통해 단일 선박 추적의 정확성과 연속성을 동시에 개선하는 것을 입증했습니다.

Andrei Starodubov, Yaqub Aris Prabowo, Andreas Hadjipieris, Ioannis Kyriakides, Roberto Galeazzi2026-03-10🤖 cs.LG

R2F: Repurposing Ray Frontiers for LLM-free Object Navigation

이 논문은 대규모 언어 모델 (LLM) 없이 레이 프론티어를 방향 조건부 의미 가설로 재해석하여 실시간으로 실행 가능한 제로샷 오픈-보카불러리 객체 내비게이션 프레임워크인 R2F 를 제안하고, 이를 통해 기존 VLM 기반 방법 대비 6 배 빠른 속도로 경쟁력 있는 성능을 달성함을 보여줍니다.

Francesco Argenziano, John Mark Alexis Marcelo, Michele Brienza, Abdel Hakim Drid, Emanuele Musumeci, Daniele Nardi, Domenico D. Bloisi, Vincenzo Suriani2026-03-10💻 cs

LAR-MoE: Latent-Aligned Routing for Mixture of Experts in Robotic Imitation Learning

이 논문은 라벨 없는 데모에서 구조화된 전문가 분리를 가능하게 하는 잠재 공간 정렬 라우팅을 통해 이질적인 작업 역학을 가진 로봇 모방 학습의 성능을 향상시킨 LAR-MoE 프레임워크를 제안합니다.

Ariel Rodriguez, Chenpan Li, Lorenzo Mazza, Rayan Younis, Ortrun Hellig, Sebastian Bodenstedt, Martin Wagner, Stefanie Speidel2026-03-10💻 cs

STRIDE: Structured Lagrangian and Stochastic Residual Dynamics via Flow Matching

이 논문은 불확실한 환경에서 로봇의 예측 정확도와 물리 일관성을 동시에 향상시키기 위해 보존적 강체 역학을 라그랑주 신경망으로 모델링하고 불확실한 상호작용을 조건부 흐름 매칭으로 학습하는 'STRIDE' 프레임워크를 제안합니다.

Prakrut Kotecha, Ganga Nair B, Shishir Kolathaya2026-03-10🤖 cs.LG

3PoinTr: 3D Point Tracks for Robot Manipulation Pretraining from Casual Videos

이 논문은 자연스러운 인간의 일상 영상을 통해 로봇 조작 정책을 사전 학습하기 위해 3D 포인트 트랙을 중간 표현으로 활용하는 '3PoinTr'을 제안하며, 소량의 로봇 시연 데이터로도 다양한 작업에서 강력한 공간 일반화 성능을 달성함을 보여줍니다.

Adam Hung, Bardienus Pieter Duisterhof, Jeffrey Ichnowski2026-03-10💻 cs

The Neural Compass: Probabilistic Relative Feature Fields for Robotic Search

이 논문은 라벨이 없는 관찰 데이터만으로 객체 간 공출현 관계를 학습하는 'ProReFF' 모델을 제안하고, 이를 통해 로봇이 미지의 환경에서 인간 수준의 효율성으로 객체를 탐색할 수 있도록 하는 방법을 제시합니다.

Gabriele Somaschini, Adrian Röfer, Abhinav Valada2026-03-10🤖 cs.LG

← 이전 다음 →