cs 편의 논문 | Gist.Science

Moving Phones, Active Peers: Exploring the Effect of Animated Phones as Facilitators in In-Person Group Discussion

이 논문은 스마트폰을 움직이는 애니메이션으로 변환하여 그룹 토론 중 수동적인 참여자를 다시 활성화하고 그룹 역동성 및 과업 수행을 향상시키는 'AnimaStand' 시스템의 효과와 가능성을 탐구합니다.

Ziqi Pan, Ziqi Liu, Jinhan Zhang, Zeyu Huang, Xiaojuan Ma2026-03-12💻 cs

Multi-Person Pose Estimation Evaluation Using Optimal Transportation and Improved Pose Matching

이 논문은 기존 메트릭의 한계를 극복하고 참양성과 거짓양성 간의 공정한 균형을 위해 검출된 모든 포즈의 신뢰도 점수를 고려하여 최적 수송 이론을 기반으로 한 새로운 평가 지표인 'OCpose'를 제안합니다.

Takato Moriki, Hiromu Taketsugu, Norimichi Ukita2026-03-12💻 cs

Shape Control of a Planar Hyper-Redundant Robot via Hybrid Kinematics-Informed and Learning-based Approach

이 논문은 유연성으로 인한 불안정성을 해결하기 위해 계층적 신경망과 운동학 지식을 결합한 'SpatioCoupledNet'을 제안하여, 기존 분석적 및 순수 데이터 기반 제어기보다 정밀도와 수렴 속도가 뛰어난 초고도 redundant 로봇의 형상 제어 성능을 입증했습니다.

Yuli Song, Wenbo Li, Wenci Xin, Zhiqiang Tang, Daniela Rus, Cecilia Laschi2026-03-12💻 cs

Rethinking Gaussian Trajectory Predictors: Calibrated Uncertainty for Safe Planning

이 논문은 커널 밀도 추정을 활용하여 가우시안 궤적 예측기의 불확실성을 칼리브레이션하는 새로운 손실 함수를 제안함으로써, 자율 주행의 안전한 계획 수립을 위한 신뢰성 있는 확률적 통찰력을 제공합니다.

Fatemeh Cheraghi Pouria, Mahsa Golchoubian, Katherine Driggs-Campbell2026-03-12💻 cs

Motion Forcing: A Decoupled Framework for Robust Video Generation in Motion Dynamics

이 논문은 복잡한 장면에서도 비디오 생성의 시각적 품질, 물리적 일관성, 정밀한 제어라는 삼중 과제를 해결하기 위해 '점-형태-외관' 계층적 패러다임을 통해 물리적 추론과 시각적 합성을 명시적으로 분리하고, 마스킹된 포인트 복구 전략을 통해 모델이 물리 법칙을 학습하도록 하는 '모션 포싱 (Motion Forcing)' 프레임워크를 제안합니다.

Tianshuo Xu, Zhifei Chen, Leyi Wu, Hao Lu, Ying-cong Chen2026-03-12💻 cs

Differentiable Geometric Indexing for End-to-End Generative Retrieval

이 논문은 생성형 검색의 최적화 차단과 기하학적 충돌 문제를 해결하기 위해, 가변적 강제 학습과 대칭 가중치 공유를 통한 연산 통합 및 단위 초구에서의 등방성 기하학적 최적화를 제안하는 '미분 가능 기하학적 인덱싱 (DGI)'을 소개합니다.

Xujing Wang, Yufeng Chen, Boxuan Zhang, Jie Zhao, Chao Wei, Cai Xu, Ziyu Guan, Wei Zhao, Weiru Zhang, Xiaoyi Zeng2026-03-12💻 cs

Frames2Residual: Spatiotemporal Decoupling for Self-Supervised Video Denoising

이 논문은 시공간적 상관관계를 해치지 않으면서 텍스처 손실을 방지하기 위해, 무손실 시간적 일관성 모델링과 비무손실 공간적 텍스처 복원을 명시적으로 분리하는 2 단계 프레임워크인 'Frames2Residual(F2R)'을 제안하여 자기지도 학습 기반 비디오 잡음 제거 성능을 획기적으로 개선합니다.

Mingjie Ji, Zhan Shi, Kailai Zhou, Zixuan Fu, Xun Cao2026-03-12💻 cs

TractoRC: A Unified Probabilistic Learning Framework for Joint Tractography Registration and Clustering

이 논문은 확산 MRI 트라크토그래피 분석에서 서로 다른 작업인 트라크그램 등록과 스트라일라인 클러스터링을 단일 최적화 체계 내에서 결합하여 상호 보완적 정보를 활용하는 통합 확률적 학습 프레임워크 'TractoRC'를 제안하고, 이를 통해 기존 독립적 방법보다 두 작업의 성능을 모두 크게 향상시킨다고 설명합니다.

Yijie Li, Xi Zhu, Junyi Wang, Ye Wu, Lauren J. O'Donnell, Fan Zhang2026-03-12💻 cs

World2Act: Latent Action Post-Training via Skill-Compositional World Models

이 논문은 픽셀 의존성을 줄이고 가변적인 작업 길이에 대응하기 위해 잠재 공간 정렬과 LLM 기반 기술 분해 파이프라인을 도입한 'World2Act' 프레임워크를 제안하여, 시각 - 언어 - 행동 정책의 일반화 성능을 획기적으로 향상시켰음을 보여줍니다.

An Dinh Vuong, Tuan Van Vo, Abdullah Sohail, Haoran Ding, Liang Ma, Xiaodan Liang, Anqing Duan, Ivan Laptev, Ian Reid2026-03-12💻 cs

Reconstructing Bounded Treelength Graphs with Linearithmic Shortest Path Distance Queries

이 논문은 최대 차수와 트리길이가 제한된 연결 그래프의 간선을 재구성하기 위해 결정론적 알고리즘을 사용하여 $O(n \log n)$ 개의 최단 경로 거리 쿼리만으로 충분함을 증명하여 기존 알고리즘의 성능을 $\log n$ 배 개선하고 하한과 일치시킵니다.

Chirag Kaudan (Oregon State University), Amir Nayyeri (Oregon State University)2026-03-12💻 cs

COHORT: Hybrid RL for Collaborative Large DNN Inference on Multi-Robot Systems Under Real-Time Constraints

이 논문은 제약된 환경에서 다중 로봇 간 대규모 DNN 추론을 최적화하기 위해 오프라인 및 온라인 강화학습을 결합한 COHORT 프레임워크를 제안하며, 이를 통해 배터리 소모 감소, GPU 활용도 향상, 그리고 실시간 제약 조건 충족률 증대 효과를 입증했습니다.

Mohammad Saeid Anwar, Anuradha Ravi, Indrajeet Ghosh, Gaurav Shinde, Carl Busart, Nirmalya Roy2026-03-12💻 cs

A Secure Splitting and Acceleration Strategy for TCP/QUIC in Interplanetary Networks

이 논문은 극심한 지연과 손실이 발생하는 행성 간 네트워크 환경에서 기존 TCP/QUIC 의 성능 한계를 극복하기 위해, 암호화된 흐름의 연결 분할을 지원하는 비투명 보안 프록시 (NTSP) 아키텍처를 기반으로 한 보안 전송 가속 전략을 제안하고, 이를 통해 대역폭 활용 효율성과 손실 복구 성능을 크게 향상시킨 것을 보여줍니다.

Jianhao Yu, Ye Li, Qingfang Jiang, Shuai Liu, Wenfeng Li, Kanglian Zhao2026-03-12💻 cs

AsyncMDE: Real-Time Monocular Depth Estimation via Asynchronous Spatial Memory

이 논문은 기초 모델의 고비용 연산을 비동기적으로 분산 처리하여 엣지 디바이스에서도 실시간으로 고품질 단안 깊이 추정이 가능하도록 한 AsyncMDE 시스템을 제안합니다.

Lianjie Ma, Yuquan Li, Bingzheng Jiang, Ziming Zhong, Han Ding, Lijun Zhu2026-03-12💻 cs

KnowDiffuser: A Knowledge-Guided Diffusion Planner with LM Reasoning and Prior-Informed Trajectory Initialization

이 논문은 언어 모델의 의미적 추론 능력과 확산 모델의 생성적 힘을 통합하여 자율주행의 의미-물리 간극을 해소하고, nuPlan 벤치마크에서 기존 계획기보다 우수한 성능을 보이는 'KnowDiffuser'라는 지식 기반 확산 계획 프레임워크를 제안합니다.

Fan Ding, Xuewen Luo, Fengze Yang, Bo Yu, HwaHui Tew, Ganesh Krishnasamy, Junn Yong Loo2026-03-12💻 cs

SignSparK: Efficient Multilingual Sign Language Production via Sparse Keyframe Learning

이 논문은 희소 키프레임 학습과 조건부 흐름 매칭 (CFM) 을 결합하여 자연스럽고 다국어 지원이 가능한 효율적인 수어 생성 프레임워크인 SignSparK 를 제안하며, 기존 방법론의 한계를 극복하고 새로운 최첨단 성능을 달성함을 보여줍니다.

Jianhe Low, Alexandre Symeonidis-Herzig, Maksym Ivashechkin, Ozge Mercanoglu Sincan, Richard Bowden2026-03-12💻 cs

DiT4DiT: Jointly Modeling Video Dynamics and Actions for Generalizable Robot Control

이 논문은 비디오 생성 과정의 중간 특징을 활용하여 비디오 생성과 행동 예측을 통합적으로 학습하는 'DiT4DiT' 모델을 제안함으로써, 기존 VLA 모델 대비 데이터 효율성과 일반화 성능을 획기적으로 개선한 로봇 제어 방식을 제시합니다.

Teli Ma, Jia Zheng, Zifan Wang, Chuili Jiang, Andy Cui, Junwei Liang, Shuo Yang2026-03-12💻 cs

Machinagogy: Experiments in Staging Teaching Dramas with LLMs

이 논문은 헤겔의 인정과 프로이트의 정신역학을 기반으로 한 AI 튜터링 시스템과 '바이브 스칼라십'이라는 반성적 연구 방법론을 통해, 학습자를 자율적 주체로 대우하는 프롬프트가 모델에 관계없이 튜터링 성능을 획기적으로 향상시킨다는 사실을 규명합니다.

Liam Magee2026-03-12💻 cs

LCAMV: High-Accuracy 3D Reconstruction of Color-Varying Objects Using LCA Correction and Minimum-Variance Fusion in Structured Light

이 논문은 단일 프로젝터-카메라 쌍을 사용하여 색상이 변하는 물체의 구조광 3D 재구성을 위해 광학적 측면 색수차를 보정하고 최소 분산 추정 기반의 다채널 위상 데이터를 융합하는 LCAMV 방법을 제안하며, 이를 통해 기존 방식 대비 최대 43.6% 의 깊이 오차 감소를 달성함을 보여줍니다.

Wonbeen Oh, Jae-Sang Hyun2026-03-12💻 cs

SUBTA: A Framework for Supported User-Guided Bimanual Teleoperation in Structured Assembly

이 논문은 학습된 의도 추정, 장면 그래프 작업 계획, 그리고 맥락 의존적 운동 보조를 결합한 양손 조립용 지원 원격 조작 프레임워크인 SUBTA 를 제안하고, 이를 통해 위치 및 방향 정확도를 크게 향상시키고 사용자의 정신적 부하를 줄인다는 것을 사용자 연구를 통해 입증했습니다.

Xiao Liu, Prakash Baskaran, Songpo Li, Simon Manschitz, Wei Ma, Dirk Ruiken, Soshi Iba2026-03-12💻 cs

Learning to Wander: Improving the Global Image Geolocation Ability of LMMs via Actionable Reasoning

이 논문은 3 만 2 천 개 이상의 파노라마로 구성된 행동 기반 지리 위치 추론 벤치마크 'WanderBench'와 시각적 탐색 행동을 통해 불확실성을 줄이는 추론 프레임워크 'GeoAoT'를 제안하여, 대규모 멀티모달 모델의 전 세계 지리 위치 추정 능력을 혁신적으로 향상시켰습니다.

Yushuo Zheng, Huiyu Duan, Zicheng Zhang, Xiaohong Liu, Xiongkuo Min2026-03-12💻 cs

← 이전 다음 →