cs 편의 논문 | Gist.Science

VocSegMRI: Multimodal Learning for Precise Vocal Tract Segmentation in Real-time MRI

이 논문은 시각, 청각, 음운론적 정보를 통합한 'VocSegMRI'라는 멀티모달 학습 프레임워크를 제안하여 실시간 MRI 기반의 성도 분할 정확도와 견고성을 획기적으로 향상시켰음을 보여줍니다.

Daiqi Liu, Tomás Arias-Vergara, Johannes Enk, Fangxu Xing, Maureen Stone, Jerry L. Prince, Jana Hutter, Andreas Maier, Jonghye Woo, Paula Andrea Pérez-Toro2026-03-11💻 cs

Multi-Quadruped Cooperative Object Transport: Learning Decentralized Pinch-Lift-Move

이 논문은 통신이나 중앙 제어 없이 N 개의 4 족 보행 로봇이 물리적 접촉만으로 비그립형 물체를 집어 올리고 이동하는 분산 협력 수송을 가능하게 하는 계층적 정책 아키텍처와 새로운 보상 설계 기법을 제안합니다.

Bikram Pandit, Aayam Kumar Shrestha, Alan Fern2026-03-11💻 cs

Designing Culturally Aligned AI Systems For Social Good in Non-Western Contexts

이 논문은 비서구 맥락에서 AI 를 사회적 선을 위해 효과적으로 설계하기 위해 언어, 제도, 안전 등 6 가지 핵심 요인과 사회문화적·제도적·기술적 영향력을 고려한 12 가지 가이드라인을 제시합니다.

Deepak Varuvel Dennison, Mohit Jain, Tanuja Ganu, Aditya Vashistha2026-03-11💻 cs

Automated Coral Spawn Monitoring for Reef Restoration: The Coral Spawn and Larvae Imaging Camera System (CSLICS)

이 논문은 대보초와 같은 산호초 생태계의 복원을 위해 인공 부양 및 유생 건강 모니터링에 필수적인 산란 계수 과정을 자동화하여 노동 시간을 획기적으로 단축하고 정확도를 높인 저비용 모듈형 카메라 시스템 'CSLICS'를 제안하고 그 유효성을 입증합니다.

Dorian Tsai, Christopher A. Brunner, Riki Lamont, F. Mikaela Nordborg, Andrea Severati, Java Terry, Karen Jackel, Matthew Dunbabin, Tobias Fischer, Scarlett Raine2026-03-11💻 cs

Learning Encoding-Decoding Direction Pairs to Unveil Concepts of Influence in Deep Vision Networks

이 논문은 딥러닝 모델의 잠재 공간에서 개념의 인코딩과 디코딩을 담당하는 방향 쌍을 비지도 학습으로 복원하여 모델의 블랙박스 성격을 해석 가능하게 만들고 예측 오류 수정 및 반사실 생성 등 다양한 응용이 가능하도록 하는 새로운 방법을 제안합니다.

Alexandros Doumanoglou, Kurt Driessens, Dimitrios Zarpalas2026-03-11💻 cs

LLaVAShield: Safeguarding Multimodal Multi-Turn Dialogues in Vision-Language Models

이 논문은 비전 - 언어 모델의 멀티턴 대화 안전성을 강화하기 위해 새로운 위험 분류 체계와 자동화된 적대적 테스트 프레임워크를 포함한 'MMDS' 데이터셋을 구축하고, 이를 기반으로 사용자 입력과 응답을 실시간으로 감시하는 'LLaVAShield'라는 새로운 안전 보호 메커니즘을 제안합니다.

Guolei Huang, Qinzhi Peng, Gan Xu, Yao Huang, Yuxuan Lu, Yongjun Shen2026-03-11💻 cs

Mapping Historic Urban Footprints in France: Balancing Quality, Scalability and AI Techniques

이 논문은 Scan Histo 역사 지도 (1925-1950 년) 에서 텍스트 및 도로와 같은 복잡한 아티팩트를 효과적으로 제거하기 위해 이중 통과 U-Net 기반 딥러닝 파이프라인을 개발하여 1970 년대 이전 프랑스 전역의 도시 발자국 데이터를 최초로 공개함으로써 장기 도시화 역동성 연구를 위한 기반을 마련했습니다.

Walid Rabehi, Marion Le Texier, Rémi Lemoy2026-03-11💻 cs

Connectivity Maintenance and Recovery for Multi-Robot Motion Planning

이 논문은 장애물이 많은 환경에서 다중 로봇 군집의 연결성을 유지하고 단절된 경우에도 복원할 수 있도록, 베지어 곡선 기반의 MPC-CLF-CBF 알고리즘을 제안하여 실시간 궤적 및 제어 동시 생성과 고차 미분 가능 특성을 통해 성공적인 항해를 보장합니다.

Yutong Wang, Lishuo Pan, Yichun Qu, Tengxiang Wang, Nora Ayanian2026-03-11💻 cs

LARA-Gen: Enabling Continuous Emotion Control for Music Generation Models via Latent Affective Representation Alignment

이 논문은 텍스트 프롬프트의 한계를 극복하고 외부 음악 이해 모델과의 잠재 정서 표현 정렬 (LARA) 을 통해 연속적이고 세밀한 감정 제어가 가능한 음악 생성 프레임워크 'LARA-Gen'을 제안하고, 이를 평가하기 위한 벤치마크와 예측 모델을 구축하여 기존 모델 대비 뛰어난 감정 준수도와 음악 품질을 입증합니다.

Jiahao Mei, Xuenan Xu, Zeyu Xie, Zihao Zheng, Ye Tao, Yue Ding, Mengyue Wu2026-03-11💻 cs

Asset-Centric Metric-Semantic Maps of Indoor Environments

이 논문은 실내 환경의 객체별 메쉬, 카테고리, 포즈를 포함한 정밀한 메트릭-시맨틱 맵을 구축하여 기존 방법론보다 정확도와 속도를 개선하고, 이를 대형 언어 모델 (LLM) 과 결합해 복잡한 추론 및 계획이 가능한 로봇용 표현 방식을 제안합니다.

Christopher D. Hsu, Pratik Chaudhari2026-03-11💻 cs

NaviGait: Navigating Dynamically Feasible Gait Libraries using Deep Reinforcement Learning

이 논문은 궤적 최적화의 구조와 강화 학습의 적응력을 결합하여 보행 라이브러리를 기반으로 한 계층적 프레임워크 'NaviGait'를 제안함으로써, 직관적인 보행 제어와 외부 교란에 대한 강인함을 동시에 달성하고 학습 속도를 향상시키는 방법을 제시합니다.

Neil Janwani, Varun Madabushi, Maegan Tucker2026-03-11💻 cs

BanaServe: Unified KV Cache and Dynamic Module Migration for Balancing Disaggregated LLM Serving in AI Infrastructure

이 논문은 LLM 분해형 서비스의 정적 리소스 할당, 부하 불균형, 그리고 캐시 인식 라우팅으로 인한 병목 현상을 해결하기 위해, 계층별 가중치 및 어텐션 수준 KV 캐시 마이그레이션과 글로벌 캐시 공유를 통해 컴퓨팅 및 메모리 리소스를 동적으로 재조정하는 'BanaServe' 프레임워크를 제안합니다.

Yiyuan He, Minxian Xu, Jingfeng Wu + 7 more2026-03-11💻 cs

Real-Time Neural Video Compression with Unified Intra and Inter Coding

이 논문은 기존 신경망 기반 비디오 압축의 한계를 극복하기 위해 단일 모델로 적응적 인트라/인터 코딩을 수행하고 양방향 중복성을 활용하는 통합 프레임워크를 제안하여, 실시간 성능을 유지하면서 DCVC-RT 대비 평균 12.1% 의 BD-rate 감소를 달성함을 보여줍니다.

Hui Xiang, Yifan Bian, Li Li, Jingran Wu, Xianguo Zhang, Dong Liu2026-03-11💻 cs

Polynomial-time Configuration Generator for Connected Unlabeled Multi-Agent Pathfinding

이 논문은 군집 로봇의 연결성 유지가 필수적인 '연결된 라벨 없는 다중 에이전트 경로 찾기 (CUMAPF)' 문제를 해결하기 위해, 기존 정수 선형 계획법 (ILP) 의 확장성 한계를 극복하고 수백 개의 에이전트로 구성된 문제를 $O(n^2)$ 시간 복잡도로 빠르게 해결하는 완전한 알고리즘 'PULL'을 제안합니다.

Takahiro Suzuki, Keisuke Okumura2026-03-11💻 cs

Revisiting Replanning from Scratch: Real-Time Incremental Planning with Fast Almost-Surely Asymptotically Optimal Planners

이 논문은 변화하는 환경에서 기존 계획을 업데이트하는 대신, 빠른 거의-확률적 점근 최적 (ASAO) 알고리즘을 사용하여 독립적인 문제 해결을 반복함으로써 실시간 재계획을 더 효율적으로 수행할 수 있음을 보여줍니다.

Mitchell E. C. Sabbadini, Andrew H. Liu, Joseph Ruan, Tyler S. Wilson, Zachary Kingston, Jonathan D. Gammell2026-03-11💻 cs

← 이전 다음 →

cs