cs 편의 논문 | Gist.Science

Hierarchical Observe-Orient-Decide-Act Enabled UAV Swarms in Uncertain Environments: Frameworks, Potentials, and Challenges

이 논문은 클라우드-에지-단말 계층에 OODA 루프를 통합하고 네트워크 기능 가상화 (NFV) 기술을 활용하여 동적이고 불확실한 환경에서 UAV 스웜의 적응성과 확장성을 향상시키는 계층적 H-OODA 프레임워크를 제안하고, 자율 의사결정과 협력 제어를 결합한 사례 연구 및 향후 과제 분석을 통해 그 유효성을 검증합니다.

Ziye Jia, Yao Wu, Qihui Wu, Lijun He, Qiuming Zhu, Fuhui Zhou, Zhu Han2026-03-11💻 cs

WESPR: Wind-adaptive Energy-Efficient Safe Perception & Planning for Robust Flight with Quadrotors

이 논문은 지형과 국소 기상 데이터를 통합해 실시간으로 바람장을 예측하고 이를 경로 계획 및 제어에 반영함으로써, 복잡한 환경에서 드론의 비행 안정성과 효율성을 크게 향상시키는 'WESPR' 프레임워크를 제안합니다.

Khuzema Habib, Pranav Deshakulkarni Manjunath, Kasra Torshizi, Troi Williams, Pratap Tokekar2026-03-11💻 cs

Geometry-Aware Metric Learning for Cross-Lingual Few-Shot Sign Language Recognition on Static Hand Keypoints

이 논문은 카메라 시점, 손 크기, 녹화 조건 등의 차이로 인한 도메인 이동 문제를 해결하기 위해, 20 차원 관절 각도 기술자를 기반으로 한 기하학적 인식 메트릭 학습 프레임워크를 제안하여 저자원 환경에서 다양한 수화 언어 간 소수 샷 인식 성능을 획기적으로 향상시켰음을 보여줍니다.

Chayanin Chamachot, Kanokphan Lertniponphan2026-03-11💻 cs

PIM-SHERPA: Software Method for On-device LLM Inference by Resolving PIM Memory Attribute and Layout Inconsistencies

이 논문은 온디바이스 LLM 추론 시 발생하는 PIM 메모리 속성 및 레이아웃 불일치 문제를 해결하여 캐시 가능 영역과 비캐시 가능 영역 간의 모순을 완화하고, DRAM 더블 버퍼링 및 온라인 가중치 재배열 기법을 통해 메모리 용량을 약 48% 절감하면서도 이론적 최대 성능을 유지하는 소프트웨어 전용 방법론인 'PIM-SHERPA'를 제안합니다.

Sunjung Lee, Sanghoon Cha, Hyeonsu Kim, Seungwoo Seo, Yuhwan Ro, Sukhan Lee, Byeongho Kim, Yongjun Park, Kyomin Sohn, Seungwon Lee, Jaehoon Yu2026-03-11💻 cs

TubeMLLM: A Foundation Model for Topology Knowledge Exploration in Vessel-like Anatomy

본 논문은 복잡한 위상적 특성을 가진 혈관 해부학 구조의 모델링 과제를 해결하기 위해, 자연어 프롬프트를 통한 위상적 사전 지식을 시각 표현과 통합한 범용 기반 모델 'TubeMLLM'과 이를 평가하는 새로운 멀티모달 벤치마크 'TubeMData'를 제안하며, 다양한 데이터셋에서 기존 모델 대비 뛰어난 제로샷 일반화 성능과 위상적 일관성을 입증합니다.

Yaoyu Liu, Minghui Zhang, Xin You, Hanxiao Zhang, Yun Gu2026-03-11💻 cs

Distributed Convolutional Neural Networks for Object Recognition

이 논문은 양극성 샘플을 고차원 공간의 컴팩트한 집합으로, 음극성 샘플을 원점으로 매핑하는 새로운 손실 함수를 제안하여 양극성 클래스의 특징만 추출하는 경량 분산 합성곱 신경망 (DisCNN) 을 통해 복잡한 배경 속 객체 탐지 및 미시적 클래스에 대한 우수한 일반화 성능을 입증했습니다.

Liang Sun2026-03-11💻 cs

UniField: A Unified Field-Aware MRI Enhancement Framework

이 논문은 MRI 데이터의 부족과 다양한 자기장 세기 간의 공통된 열화 패턴을 활용하기 위해 사전 훈련된 3D 기반 모델과 자기장 특이적 스펙트럼 보정 메커니즘을 통합한 'UniField'라는 통합 프레임워크를 제안하고, 대규모 공개 데이터셋을 통해 기존 최첨단 방법보다 PSNR 및 SSIM 성능을 획기적으로 향상시켰음을 보여줍니다.

Yiyang Lin, Chenhui Wang, Zhihao Peng, Yixuan Yuan2026-03-11💻 cs

TRIP-Bag: A Portable Teleoperation System for Plug-and-Play Robotic Arms and Leaders

이 논문은 실험실 환경을 벗어나 다양한 곳에서 고품질의 조작 데이터를 수집할 수 있도록, 5 분 이내의 빠른 설정과 직접적인 관절 간 원격 조종이 가능한 휴대용 인형극 스타일 텔레오퍼레이션 시스템 'TRIP-Bag'을 제안하고 그 유효성을 검증합니다.

Noboru Myers, Sankalp Yamsani, Obin Kwon, Joohyung Kim2026-03-11💻 cs

Flash-KMeans: Fast and Memory-Efficient Exact K-Means

이 논문은 기존 GPU 구현의 I/O 병목 및 경쟁 문제를 해결하기 위해 FlashAssign 및 정렬 역변경 업데이트 같은 커널 수준의 혁신을 도입하여, cuML 및 FAISS 대비 최대 200 배 이상의 속도로 온라인 $k$ -means 처리를 가능하게 하는 'Flash-KMeans'를 제안합니다.

Shuo Yang, Haocheng Xi, Yilong Zhao, Muyang Li, Xiaoze Fan, Jintao Zhang, Han Cai, Yujun Lin, Xiuyu Li, Kurt Keutzer, Song Han, Chenfeng Xu, Ion Stoica2026-03-11💻 cs

HelixTrack: Event-Based Tracking and RPM Estimation of Propeller-like Objects

이 논문은 드론 및 회전 기계의 안전을 위해 고속 회전 물체의 미세초 지연 추적이 가능한 새로운 이벤트 기반 방법인 'HelixTrack'을 제안하고, 이를 검증하기 위한 새로운 데이터셋 'TQE'를 소개합니다.

Radim Spetlik, Michal Pliska, Vojtech Vrba, Jiri Matas2026-03-11💻 cs

MO-Playground: Massively Parallelized Multi-Objective Reinforcement Learning for Robotics

이 논문은 기존 MORL 알고리즘의 병렬화 한계를 극복하기 위해 GPU 네이티브 알고리즘인 MORLAX와 가속화된 환경 모음인 MO-Playground 를 제안함으로써, 복잡한 다목적 로봇 제어 문제를 기존 CPU 기반 접근법보다 25~270 배 빠르게 해결하고 우수한 파레토 프론트를 달성하는 방법을 제시합니다.

Neil Janwani, Ellen Novoseller, Vernon J. Lawhern, Maegan Tucker2026-03-11💻 cs

RAE-NWM: Navigation World Model in Dense Visual Representation Space

이 논문은 기존 잠재 공간의 압축으로 인한 정보 손실 문제를 해결하기 위해, DINOv2 의 밀집 시각 표현 공간에서 조건부 확산 트랜스포머와 시간 기반 게이트 모듈을 활용하여 구조적 안정성과 행동 정확도를 향상시킨 새로운 내비게이션 월드 모델 (RAE-NWM) 을 제안합니다.

Mingkun Zhang, Wangtian Shen, Fan Zhang, Haijian Qin, Zihao Pei, Ziyang Meng2026-03-11💻 cs

When Detectors Forget Forensics: Blocking Semantic Shortcuts for Generalizable AI-Generated Image Detection

이 논문은 생성형 AI 에 의해 생성된 이미지의 검출 성능을 향상시키기 위해 사전 학습된 의미적 편향을 제거하고 포렌식 증거에 집중하도록 하는 '기하학적 의미 분해 (GSD)' 모듈을 제안하여 다양한 미지의 생성 방식에 대한 일반화 능력을 크게 개선했습니다.

Chao Shuai, Zhenguang Liu, Shaojing Fan, Bin Gong, Weichen Lian, Xiuli Bi, Zhongjie Ba, Kui Ren2026-03-11💻 cs

Towards Instance Segmentation with Polygon Detection Transformers

이 논문은 고해상도 입력과 경량 실시간 추론 간의 상충 관계를 해결하기 위해, 밀집 픽셀 예측 대신 극좌표 표현을 통한 희소 정점 회귀로 인스턴스 분할을 재정의한 'Poly-DETR'을 제안하고, 다양한 데이터셋에서 기존 마스크 기반 방법보다 뛰어난 성능과 효율성을 입증합니다.

Jiacheng Sun, Jiaqi Lin, Wenlong Hu, Haoyang Li, Xinghong Zhou, Chenghai Mao, Yan Peng, Xiaomao Li2026-03-11💻 cs

Reasoning-Oriented Programming: Chaining Semantic Gadgets to Jailbreak Large Vision Language Models

이 논문은 Return-Oriented Programming 에서 영감을 얻어, 해로운 의도와는 무관한 benign 한 시각적 요소들을 논리적으로 연결하여 대형 시각 - 언어 모델의 안전 장치를 우회하는 'Reasoning-Oriented Programming'이라는 새로운 공격 패러다임과 이를 자동화하는 프레임워크를 제안합니다.

Quanchen Zou, Moyang Chen, Zonghao Ying, Wenzhuo Xu, Yisong Xiao, Deyue Zhang, Dongdong Yang, Zhao Liu, Xiangzheng Zhang2026-03-11💻 cs

Evoking User Memory: Personalizing LLM via Recollection-Familiarity Adaptive Retrieval

이 논문은 인간의 인지 과학에 기반한 '익숙도'와 '회상'의 이중 과정을 모방하여, 사용자의 기억을 효율적이고 정확하게 검색하는 적응형 개인화 LLM 프레임워크인 RF-Mem 을 제안합니다.

Yingyi Zhang, Junyi Li, Wenlin Zhang, Penyue Jia, Xianneng Li, Yichao Wang, Derong Xu, Yi Wen, Huifeng Guo, Yong Liu, Xiangyu Zhao2026-03-11💻 cs

Platooning as a Service (PlaaS): A Sustainable Transportation Framework for Connected and Autonomous Vehicles

이 논문은 카라시 - 쿠 - 터커 조건을 기반으로 스택버그 게임을 적용하여 Platooning as a Service(PlaaS) 플랫폼의 최적 가격 정책과 서비스 계약을 도출하고, 정부 보조금 및 다양한 운영 변수가 플레이어의 효용과 탄소 배출에 미치는 영향을 분석하여 지속 가능한 교통 체계를 제시합니다.

Bhosale Akshay Tanaji, Sayak Roychowdhury, Anand Abrahamb2026-03-11💻 cs

Multimodal Graph Representation Learning with Dynamic Information Pathways

이 논문은 이질적인 노드 특징을 가진 멀티모달 그래프 학습의 유연성과 표현력을 향상시키기 위해, 모달리티별 가상 노드를 도입하여 동적 정보 경로를 통해 적응적이고 희소한 메시지 전파를 가능하게 하는 새로운 프레임워크인 DiP 를 제안하고 다양한 벤치마크에서 기존 방법보다 우수한 성능을 입증합니다.

Xiaobin Hong, Mingkai Lin, Xiaoli Wang, Chaoqun Wang, Wenzhong Li2026-03-11💻 cs

Implicit Geometry Representations for Vision-and-Language Navigation from Web Videos

이 논문은 웹 기반 실내 투어 비디오에서 3D 재구성 없이 RGB 프레임으로부터 암시적 기하 표현을 추출하여 시뮬레이터 데이터의 한계를 극복하고, 다양한 벤치마크에서 새로운 최첨단 성능과 강력한 제로샷 내비게이션 능력을 달성하는 대규모 비전 - 언어 내비게이션 프레임워크를 제안합니다.

Mingfei Han, Haihong Hao, Liang Ma, Kamila Zhumakhanova, Ekaterina Radionova, Jingyi Zhang, Xiaojun Chang, Xiaodan Liang, Ivan Laptev2026-03-11💻 cs

From Perception to Cognition: How Latency Affects Interaction Fluency and Social Presence in VR Conferencing

이 논문은 가상현실 (VR) 회의에서 지연 시간이 사용자 경험에 미치는 영향을 분석하기 위해 전통적인 화상 회의와 비교하여 상호작용의 유창성과 사회적 존재감을 평가하고, 이를 통해 몰입형 가상 환경 최적화를 위한 통찰을 제공합니다.

Jiarun Song, Ninghao Wan, FuZheng Yang, Weisi Lin2026-03-11💻 cs

← 이전 다음 →