Flash-KMeans: Fast and Memory-Efficient Exact K-Means

이 논문은 기존 GPU 구현의 I/O 병목 및 경쟁 문제를 해결하기 위해 FlashAssign 및 정렬 역변경 업데이트 같은 커널 수준의 혁신을 도입하여, cuML 및 FAISS 대비 최대 200 배 이상의 속도로 온라인 kk-means 처리를 가능하게 하는 'Flash-KMeans'를 제안합니다.

Shuo Yang, Haocheng Xi, Yilong Zhao, Muyang Li, Xiaoze Fan, Jintao Zhang, Han Cai, Yujun Lin, Xiuyu Li, Kurt Keutzer, Song Han, Chenfeng Xu, Ion StoicaWed, 11 Ma💻 cs

MO-Playground: Massively Parallelized Multi-Objective Reinforcement Learning for Robotics

이 논문은 기존 MORL 알고리즘의 병렬화 한계를 극복하기 위해 GPU 네이티브 알고리즘인 MORLAX와 가속화된 환경 모음인 MO-Playground 를 제안함으로써, 복잡한 다목적 로봇 제어 문제를 기존 CPU 기반 접근법보다 25~270 배 빠르게 해결하고 우수한 파레토 프론트를 달성하는 방법을 제시합니다.

Neil Janwani, Ellen Novoseller, Vernon J. Lawhern, Maegan TuckerWed, 11 Ma💻 cs

RAE-NWM: Navigation World Model in Dense Visual Representation Space

이 논문은 기존 잠재 공간의 압축으로 인한 정보 손실 문제를 해결하기 위해, DINOv2 의 밀집 시각 표현 공간에서 조건부 확산 트랜스포머와 시간 기반 게이트 모듈을 활용하여 구조적 안정성과 행동 정확도를 향상시킨 새로운 내비게이션 월드 모델 (RAE-NWM) 을 제안합니다.

Mingkun Zhang, Wangtian Shen, Fan Zhang, Haijian Qin, Zihao Pei, Ziyang MengWed, 11 Ma💻 cs

When Detectors Forget Forensics: Blocking Semantic Shortcuts for Generalizable AI-Generated Image Detection

이 논문은 생성형 AI 에 의해 생성된 이미지의 검출 성능을 향상시키기 위해 사전 학습된 의미적 편향을 제거하고 포렌식 증거에 집중하도록 하는 '기하학적 의미 분해 (GSD)' 모듈을 제안하여 다양한 미지의 생성 방식에 대한 일반화 능력을 크게 개선했습니다.

Chao Shuai, Zhenguang Liu, Shaojing Fan, Bin Gong, Weichen Lian, Xiuli Bi, Zhongjie Ba, Kui RenWed, 11 Ma💻 cs

Towards Instance Segmentation with Polygon Detection Transformers

이 논문은 고해상도 입력과 경량 실시간 추론 간의 상충 관계를 해결하기 위해, 밀집 픽셀 예측 대신 극좌표 표현을 통한 희소 정점 회귀로 인스턴스 분할을 재정의한 'Poly-DETR'을 제안하고, 다양한 데이터셋에서 기존 마스크 기반 방법보다 뛰어난 성능과 효율성을 입증합니다.

Jiacheng Sun, Jiaqi Lin, Wenlong Hu, Haoyang Li, Xinghong Zhou, Chenghai Mao, Yan Peng, Xiaomao LiWed, 11 Ma💻 cs

Reasoning-Oriented Programming: Chaining Semantic Gadgets to Jailbreak Large Vision Language Models

이 논문은 Return-Oriented Programming 에서 영감을 얻어, 해로운 의도와는 무관한 benign 한 시각적 요소들을 논리적으로 연결하여 대형 시각 - 언어 모델의 안전 장치를 우회하는 'Reasoning-Oriented Programming'이라는 새로운 공격 패러다임과 이를 자동화하는 프레임워크를 제안합니다.

Quanchen Zou, Moyang Chen, Zonghao Ying, Wenzhuo Xu, Yisong Xiao, Deyue Zhang, Dongdong Yang, Zhao Liu, Xiangzheng ZhangWed, 11 Ma💻 cs

Platooning as a Service (PlaaS): A Sustainable Transportation Framework for Connected and Autonomous Vehicles

이 논문은 카라시 - 쿠 - 터커 조건을 기반으로 스택버그 게임을 적용하여 Platooning as a Service(PlaaS) 플랫폼의 최적 가격 정책과 서비스 계약을 도출하고, 정부 보조금 및 다양한 운영 변수가 플레이어의 효용과 탄소 배출에 미치는 영향을 분석하여 지속 가능한 교통 체계를 제시합니다.

Bhosale Akshay Tanaji, Sayak Roychowdhury, Anand AbrahambWed, 11 Ma💻 cs

Multimodal Graph Representation Learning with Dynamic Information Pathways

이 논문은 이질적인 노드 특징을 가진 멀티모달 그래프 학습의 유연성과 표현력을 향상시키기 위해, 모달리티별 가상 노드를 도입하여 동적 정보 경로를 통해 적응적이고 희소한 메시지 전파를 가능하게 하는 새로운 프레임워크인 DiP 를 제안하고 다양한 벤치마크에서 기존 방법보다 우수한 성능을 입증합니다.

Xiaobin Hong, Mingkai Lin, Xiaoli Wang, Chaoqun Wang, Wenzhong LiWed, 11 Ma💻 cs

Implicit Geometry Representations for Vision-and-Language Navigation from Web Videos

이 논문은 웹 기반 실내 투어 비디오에서 3D 재구성 없이 RGB 프레임으로부터 암시적 기하 표현을 추출하여 시뮬레이터 데이터의 한계를 극복하고, 다양한 벤치마크에서 새로운 최첨단 성능과 강력한 제로샷 내비게이션 능력을 달성하는 대규모 비전 - 언어 내비게이션 프레임워크를 제안합니다.

Mingfei Han, Haihong Hao, Liang Ma, Kamila Zhumakhanova, Ekaterina Radionova, Jingyi Zhang, Xiaojun Chang, Xiaodan Liang, Ivan LaptevWed, 11 Ma💻 cs

On the Online Weighted Non-Crossing Matching Problem

이 논문은 유클리드 평면에서 비교차 제약 조건 하에 온라인으로 도착하는 가중치 점들의 매칭 문제를 연구하여, 결정론적 알고리즘의 한계를 밝히고 무작위화를 통한 상수 경쟁비 달성 가능성, 다양한 변형 문제에 대한 경계, 그리고 최적해를 위한 조언 복잡도 상한을 제시합니다.

Joan Boyar, Shahin Kamali, Kim S. Larsen, Ali Fata Lavasani, Yaqiao Li, Denis PankratovWed, 11 Ma💻 cs

TPIFM: A Task-Aware Model for Evaluating Perceptual Interaction Fluency in Remote AR Collaboration

이 논문은 원격 증강현실 협업에서 작업 특성에 따른 지각적 상호작용 유창성 (PIF) 을 평가하기 위해 자유 에너지 원리를 기반으로 작업 인지 차이를 고려한 TPIFM 모델을 제안하고, 이를 통해 네트워크 제약 하의 적응형 시스템 설계에 기여함을 보여줍니다.

Jiarun Song, Ninghao Wan, Fuzheng Yang, Weisi LinWed, 11 Ma💻 cs

Entangling Like Mycorrhizae: Mixing Realities Through Touch in "FungiSync"

이 논문은 다중 사용자가 증강현실 (MR) 환경에서 손으로 서로 접촉하며 각자의 지각 세계가 균근 네트워크처럼 교차하고 혼합되는 'FungiSync'라는 체험을 통해, 인간 중심적 개인주의를 넘어선 균류적 상호의존성과 관계적 윤리를 신체적으로 체감할 수 있는 새로운 방식을 제시합니다.

Botao Amber Hu, Danlin Huang, Yilan Elan Tao, Xiaobo Aaron Hu, Rem RunGu LinWed, 11 Ma💻 cs

From Ideal to Real: Stable Video Object Removal under Imperfect Conditions

이 논문은 그림자, 급격한 움직임, 결함이 있는 마스크와 같은 현실 세계의 불완전한 조건에서도 안정적인 비디오 객체 제거를 가능하게 하는 세 가지 핵심 설계 (MUSE, DA-Seg, 커리큘럼 2 단계 학습) 를 통해 새로운 최첨단 성능을 달성한 'Stable Video Object Removal (SVOR)' 프레임워크를 제안합니다.

Jiagao Hu, Yuxuan Chen, Fuhao Li, Zepeng Wang, Fei Wang, Daiguo Zhou, Jian LuanWed, 11 Ma💻 cs