Cutting the Cord: System Architecture for Low-Cost, GPU-Accelerated Bimanual Mobile Manipulation

이 논문은 1,300 달러 미만의 비용으로 오픈소스 XLeRobot 을 기반으로 한 고성능 양손 모바일 매니퓰레이터의 기계적 설계, 전원 아키텍처, 그리고 NVIDIA Jetson Orin Nano 를 활용한 온보드 자율성 시스템을 제안하여 연구 및 교육용 저비용 로봇 플랫폼을 제공합니다.

Artemis Shaw, Chen Liu, Justin Costa, Rane Gray, Alina Skowronek, Kevin Diaz, Nam Bui, Nikolaus CorrellWed, 11 Ma💻 cs

Tracing Everyday AI Literacy Discussions at Scale: How Online Creative Communities Make Sense of Generative AI

이 논문은 12 만 개의 레딧 게시물을 대규모로 분석하여 창의적 커뮤니티에서 생성형 AI 리터러시가 전문가 주도의 개념적 접근이 아닌, 도구 활용과 실용적 기술에 초점을 맞춘 역동적이고 실천 중심의 과정으로 자연스럽게 형성됨을 규명했습니다.

Haidan Liu, Poorvi Bhatia, Nicholas Vincent, Parmit ChilanaWed, 11 Ma💻 cs

Intelligent Spatial Estimation for Fire Hazards in Engineering Sites: An Enhanced YOLOv8-Powered Proximity Analysis Framework

이 논문은 9,860 개의 주석 이미지로 학습된 향상된 YOLOv8 기반의 이중 모델 프레임워크를 통해 화재와 연기를 탐지하고 주변 객체와의 거리를 추정하여 정량적 위험 점수를 산출함으로써, 공학 현장의 화재 위험에 대한 지능적인 공간 추정 및 상황 인식 능력을 강화하는 것을 제안합니다.

Ammar K. AlMhdawi, Nonso Nnamoko, Alaa Mashan UbaidWed, 11 Ma💻 cs

3D UAV Trajectory Estimation and Classification from Internet Videos via Language Model

이 논문은 수동 주석 없이 인터넷 비디오에서 언어 기반 데이터 수집, 교차 모달 라벨 생성, 물리 정보 기반 정제를 통해 UAV 의 3D 궤적과 분류 정보를 자동으로 추출하는 새로운 프레임워크를 제안하며, 이를 통해 타겟 도메인 학습 없이도 최첨단 성능에 근접하는 제로샷 전이 성능을 입증했습니다.

Haoxiang Lei, Daotong Wang, Shenghai Yuan, Jianbo SuWed, 11 Ma💻 cs

Provably Safe Trajectory Generation for Manipulators Under Motion and Environmental Uncertainties

이 논문은 불확실성과 비볼록 환경에서 로봇 매니퓰레이터의 안전한 궤적 생성을 위해, RM-DeSKO 모델을 통한 상태 예측과 SOS 프로그래밍 기반의 계층적 충돌 위험 검증을 MPPI 제어기에 통합한 새로운 위험 경계 운동 계획 프레임워크를 제안하고 시뮬레이션 및 실증 실험을 통해 그 유효성을 입증합니다.

Fei Meng, Zijiang Yang, Xinyu Mao, Haobo Liang, Max Q. -H. MengWed, 11 Ma💻 cs

Chain of Event-Centric Causal Thought for Physically Plausible Video Generation

이 논문은 물리 법칙을 준수하는 비디오 생성을 위해 물리 공식으로 제약된 사고 연쇄를 통한 사건 체인 추론과 사건 간 연속성을 보장하는 교차 모달 프롬프팅 모듈을 도입하여, 현실적인 물리 현상의 인과적 진화를 효과적으로 모델링하는 새로운 프레임워크를 제안합니다.

Zixuan Wang, Yixin Hu, Haolan Wang, Feng Chen, Yan Liu, Wen Li, Yinjie LeiWed, 11 Ma💻 cs

MedKCO: Medical Vision-Language Pretraining via Knowledge-Driven Cognitive Orchestration

이 논문은 의료 영상 - 언어 사전학습에서 기존 방법의 인지적 비효율성을 해결하기 위해 진단 민감도와 대표성을 고려한 2 단계 커리큘럼 학습과 비대칭 대비 손실 함수를 도입한 MedKCO 를 제안하며, 이를 통해 다양한 하위 작업에서 기존 베이스라인을 크게 능가하는 성능을 입증했습니다.

Chenran Zhang, Ruiqi Wu, Tao Zhou, Yi ZhouWed, 11 Ma💻 cs

From Verification to Amplification: Auditing Reverse Image Search as Algorithmic Gatekeeping in Visual Misinformation Fact-checking

이 논문은 15 일간 34,486 개의 검색 결과를 분석한 결과, 구글의 역이미지 검색이 시각적 허위정보를 검증하는 과정에서 관련 없는 정보와 반복된 허위정보가 상위를 차지하며 사실 확인 콘텐츠의 가시성이 30% 미만으로 제한되는 등 알고리즘 게이트키핑의 한계를 드러냈음을 규명합니다.

Cong Lin, Yifei Chen, Jiangyue Chen, Yingdan Lu, Yilang Peng, Cuihua ShenWed, 11 Ma💻 cs

AgenticCyOps: Securing Multi-Agentic AI Integration in Enterprise Cyber Operations

이 논문은 LLM 기반 다중 에이전트 시스템의 기업용 사이버 보안 통합을 위해 공격 표면을 체계적으로 분석하고, 도구 오케스트레이션과 메모리 관리를 핵심 신뢰 경계로 삼아 5 가지 방어 원칙을 정립하고 SOC 워크플로우에 적용하여 신뢰 경계를 72% 이상 축소하는 'AgenticCyOps' 프레임워크를 제안합니다.

Shaswata Mitra, Raj Patel, Sudip Mittal, Md Rayhanur Rahman, Shahram RahimiWed, 11 Ma💻 cs

Transformer-Based Multi-Region Segmentation and Radiomic Analysis of HR-pQCT Imaging

이 논문은 SegFormer 기반의 자동화된 다중 영역 분할을 통해 HR-pQCT 이미지에서 골격뿐만 아니라 연부조직까지 포함한 방사선학적 특징을 추출하여 골다공증 진단 정확도를 기존 뼈 기반 모델보다 향상시킨 최초의 연구입니다.

Mohseu Rashid Subah, Mohammed Abdul Gani Zilani, Thomas L. Nickolas, Matthew R. Allen, Stuart J. Warden, Rachel K. SurowiecWed, 11 Ma💻 cs

Agentic AI as a Network Control-Plane Intelligence Layer for Federated Learning over 6G

이 논문은 6G 네트워크 환경에서 분산된 데이터를 기반으로 한 페더러티드 러닝의 지연 시간, 대역폭, 신뢰성 제약을 해결하기 위해, 네트워크 상태와 학습 목표를 인지하여 클라이언트 선정부터 자원 할당 및 코드 생성까지 자동화하는 '에이전트 기반 AI'를 제어 평면 지능 계층으로 제안하고 그 유효성을 입증합니다.

Loc X. Nguyen, Ji Su Yoon, Huy Q. Le, Yu Qiao, Avi Deb Raha, Eui-Nam Huh, Nguyen H. Tran, Choong Seon HongWed, 11 Ma💻 cs