Serving Compound Inference Systems on Datacenter GPUs
이 논문은 XR 등 새로운 분야의 복합 추론 시스템을 위해 모델 변형 선택과 GPU 공간 분할을 통해 지연 시간, 정확도, 비용을 동시에 최적화하는 'JigsawServe' 프레임워크를 제안하며, 기존 최선 대비 최대 11.3 배의 서비스 처리량 향상을 입증합니다.
4495 편의 논문
이 논문은 XR 등 새로운 분야의 복합 추론 시스템을 위해 모델 변형 선택과 GPU 공간 분할을 통해 지연 시간, 정확도, 비용을 동시에 최적화하는 'JigsawServe' 프레임워크를 제안하며, 기존 최선 대비 최대 11.3 배의 서비스 처리량 향상을 입증합니다.
이 논문은 CLIP 기반의 전역적 의미 정합과 DINOv3 의 픽셀 단위 인식 간의 간극을 해소하기 위해, 텍스트 입력의 의미 범위에 따라 시각 추상화 수준을 동적으로 조절하는 'Granulon'을 제안하여 다중 세밀도 추론 능력을 획기적으로 향상시키고 할루시네이션을 감소시킨다고 요약할 수 있습니다.
이 논문은 임의의 거리 공간에 있는 시계열 데이터 매칭을 위해 헬링거 커널을 스트레칭 패널티로 사용하는 '탄성 시간 왜곡 (Elastic Time Warping)' 알고리즘을 제안하며, 이는 의 계산 복잡도를 가집니다.
이 논문은 3D 가우스 스플래팅 (3D Gaussian Splatting) 표현에 내재된 'Trio-Experts'와 'SBAG' 모듈을 활용하여 워터마크의 위치와 품질 보전을 분리하고, 채널별 그룹 마스크를 통해 왜곡에 강인하면서도 고화질을 유지하며 워터마크 선택의 근거를 설명 가능한 3D 워터밍킹 프레임워크를 제안합니다.
이 논문은 사회적 로봇의 지시적 시선 (deictic gaze) 이 일상 생활 보조에 활용될 때 노년층과 청년층 간의 사회적 지각 차이를 분석하여, 연령별 적응형 비언어적 신호 설계에 기여할 수 있는 방안을 모색합니다.
이 논문은 계획과 반성 학습 간의 최적화 비대칭성을 해결하기 위해 반성 강화 학습 (RPCO) 방법론을 도입하여, 기존 벤치마크와 제안한 VCR-bench 에서 Gemini2.5 Pro 를 능가하는 성능을 보이는 'VisionCreator-R1'이라는 반성 강화형 네이티브 시각 생성 에이전트를 제안합니다.
이 논문은 의료용 시각 - 언어 모델 기반의 계층적 마사지 로봇 프레임워크를 제안하고, 이를 평가하기 위한 대규모 멀티모달 데이터셋 MedMassage-12K 와 벤치마크를 구축하여 실증 실험을 통해 그 유효성을 입증했습니다.
이 논문은 HCI 와 노화 연구 간 협력의 진입 장벽과 단절을 지적하고, 저자들이 요양 시설 자원봉사를 통해 노인 세대에 대한 공감과 이해를 심화시킨 성찰적 여정을 다룹니다.
이 연구는 로봇의 다양한 실패 유형이 인간이 인지하는 신뢰도에 미치는 영향을 분석한 결과, 조작 실수나 정지보다 잘못된 객체 선택이나 목표 설정 같은 '실수'가 신뢰도에 덜 치명적이며, 그 후의 성공적인 수행이 신뢰 회복에 효과적임을 규명했습니다.
이 논문은 존재 변수 개수 에 대한 QBF 문제의 이중 지수적 시간 복잡도 하한이 ETH 가정 하에 최적임을 증명하고, 두 개의 양화자 블록으로 제한된 경우의 효율적인 알고리즘과 하한을 제시합니다.
이 논문은 YOLOv8 객체 감지 모델과 역투영 매핑 (IPM) 기술을 활용하여 4 개의 카메라 뷰를 통합하고 3D 공간으로 시각화함으로써 기존 센서 기반 시스템의 한계를 극복하고 비용 효율적인 스마트 주차 할당 시스템을 제안합니다.
이 논문은 수평적 연동 환경에서 이질적인 데이터 분포를 고려하여 기존 방법들의 한계를 극복하고 중앙집중식 합성과 유사한 유틸리티를 달성하는 최초의 차분 프라이버시 기반 표본 데이터 생성 프레임워크인 HeteroFedSyn 을 제안합니다.
이 논문은 고도 정밀 시각 기반 위치 추정 기술과 에이전트 아키텍처를 결합한 'NaviNote'를 개발하여, 시각 장애인들이 환경을 정확하게 탐색하고 음성으로 공간 주석을 작성할 수 있도록 지원하며, 이를 통해 기존 GPS 기반 시스템의 한계를 극복하고 내비게이션 성능을 크게 향상시켰음을 보여줍니다.
이 연구는 393 명을 대상으로 한 실험을 통해 LLM 접근 시점 (초기/중반/후기/무접근) 과 시간 여유 여부에 따라 비판적 사고의 결과가 역전될 수 있음을 규명하며, 시간 제약이 LLM 이 인지 능력을 증진시키는지 저해하는지를 결정하는 핵심 요소임을 강조합니다.
HECTOR 는 정적 이미지와 동적 비디오를 혼용하여 참조하고 각 객체의 궤적을 명시적으로 지정함으로써 복잡한 시공간 제약을 충족하는 고품질 비디오 생성을 가능하게 하는 하이브리드 편집 가능 구성 객체 참조 프레임워크입니다.
이 논문은 스마트 미터와 같은 센서 네트워크 데이터의 프라이버시를 보호하기 위해 중앙 집중식 신뢰를 최소화하고 경량화된 조정을 통해 분산형 z-익명성 (deZent) 을 구현하여 중앙 서버로의 통신 오버헤드를 줄이면서도 동등한 성능을 달성하는 방법을 제시합니다.
이 논문은 난기류 환경에서 UAV 의 외란을 효과적으로 거부하기 위해 희소 비선형 동역학 식별 (SINDy) 과 재귀 최소제곱 (RLS) 적응 제어를 통합한 'Adaptive SINDy'를 제안하고, 실제 비행 실험을 통해 기존 PID 및 INDI 제어기보다 우수한 궤적 추적 성능을 입증했습니다.
이 논문은 SQL 과 AI/ML 연산이 혼합된 하이브리드 쿼리를 위한 최적화 기법을 투명하고 공정한 방식으로 구축, 벤치마크 및 시각화할 수 있는 대화형 워크벤치 'OptBench'를 제안합니다.
이 논문은 2~4 세 유아 26 명을 대상으로 한 실험을 통해 냄새, 촉각, 감정 간의 유의미한 교감각적 대응 관계와 이를 뒷받침하는 연상 전략을 규명하고, 이를 바탕으로 유아 대상 교감각 기술 설계 가이드라인과 연구 방법을 제시합니다.
이 논문은 노름 하에서 점 집합 간의 최소 하우스도르프 거리를 계산하는 문제에서 차원, 방향성 (지향성/비지향성), 그리고 연속성/이산성 간의 복잡한 상호작용을 정밀한 복잡도 분석을 통해 규명하고, 각 변형에 대한 새로운 상한 및 하한을 제시합니다.