HECTOR: Hybrid Editable Compositional Object References for Video Generation
HECTOR 는 정적 이미지와 동적 비디오를 혼용하여 참조하고 각 객체의 궤적을 명시적으로 지정함으로써 복잡한 시공간 제약을 충족하는 고품질 비디오 생성을 가능하게 하는 하이브리드 편집 가능 구성 객체 참조 프레임워크입니다.
3462 편의 논문
HECTOR 는 정적 이미지와 동적 비디오를 혼용하여 참조하고 각 객체의 궤적을 명시적으로 지정함으로써 복잡한 시공간 제약을 충족하는 고품질 비디오 생성을 가능하게 하는 하이브리드 편집 가능 구성 객체 참조 프레임워크입니다.
이 논문은 스마트 미터와 같은 센서 네트워크 데이터의 프라이버시를 보호하기 위해 중앙 집중식 신뢰를 최소화하고 경량화된 조정을 통해 분산형 z-익명성 (deZent) 을 구현하여 중앙 서버로의 통신 오버헤드를 줄이면서도 동등한 성능을 달성하는 방법을 제시합니다.
이 논문은 난기류 환경에서 UAV 의 외란을 효과적으로 거부하기 위해 희소 비선형 동역학 식별 (SINDy) 과 재귀 최소제곱 (RLS) 적응 제어를 통합한 'Adaptive SINDy'를 제안하고, 실제 비행 실험을 통해 기존 PID 및 INDI 제어기보다 우수한 궤적 추적 성능을 입증했습니다.
이 논문은 SQL 과 AI/ML 연산이 혼합된 하이브리드 쿼리를 위한 최적화 기법을 투명하고 공정한 방식으로 구축, 벤치마크 및 시각화할 수 있는 대화형 워크벤치 'OptBench'를 제안합니다.
이 논문은 2~4 세 유아 26 명을 대상으로 한 실험을 통해 냄새, 촉각, 감정 간의 유의미한 교감각적 대응 관계와 이를 뒷받침하는 연상 전략을 규명하고, 이를 바탕으로 유아 대상 교감각 기술 설계 가이드라인과 연구 방법을 제시합니다.
이 논문은 노름 하에서 점 집합 간의 최소 하우스도르프 거리를 계산하는 문제에서 차원, 방향성 (지향성/비지향성), 그리고 연속성/이산성 간의 복잡한 상호작용을 정밀한 복잡도 분석을 통해 규명하고, 각 변형에 대한 새로운 상한 및 하한을 제시합니다.
이 논문은 중앙 집중식 대규모 모델의 한계를 극복하기 위해 개인 AI 인스턴스가 생성한 합성 데이터를 공유된 '집단 맥락 필드'를 통해 동기화하고 재생에너지에 적응하는 분산형 AI 아키텍처인 H3LIX 를 제안합니다.
이 논문은 협력적 문제 해결에서 사회적 공유 메타인지 (SSM) 를 지원하기 위해 생성형 AI 를 기반으로 한 그룹 인식 도구의 설계 원칙을 탐색하고, AI 에 대한 과도한 의존을 방지하면서 그룹의 자율적 조절 과정을 촉진하는 방안을 논의합니다.
이 논문은 자율주행용 비전 - 언어 모델 (VLM) 아키텍처가 물리적 패치 공격에 심각한 취약점을 보이며, 다양한 모델 간의 체계적인 비교 평가를 통해 현재 설계가 안전-중요 응용 분야의 적대적 위협을 충분히 처리하지 못함을 입증합니다.
이 논문은 외부 시각적 쿼리를 기반으로 비정제 비디오 내의 모든 대상 객체를 픽셀 단위로 분할하는 새로운 작업인 '시각적 쿼리 분할 (VQS)'을 제안하고, 이를 위한 대규모 벤치마크 VQS-4K 와 SAM 2 를 확장한 고성능 모델 VQ-SAM 을 소개합니다.
이 논문은 생성형 AI 시스템의 과도한 의존을 유발하는 명시적 지시 대신, 집단 인식 도구 (GAT) 를 통해 인지적 갈등을 유발하는 암시적 안내를 제공함으로써 자율적 의미 구성을 촉진하는 생성형 AI 기반 GAT 의 설계 원칙을 제안합니다.
이 논문은 변형 가능한 행성 지형에서의 안전한 탐사를 위해 다리가 지면과 상호작용하여 얻은 고유수용감각 정보를 활용하여 통과 가능 영역을 학습하고, 다목적 최적화를 통해 안전성과 목표 지향성을 균형 있게 고려하는 PSANE 프레임워크를 제안합니다.
이 논문은 외부 인프라 없이도 경량 UAV 가 이동하는 UGV 에 센티미터 정밀도로 자율 착륙 및 추적을 가능하게 하는 완전한 자기장 기반 로컬라이제이션 시스템을 제안하고 실험을 통해 검증합니다.
이 논문은 MLLM 과 LVLM 의 다중 모달 추론 능력을 활용하여 짧은 비디오와 긴 비디오 모두에서 미세 표정 (ME) 을 이해하고 분석하는 두 가지 새로운 과제 (ME-VQA 및 ME-LVQA) 를 포함하는 2026 년 미세 표정 그랜드 챌린지 (MEGC2026) 를 소개합니다.
이 논문은 확산 트랜스포머 (DiT) 의 고해상도 이미지 생성 시 발생하는 구조적 열화 문제를 해결하기 위해, 텍스트 앵커링 메커니즘과 스펙트럼 진행 패턴을 활용한 동적 온도 제어 방식을 도입하여 추가 샘플링 오버헤드 없이 임의의 해상도와 종횡비를 지원하는 훈련 없는 TIDE 방법을 제안합니다.
이 논문은 정수와 부동소수점 숫자를 위한 이진 퀵소트에서 유래한 비비교 기반 정렬 알고리즘 'bsort'를 제안하며, 이는 작은 단어 크기의 데이터 유형에서 시간 복잡도와 보조 공간으로 실행되어 최적화된 하이브리드 알고리즘과 경쟁력 있는 성능을 보입니다.
이 논문은 무작위 순서 스트리밍 모델에서 단위 구간 선택 문제를 해결하여, 기존 적대적 순서 모델의 2/3 근사 한계를 깨고 공간으로 0.7401 의 기대 근사율을 달성하는 알고리즘을 제시하고, 8/9 이상의 근사율 달성을 위해서는 공간이 필요함을 증명합니다.
이 논문은 소프트웨어 공학의 질적 연구에서 생성형 AI(GenAI) 가 만능 해결책이 아니며, 연구 전략과 데이터 특성에 맞게 신중하게 적용해야 함을 강조하며 GenAI 지원 연구의 가능성과 한계를 검토합니다.
이 논문은 외부 힘에 대한 적응 능력을 학습된 잠재 컨텍스트에 조건부로 부여하는 강화학습 프레임워크 'FAME'을 제안하여, 힘/토크 센서 없이도 인간형 로봇의 양손 조작 중 균형 유지 성공률을 크게 향상시키고 실제 Unitree H12 로봇에서 검증한 연구입니다.
이 논문은 가상현실 (VR) 과 증강현실 (AR) 이 언어 학습의 동기 부여와 몰입감을 높이는 기회를 제공하지만, 기술적 한계와 인지 과부하 등의 과제를 안고 있으며, 효과적인 도입을 위해서는 인터페이스 개선, 인지 부하 감소, 인프라 및 교사 연수 강화가 필요함을 두 개의 실증 연구를 통해 제시합니다.