Sketch-Guided Stylized Landscape Cinemagraph Synthesis
이 논문은 손으로 그린 스케치를 기반으로 텍스트 프롬프트와 결합하여 스타일화된 풍경의 공간적 요소와 유동적인 움직임 영역을 정밀하게 제어할 수 있는 'Sketch2Cinemagraph' 프레임워크를 제안합니다.
5139 편의 논문
이 논문은 손으로 그린 스케치를 기반으로 텍스트 프롬프트와 결합하여 스타일화된 풍경의 공간적 요소와 유동적인 움직임 영역을 정밀하게 제어할 수 있는 'Sketch2Cinemagraph' 프레임워크를 제안합니다.
이 논문은 비전 기반의 장면 이해를 3D 장면 그래프와 긴밀하게 결합하여 맵의 의미론적 풍부함과 해석 가능성을 높이고, LiDAR 기반 프레임워크와 유사한 성능을 내는 실시간 VSLAM 시스템인 'vS-Graphs'를 제안하며, 기존 최첨단 방법 대비 평균 15.22% 의 정확도 향상을 입증했습니다.
이 논문은 클라우드 네이티브 온라인 서비스 시스템의 복잡한 맥락을 지식 그래프로 표현하고 대형 언어 모델 (LLM) 과의 협력 추론을 통해 자연어 질문을 프롬메테우스 쿼리 언어 (PromQL) 로 자동 변환하는 'PromCopilot' 프레임워크를 제안하여, 수동 쿼리 작성의 어려움을 해소하고 시스템 모니터링 효율성을 향상시키는 최초의 텍스트 - 투 - PromQL 연구를 소개합니다.
이 논문은 전장 슬라이드 이미지 (WSI) 내의 인접 패치 간 공간적 맥락을 활용하여 긍정 쌍을 샘플링하는 새로운 자기지도 학습 전략을 제안함으로써, 기존 증강 기법 대비 5~10% 의 정확도 향상을 이끌어내어 주석 데이터가 부족한 병리 이미지 표현 학습의 성능을 개선합니다.
이 논문은 기존 2 단계 참조 기반 객체 추적 (RBT) 프레임워크의 한계를 극복하기 위해 샘플링 기반 특징 구성과 능동적 대응 모델링을 도입한 'FlexHook'을 제안하여, 단일 단계 방법들을 포괄적으로 능가하는 새로운 성능 기준을 제시합니다.
이 논문은 비전 - 언어 모델의 순차적 학습 중 발생하는 catastrophic forgetting 문제를 해결하기 위해 모델 융합을 기반으로 한 새로운 continual learning 방법론인 ConDU 를 제안하며, 이를 통해 기존 작업들의 평균 성능과 zero-shot 능력을 동시에 향상시킵니다.
이 논문은 체인 구동 방식과 샌드위치 구조의 다리를 적용하여 운동성, 신뢰성, 안전성을 향상시키고 저비용으로 제작 가능한 25kg 급 오픈소스 4족 보행 로봇의 설계와 실험적 분석을 제시합니다.
이 논문은 제한된 수의 비잔틴 결함, 메시지 손실, 무한한 계산 지연, 그리고 인증된 메시지를 고려한 동적 네트워크 환경에서 신뢰할 수 있는 통신의 필요충분조건을 규명하고 이를 만족하는 네트워크 클래스를 제시합니다.
이 논문은 그래프를 선형 시간으로 분해하는 '비순환 연결 (A-C) 트리'를 도입하여 최단 경로 알고리즘의 시간 복잡도를 그래프의 중첩 너비에 따라 개선하고, 특정 그래프 클래스에 대해 선형 시간 알고리즘을 제시합니다.
이 논문은 텍스트 및 이미지 검사의 결정 경계를 제약 조건으로 활용하여 진화적 탐색을 수행하는 '토큰 수준 제약 경계 탐색 (TCBS)' 공격 기법을 제안함으로써, 블랙박스 환경에서도 다양한 텍스트-이미지 생성 모델의 풀체인 방어 체계를 우회하는 데 기존 방법들보다 뛰어난 성능을 보임을 입증합니다.
이 논문은 단일 이미지로부터 일반화 성능과 3D 일관성을 보장하면서도 실시간 구동이 가능한 고품질 3D Gaussian 헤드 아바타를 생성하는 새로운 방법인 SEGA 를 제안합니다.
이 논문은 기존 그래프 워터마킹 평가가 무작위 엣지 변형에 국한되어 있다는 한계를 지적하고, 커뮤니티 구조를 악용한 지능적인 '클러스터 인식 공격'이 무작위 공격보다 훨씬 효과적으로 워터마킹의 소유권 식별 능력을 무력화한다는 사실을 최초로 체계적으로 증명했습니다.
이 논문은 레이블 데이터가 부족한 의료 영역의 문제를 해결하기 위해, 어떤 특징점 검출기에도 독립적으로 작동하는 비지도 학습 기반의 새로운 특징 기술자 학습 방법을 제안하여 기존 지도 학습 방법과 동등한 정밀도로 망막 이미지 정합을 수행할 수 있음을 입증합니다.
이 논문은 의료 영상 분할에서 모델의 과도한 확신을 해결하기 위해 이미지 단위에서 계산 가능한 미분 가능한 평균 보정 손실 (mL1-ACE) 을 제안하고, 이를 통해 보정 오차를 줄이면서 분할 정확도를 유지하는 방법을 제시합니다.
본 논문은 비전 - 언어 모델과 비전 전용 모델의 상호 보완적 강점을 학습 없이 최적 수송 기법을 통해 자동으로 통합하여 다양한 도메인에서 제로샷 분류 성능을 획기적으로 향상시키는 'SOTA' 프레임워크를 제안합니다.
이 논문은 X 의 커뮤니티 노트 시스템이 교차적 지지를 기반으로 작동하는 설계 특성상 양극화된 선거 관련 콘텐츠를 체계적으로 과소 규제하여 선거 과정과 시민 담론에 잠재적 위험을 초래할 수 있음을 13 개국 190 만 건의 데이터를 통해 입증했습니다.
이 논문은 인도 카르나타카 주의 저자원 학교에서 1,043 명의 교사와 23 명의 커리큘럼 전문가를 대상으로 한 대규모 혼합연구를 통해, AI 와 교사의 협업을 통해 커스터마이징된 수업 계획 도구인 'Shiksha Copilot'이 행정 업무 부담을 줄이고 활동 중심 교수법으로의 전환을 촉진했으나, 인력 부족 등 구조적 한계로 인해 포괄적인 교수법 변화에는 제약이 있음을 규명하고 다국어 및 글로벌 사우스 맥락에 적합한 교 중심 EdTech 설계 방향을 제시합니다.
이 논문은 인간 중심의 관점에서 시각 인식 모델의 해석 가능성 (XAI) 을 체계적으로 분류하고 평가 기준을 제시하며, 멀티모달 대형 언어 모델의 해석 가능성과 실제 응용 분야를 탐구하여 향후 연구 방향을 제시합니다.
이 논문은 정적 분석과 실제 실행 관찰을 결합한 하이브리드 방식인 RightTyper 를 통해 기존 자동 타입 추론 방법들의 한계를 극복하고, 27% 의 낮은 런타임 오버헤드로만 정확하고 정밀한 파이썬 타입 어노테이션을 생성하는 기술을 제안합니다.
이 논문은 이탈리아 청취자를 대상으로 한 인터뷰와 감정 텍스트 분석을 통해, 추천 시스템에 대한 비판적 이해 부족과 성별 대표성 인식의 한계를 드러내며, 신뢰할 수 있고 문화적으로 민감한 음악 추천 시스템 설계에 심리사회적 통찰의 통합 필요성을 강조합니다.