UltraStar: Semantic-Aware Star Graph Modeling for Echocardiography Navigation
이 논문은 잡음이 포함된 탐사 궤적 데이터를 효과적으로 활용하기 위해 기존 순차적 모델링을 넘어, 역사적 핵심 프레임을 공간적 앵커로 직접 연결하는 '별도 그래프 (Star Graph)' 구조와 의미 인식 샘플링 전략을 도입한 초음파 심장 촬영 탐침 항법 시스템인 UltraStar 를 제안합니다.
8926 편의 논문
이 논문은 잡음이 포함된 탐사 궤적 데이터를 효과적으로 활용하기 위해 기존 순차적 모델링을 넘어, 역사적 핵심 프레임을 공간적 앵커로 직접 연결하는 '별도 그래프 (Star Graph)' 구조와 의미 인식 샘플링 전략을 도입한 초음파 심장 촬영 탐침 항법 시스템인 UltraStar 를 제안합니다.
이 논문은 기존 도시 환경 중심의 데이터셋 한계를 극복하기 위해 자연 환경에서 2D 및 3D 장면 이해를 위한 대규모 교차 모달 벤치마크인 WildCross 를 제안하고, 이를 통해 시각, 라이다, 교차 모달 위치 인식 및 메트릭 깊이 추정 과제를 평가할 수 있음을 보여줍니다.
이 논문은 LiDAR 기반 추적-by-attention 프레임워크의 높은 누락 오류를 해결하기 위해 '두 번째 기회 할당'과 '트랙 쿼리 드롭아웃'이라는 두 가지 새로운 훈련 전략을 도입하여 기존 추적-by-검출 방법과의 성능 격차를 해소하고 최첨단 성능을 달성한 SCATR 모델을 제안합니다.
이 논문은 데이터 주석과 추가 학습 없이 주시도 (attention maps) 와 행동 기반 관심 영역 (RoI) 을 결합하여 암묵적 추론을 가능하게 함으로써 비전 - 언어 - 행동 (VLA) 모델의 성능과 효율성을 동시에 향상시키는 새로운 프레임워크인 ATA 를 제안합니다.
이 논문은 학습되지 않은 시점에서도 간접 조명을 정확하게 모델링할 수 있도록 물리 기반의 '방사측정 일관성' 제약을 도입하여, 기존 가우시안 기반 역렌더링 방법의 정확도를 높이고 재조명 시 빠른 렌더링 속도를 달성하는 'RadioGS' 프레임워크를 제안합니다.
이 논문은 기존 웹 기반 벤치마크의 한계를 극복하고 개인 앨범의 풍부한 맥락을 반영한 'PhotoBench'를 제안하여, 단순한 시각적 매칭을 넘어 다중 소스 정보 융합과 에이전트 추론이 필요한 개인화된 의도 기반 사진 검색의 새로운 방향성을 제시합니다.
이 논문은 인간과 기계 비전 시스템의 일반화 및 강건성 간의 균형을 분석하기 위해 정보이론적 레이트-왜곡 (Rate-Distortion) 프레임워크를 도입하여, 기존 정확도 지표로는 포착되지 않는 시스템별 고유한 일반화 기하학적 특성을 규명했습니다.
이 논문은 인간 시각 모델을 활용하여 하류 작업 (객체 감지, 분할 등) 의 인식 성능을 극대화하기 위해 태스크 인지형 주의를 갖춘 양분지 네트워크와 태스크 기반 데이터셋을 제안하는 'DTI-UIE'프레임워크를 소개합니다.
본 논문은 이산적이고 선형적인 기존 모드-n 곱의 한계를 극복하기 위해 연속적이고 비선형적인 신경 연산자 기반 모드-n 연산자를 도입하여, 격자 구조 유무와 해상도 차이에 구애받지 않는 복잡한 실세계 데이터를 더 정밀하게 표현하고 근사할 수 있는 '신경 연산자 기반 연속 텐서 함수 표현 (NO-CTR)'을 제안하고 그 우수성을 입증합니다.
이 논문은 일반 VLM 을 고성능 OCR 모델로 전환하기 위해 '기하학 + 의미론' 데이터 팩토리와 3 단계 점진적 학습 전략을 도입한 FireRed-OCR 프레임워크를 제안하고, OmniDocBench 에서 SOTA 성능을 입증했습니다.
이 논문은 30g 미만의 초소형 드론의 엄격한 자원 제약 하에서도 고해상도 3D 장면 재구성이 가능하도록, GAP9 초저전력 MCU 에서 최적화된 'Tiny-DroNeRF' 모델과 이를 여러 드론 간에 분산 학습하는 연방 학습 방식을 결합한 혁신적인 접근법을 제시합니다.
이 논문은 RGB 이미지나 학습 데이터 없이도 이벤트 카메라의 프로펠러 운동 정보를 추출하여 RPM 기반 칼만 필터링을 적용함으로써 드론의 궤적을 정확하고 강건하게 예측하는 방법을 제안합니다.
이 논문은 2D 이미지 잡음 제거 기법인 Field of Junctions 에서 영감을 받아, 학습 데이터 없이도 3D 구조적 특징을 보존하며 저신호대잡음비 (SNR) 환경의 다양한 3D 역문제 (CT, cryo-ET, 라이다 등) 에서 기존 방법보다 우수한 성능을 보이는 새로운 3D Field of Junctions (3D FoJ) 표현을 제안합니다.
이 논문은 가시광선 영역의 풍부한 데이터를 활용하여 생성적 도메인 전이 모델인 조건부 사이클 GAN 믹업 증강 (C2GMA) 기법을 제안함으로써, 데이터 부족으로 어려움을 겪는 합성 개구 레이더 (SAR) 영역의 객체 분류 정확도를 기존 증강 전략보다 크게 향상시켰음을 보여줍니다.
이 논문은 관절 간의 장거리 상호작용을 포착하고 계산 복잡도를 줄이기 위해 동적 분할 합성곱과 적응형 컨텍스트 모델링을 도입한 경량 고해상도 네트워크인 Dite-HRNet 을 제안하여 COCO 및 MPII 데이터셋에서 기존 최첨단 경량 네트워크보다 우수한 성능을 달성함을 보여줍니다.
이 논문은 이동하는 객체와 센서 제약으로 인해 기존 방법이 적용하기 어려운 야외 LiDAR 점구름을 위해 차량 및 인프라 측 데이터를 활용한 협력적 대비 학습과 맥락적 형태 예측을 결합한 CO^3 를 제안하여, 기존 방법보다 우수한 성능과 다양한 센서 및 데이터셋에 대한 전이 능력을 입증합니다.
이 논문은 태양광 패널의 결함을 이진 분류 및 다중 분류 (그림자, 균열, 먼지) 로 구분하여 각각 91.1% 와 88.6% 의 높은 정확도로 탐지하는 효율적인 합성곱 신경망 (CNN) 기반 고장 탐지 방안을 제안합니다.
이 논문은 확산 모델의 시간적 귀납 편향과 활성 뉴런에서 비롯된 선입견 편향을 분석하여, 이를 해결하는 'TDPO-R' 알고리즘을 제안함으로써 보상 과최적화 문제를 효과적으로 완화합니다.
이 논문은 다양한 모바일 카메라의 이미지 신호 처리 (ISP) 학습을 통합하는 'Uni-ISP'를 제안하고, 장치 인식 임베딩과 새로운 학습 방식을 통해 정확도와 적응성을 크게 향상시키며 FiveCam 이라는 대규모 실세계 데이터셋을 구축하여 그 유효성을 입증합니다.
이 논문은 선형 복잡도를 가진 Mamba 를 비전 백본으로 활용하고 훈련 중 컨텍스트 검색을 통해 긍정적 및 부정적 샘플 정보를 추출하여 LLM 기반의 방사선학 보고서 생성 성능을 향상시키는 새로운 프레임워크 R2GenCSR 을 제안합니다.