Automated Quality Check of Sensor Data Annotations
이 논문은 자율주행 열차용 다중 센서 데이터의 품질을 자동으로 검증하여 수동 작업량을 줄이고 시스템 개발을 가속화하는 오픈소스 도구를 제안하며, 9 가지 일반 오류를 탐지하는 데 높은 정밀도를 입증했습니다.
10070 편의 논문
이 논문은 자율주행 열차용 다중 센서 데이터의 품질을 자동으로 검증하여 수동 작업량을 줄이고 시스템 개발을 가속화하는 오픈소스 도구를 제안하며, 9 가지 일반 오류를 탐지하는 데 높은 정밀도를 입증했습니다.
이 논문은 데이터가 부족한 환경에서 비주얼-언어 모델을 활용하여 에너지 성능 증명서 (EPC) 평가를 위한 비용 효율적인 자동화 프레임워크인 '다중 모달 모듈 체인 오브 생각 (MMCoT)'을 제안하고, 영국 주거용 건물 데이터셋을 통해 기존 프롬프팅 방식보다 통계적으로 유의미한 성능 향상을 입증했습니다.
본 논문은 고차원 3D 형상 표현의 학습 난이도와 기존 모델의 모드 붕괴 문제를 해결하기 위해, 확산 모델을 활용해 절단면을 기반으로 내부 구조를 확률적으로 추정하고 이를 통해 배터리나 모터와 같은 내부 부품을 비파괴적으로 추출하는 'VoxelDiffusionCut' 방법을 제안합니다.
이 논문은 고해상도 복원 성능과 낮은 모델 복잡도 사이의 균형을 해결하기 위해, 다중 스케일 공간 적응 어텐션 모듈과 같은 새로운 구성 요소를 도입하여 기존 최첨단 방법보다 뛰어난 성능과 효율성을 보이는 경량 이미지 초해상도 네트워크인 MSAAN 을 제안합니다.
이 논문은 엣지 하드웨어에서 실시간 의료 영상 분할을 가능하게 하기 위해 경량화된 이중 경로 U-Net 아키텍처인 BiSe-UNet 을 제안하고, Kvasir-Seg 데이터셋에서 30 FPS 이상의 처리 속도와 높은 정확도를 달성함을 입증합니다.
이 논문은 GPU 없이도 CPU 에서 고속으로 실행 가능한 NovaLAD 라는 문서 추출 파이프라인을 제안하며, 동시 YOLO 모델과 규칙 기반 그룹화, 선택적 비전 언어 모델을 활용해 DP-Bench 벤치마크에서 상용 및 오픈소스 파서보다 우수한 성능을 달성한 것을 설명합니다.
이 논문은 3D CT 분석을 위해 모델 컨텍스트 프로토콜 (MCP) 을 활용한 에이전트 기반 프레임워크인 CT-Flow 를 제안하고, 이를 통해 임상적 워크플로우를 자동화하며 기존 모델 대비 진단 정확도를 41% 향상시킨 CT-FlowBench 벤치마크를 구축한 연구입니다.
이 논문은 로컬 환경에서 가속화된 토큰화 기술과 에지 증강 인퍼레이션을 결합하여 대규모 비디오 - 언어 모델의 정확도를 유지하면서도 응답 지연을 최대 12.8 배까지 단축하는 'QuickGrasp' 시스템을 제안합니다.
이 논문은 콘크리트 XCT 이미지의 낮은 대비로 인한 레이블 데이터 부족 문제를 해결하기 위해, 슈퍼픽셀 알고리즘과 CNN 의 수용 영역을 결합한 자기 주석 기반 비지도 학습 방법을 제안하고 그 성능을 검증합니다.
이 연구는 321 가지 2 차원 도시 형태 측정치를 기반으로 한 국지 기후대 (LCZ) 예측과 위성 영상과의 융합 방식을 평가한 결과, 도시 형태와 LCZ 간의 관계가 불확실하고 일관성이 부족하여 형태 분석에서 LCZ 프레임워크를 사용할 때 주의가 필요함을 시사합니다.
이 논문은 텍스트-이미지 확산 모델의 훈련 데이터 암기 현상을 해결하기 위해, 프롬프트별 주의를 정교하게 조절하여 원본 훈련 이미지를 재현하지 않으면서도 프롬프트와 일치하는 고품질 이미지를 생성하는 새로운 프레임워크인 'GUARD'를 제안합니다.
이 논문은 메모리 제약이 심한 마이크로컨트롤러 (MCU) 에서도 1MB 미만의 자원으로 제로샷 객체 감지가 가능하도록 비전 - 언어 모델 지식 증류와 마트료시카 임베딩을 활용한 'TinyVLM' 프레임워크를 제안합니다.
이 논문은 제한된 메모리를 가진 마이크로컨트롤러에서 새로운 객체 카테고리를 학습할 수 있는 첫 번째 프레임워크인 '잠재 재현 감지 (LRD)'를 제안하며, 태스크 적응형 압축과 공간적 다양성을 고려한 예시 선택 기법을 통해 기존 이미지 저장 방식보다 훨씬 적은 메모리로 효율적인 지속적 객체 감지를 가능하게 합니다.
이 논문은 작물 유형, 비료 시비 단계, 토양 조건, 기상 역학 등 외부 요인으로 인해 어려운 표적 살포 및 비료 시비 (TSF) 문제를 해결하기 위해 공간적·시간적 변이성을 고려한 신경망 기반 솔루션 TerrAI 를 제안하고, 실제 원격 감지 데이터를 통해 그 유효성을 검증했습니다.
이 논문은 학습 데이터의 암기 현상을 방지하면서도 생성 품질과 프롬프트 정합성을 유지하기 위해, 확산 모델의 역동적 시스템 특성과 도달 가능성 분석을 결합해 메모리화 경로를 회피하는 강화학습 기반의 추론 프레임워크 'RADS'를 제안합니다.
이 논문은 이미지 편집 작업의 목표 지향적 특성을 반영하여, 난이도 기반 자원 할당, 편집 특화 검증, 그리고 의도 정합성 확인을 통한 조기 종료 전략을 도입한 'ADE-CoT' 프레임워크를 제안함으로써 기존 고정 예산 방식 대비 2 배 이상의 속도 향상과 성능 개선을 달성했다고 요약할 수 있습니다.
이 논문은 조직 내 세포와 그 상호작용을 그래프로 모델링하여 효율적인 표현 학습을 가능하게 하는 그래프 기반 자기지도 학습 프레임워크 'GrapHist'를 제안하고, 이를 통해 기존 비전 기반 모델보다 적은 파라미터로 뛰어난 성능을 달성함과 동시에 해당 분야의 첫 대규모 그래프 벤치마크를 공개했습니다.
이 논문은 물리적 타당성과 상호작용 의미론을 동시에 고려하여 3D 인간 - 인간 상호작용을 생성하기 위해, CoTransformer 모듈을 통해 전역 상호작용 맥락과 개별 운동 패턴을 분리하고 대비 학습을 적용한 계층적 잠재 확산 모델 (DHVAE) 을 제안합니다.
이 논문은 3D 가우스 스플래팅을 MRI 재구성에 적용하여 물리 일관성 있는 원시 객체, 신경 잔차 필드, 다중 해상도 점진적 학습을 통해 기존 방법 대비 14 배 빠른 속도와 40.31dB PSNR 의 우수한 화질을 달성한 'M-Gaussian' 프레임워크를 제안합니다.
이 논문은 기계적 메커니즘을 기반으로 한 LoRA 미세조정 기법을 통해 의료 비전 - 언어 모델의 재문장 일관성을 크게 향상시키면서도 정확도를 유지하거나 개선하는 방법을 제시합니다.