Bilevel Layer-Positioning LoRA for Real Image Dehazing
이 논문은 CLIP 기반의 비지도 텍스트 지시 손실 함수와 네트워크의 핵심 계층을 자동으로 탐색하여 주입하는 이계층 LoRA 전략 (BiLaLoRA) 을 제안함으로써, 레이블 없는 다양한 실제 안개 환경에서 기존 최첨단 방법보다 우수한 성능을 보이는 이미지 dehazing 방법을 제시합니다.
3447 편의 논문
이 논문은 CLIP 기반의 비지도 텍스트 지시 손실 함수와 네트워크의 핵심 계층을 자동으로 탐색하여 주입하는 이계층 LoRA 전략 (BiLaLoRA) 을 제안함으로써, 레이블 없는 다양한 실제 안개 환경에서 기존 최첨단 방법보다 우수한 성능을 보이는 이미지 dehazing 방법을 제시합니다.
이 논문은 강화학습 (RL) 이 고수준의 보행 및 항법 명령을, 모델 예측 제어 (MPC) 가 저수준의 구동 제어를 담당하는 계층적 아키텍처를 제안하여, 도메인 랜덤화 없이 시뮬레이션과 실제 120kg 휴머노이드 로봇 (Centauro) 에서 비주기적 보행 및 다양한 지형에서의 제로샷 이동을 성공적으로 구현했음을 보여줍니다.
이 논문은 원시 오디오를 저장하지 않고 웨어러블 기기의 온디바이스 음성 기반 분석을 통해 병원 의료진 간의 자연스러운 의사소통 패턴을 실시간으로 측정하고, 이를 통해 업무 부하와 스트레스를 이해하여 의료 서비스의 질을 향상시키는 'VoxCare' 시스템을 제안합니다.
이 논문은 희소 입력 조건에서도 고품질의 3D 가우시안 스플래팅 (3DGS) 재구성을 가능하게 하기 위해, 희소 점 구름을 고충실도 이미지로 변환하는 확산 모델과 견고한 모델 피팅을 위한 재구성 전략을 결합한 'S2D'라는 새로운 파이프라인을 제안합니다.
이 논문은 DNS 프로토콜 제약 조건에 기반하여 권한 있는 DNS 응답 선택의 의미론을 공식화하고, 모든 선택 메커니즘이 유한한 정규형과 대수적 구조를 가진다는 것을 증명하여 다양한 시스템 간의 동치성과 표현력을 정밀하게 추론할 수 있는 이론적 틀을 제시합니다.
이 논문은 분산 학습 환경에서 합성곱 신경망 (CNN) 아키텍처가 모델 정확도에 미치는 영향과 계산 효율성에 영향을 주는 요인들을 분석하여, 리소스 집약적인 시나리오에서의 CNN 배포 최적화를 위한 통찰력을 제공합니다.
이 논문은 사전 학습된 모델을 고정시킨 채 혼합 음성과 이전 추정치를 보간하여 생성된 후보들 중 최적의 것을 반복적으로 선택하는 훈련 없는 다단계 추론 방식을 제안하고, 침습적 및 비침습적 지표를 결합한 최적화를 통해 실제 배포에 적합한 목표 화자 추출 성능을 달성함을 보여줍니다.
이 논문은 오라클 구강암 병변 탐지를 위해 싱글톤 패턴과 배치 처리를 적용한 OC-RPAv2 가 기존 방법 대비 60~100 배의 효율성 향상과 0.06 초의 초고속 예측 시간을 달성했음을 보여줍니다.
이 논문은 시각, 언어, 로봇 상태 정보를 다중 모달 잠재 공간에 저장하고 각도 마진 제약을 통해 작업 간 구별성을 유지하는 점진적 조정 메커니즘을 도입하여, 제한된 메모리와 데이터 조건에서도 기존 최첨단 방법보다 뛰어난 성능과 낮은 망각률을 보이는 평생 모방 학습 프레임워크를 제안합니다.
이 논문은 HyperLogLog 스케치를 최적의 공간 효율성으로 압축하면서도 병합 가능성과 업데이트 효율성을 유지하는 새로운 데이터 구조인 '허프먼 버킷 스케치 (HBS)'를 제안하고, 그 이론적 성능과 실용성을 입증합니다.
이 논문은 7,408 건의 대규모 CBCT-보고서 쌍데이터로 학습된 'CBCTRepD' 시스템을 통해 구악 CBCT 판독의 숙련도 격차를 해소하고, 초급부터 고령의 방사선사까지 모든 경력 수준의 의료진이 보고의 완성도와 정확성을 획기적으로 향상시킬 수 있는 실용적인 AI 협업 도구를 제시합니다.
이 논문은 자율 주행 에이전트의 검증 효율성을 높이기 위해 시공간 논리 (LTLf) 로 표현된 형식 명세를 기반으로 다양한 시나리오를 체계적으로 생성하는 프레임워크인 STADA 를 제안하며, 기존 방법 대비 더 높은 커버리지와 적은 시뮬레이션 횟수를 달성함을 보여줍니다.
이 논문은 2-CNF 부울 공식의 최소 불만족 부분집합 (MUS) 을 식별하는 선형 시간 절차를 제시하고, 특정 조건을 만족하는 MUS 의 존재 여부 판별 및 탐색이 다항 시간 내에 가능함을 증명하며, 2-CNF 의 MUS 난이도 지형을 규명하기 위한 향후 연구 방향을 논의합니다.
이 논문은 비디오 품질 평가 (VQA) 와 비디오 분류를 결합한 자기지도학습 기반의 비디오 비전 트랜스포머 (SSL-V3) 를 제안하여, 비디오 품질 저하로 인한 분류 성능 감소를 해결하고 데이터셋의 레이블 부족 문제를 극복하는 새로운 접근법을 제시합니다.
이 논문은 프라이버시 보호와 통신 효율성을 유지하면서 이질적인 다중 센터 3D 심장 MRI 데이터에 대한 기반 모델의 적응을 가능하게 하는, 전역 및 로컬 저랭크 적응 (LoRA) 을 분리하는 새로운 페더러티드 학습 프레임워크인 Med-DualLoRA 를 제안하고 그 유효성을 입증합니다.
이 논문은 저조도 이미지 향상 시 휘도와 색채 간의 불일치 및 색상 분포 불일치 문제를 해결하기 위해 분산 기반 채널 재조정 (VCR) 프레임워크를 제안하고, 이를 통해 기존 방법보다 우수한 성능을 달성함을 보여줍니다.
이 보고서는 2024 년 9 월 피츠버그에서 개최된 '의료 응용을 위한 알고리즘 - 하드웨어 공동 설계' NSF 워크숍의 논의와 네 가지 주요 테마 (원격 의료, 웨어러블/이식형 의학, 가정 및 병원 시스템, 의료 센싱) 를 바탕으로 차세대 의료 기술의 설계 및 전환을 위한 전략적 로드맵과 NSF 에 대한 투자 권고사항을 요약한 것입니다.
이 논문은 다양한 물성의 시료를 병벽에서 긁어내는 과제를 위해 저수준 임피던스 제어와 고수준 강화학습을 결합한 적응형 힘 제어 프레임워크를 제안하며, 시뮬레이션에서 학습된 정책이 실제 로봇 환경에서도 고정된 힘 제어 방식보다 평균 10.9% 더 높은 성능을 입증했습니다.
이 논문은 실패 모드를 실시간으로 감지하고 성능 예측기를 통해 사전 훈련된 확산 정책 (diffusion policy) 을 성공적인 행동 방향으로 유도하는 경량의 'PPGuide' 프레임워크를 제안하여 로봇 조작 작업의 성공률을 향상시킵니다.
이 논문은 비균일 확률로 조인 결과를 표본화하는 '포아송 샘플링' 문제를 해결하기 위해, 조인 결과를 완전히 물리화하지 않고도 무작위 접근이 가능한 인덱스를 구축하여 거의 인스턴스 최적의 성능을 달성하는 알고리즘을 제안하고, 이를 실제 데이터로 실험하여 기존 방법보다 월등히 우수함을 입증했습니다.