DRIFT: Dual-Representation Inter-Fusion Transformer for Automated Driving Perception with 4D Radar Point Clouds
본 논문은 4D 레이더의 낮은 점군 밀도 문제를 해결하기 위해 국소적 세부 정보와 전역적 맥락 정보를 효과적으로 융합하는 이중 경로 아키텍처 'DRIFT'를 제안하여 객체 감지 및 자유 도로 추정 성능을 크게 향상시켰음을 보여줍니다.
3481 편의 논문
본 논문은 4D 레이더의 낮은 점군 밀도 문제를 해결하기 위해 국소적 세부 정보와 전역적 맥락 정보를 효과적으로 융합하는 이중 경로 아키텍처 'DRIFT'를 제안하여 객체 감지 및 자유 도로 추정 성능을 크게 향상시켰음을 보여줍니다.
이 논문은 시계열적 인과관계를 명시적으로 모델링하여 외과 영상의 자연스러운 언어적 변형에 강인한 질문 응답을 가능하게 하는 새로운 PEFT 방법론인 TemporalDoRA 를 제안하고, 이를 검증하기 위한 새로운 데이터셋 REAL-Colon-VQA 를 공개합니다.
이 논문은 다중 턴 인간-LLM 협업 코드 생성에서 발생하는 '상호작용 냄새 (Interaction Smells)'를 체계적으로 분류하고 분석하여, 전역 불변성 추출과 품질 감사를 통한 다중 에이전트 프레임워크인 InCE 를 제안함으로써 상호작용 품질을 개선하고 작업 성공률을 높이는 방법을 제시합니다.
이 논문은 MRI, CT, PET 와 같은 3 가지 의료 영상 모달리티의 해상도 저하와 모달리티 간 불일치 문제를 해결하기 위해, 웨이블릿 변환을 기반으로 한 조건부 확산 프레임워크인 TriFusion-SR 을 제안하여 융합과 초해상도 (SR) 를 동시에 수행하고 기존 방법 대비 PSNR 을 4.8~12.4% 향상시킨 성능을 입증합니다.
ProGS 는 3D 가우시안 스플래팅 (3DGS) 의 대용량 데이터 저장 및 전송 문제를 해결하기 위해 옥트리 구조를 활용한 점진적 코딩 방식을 도입하여, 파일 크기를 45 배 줄이면서도 렌더링 품질을 10% 이상 향상시킨 스트리밍 친화적 코덱을 제안합니다.
이 논문은 시각적 프롬프트 편집과 조건 주입 모듈을 활용하여 기존 로봇 조작 궤적을 편집함으로써 다양한 물체와 환경에서 제로샷 적응 능력을 향상시키는 '로봇 장면 복제 (Robotic Scene Cloning)' 방법을 제안합니다.
이 논문은 3D 가우스 스플래팅 (3DGS) 의 대용량 데이터 전송 문제를 해결하기 위해, 다중 사용자의 협업 및 역사적 데이터를 기반으로 한 뷰포트 예측 모듈과 심층 강화 학습 기반의 비트레이트 적응 모듈을 통합한 새로운 볼륨 장면 스트리밍 시스템인 'GSStream'을 제안하고 그 우수성을 입증합니다.
이 논문은 전역 시공간 구조를 보존하면서도 효율성을 유지하기 위해 프레임 단위의 행렬 어텐션 메커니즘을 도입한 'FrameDiT'를 제안하여, 기존 확산 트랜스포머 모델의 성능과 효율성 간의 트레이드오프를 해결하고 비디오 생성 분야에서 최첨단 결과를 달성했다고 요약할 수 있습니다.
이 논문은 랭킹의 안정성을 평가하는 새로운 개념인 '국소 안정성 (local stability)'을 제안하고, 이를 효율적으로 계산하기 위한 샘플링 기반 근사 알고리즘과 밀집 영역 탐지 알고리즘을 개발하여 실험을 통해 유효성을 입증했습니다.
이 논문은 일반 제어 흐름 그래프에 적용 가능한 건전하고 효율적인 GSA 기반 멱등성 역 슬라이스 추출 알고리즘을 제안하고, 이를 활용하여 비연속 명령어들을 병합하는 희소 코드 크기 축소 최적화 기법을 통해 특정 벤치마크에서 최대 7.24% 의 코드 크기 감소를 달성함을 보여줍니다.
이 논문은 불확실한 재료 매개변수를 가진 취성 파괴의 확률적 위상장 모델에 센서 데이터를 통합하기 위해 정규화 앙상블 칼만 필터를 제안하며, 이를 통해 관측된 변위 정보를 바탕으로 변위장 및 위상장 상태를 효과적으로 추정하고 모델 일관성을 유지함을 보여줍니다.
이 논문은 대규모 언어 모델 (LLM) 의 추론 인프라 최적화를 위해 Kubernetes 수평 자동 확장 (HPA) 의 한계를 극복하고, 추론 서버의 내부 포화 상태를 고려한 글로벌 최적화 제어 평면인 '작업 부하 변형 자동 확장기 (WVA)'를 제안하며, 이를 통해 처리량을 37% 향상시키고 요청 실패를 10 배 감소시키는 성과를 입증했습니다.
이 논문은 진단, 측정, 분할 및 비디오 스트림 요약 등 다양한 임상 작업을 통합적으로 수행하여 기존 자동화 도구의 한계를 극복하고, 다중 전문가 에이전트 조정을 통해 가장 정확하고 견고한 태아 초음파 분석 및 보고 솔루션을 제시하는 'FetalAgents' 시스템을 제안합니다.
이 논문은 안전-중요 자율 시스템에서 데이터 신선도 제약을 기반으로 작업 오프셋을 조정하여 Just-in-Time 방식으로 데이터를 생산함으로써, LET 패러다임의 인위적 지연과 리소스 비효율성을 제거하면서도 전 세계 EDF 의 100% 스케줄링 용량을 보장하는 새로운 작업 기반 스케줄링 프레임워크를 제안합니다.
이 논문은 다중 모달 대형 언어 모델 기반의 연속 환경 비전 - 언어 내비게이션 (VLN-CE) 에서 발생하는 누적 오류와 희소한 보상 문제를 해결하기 위해, 불완전한 궤적에서 밀집된 감독 신호를 추출하여 단계별 정렬을 수행하는 '단계 인식 대비 정렬 (SACA)' 프레임워크를 제안하고 이를 통해 최첨단 성능을 달성함을 보여줍니다.
이 논문은 산업 환경에서의 인간 행동 이해를 지원하기 위해 실제 산업 현장에서 동기화된 180 개의 자시 (ego) 및 타시 (exo) 시점 비디오와 상세한 주석을 포함한 새로운 데이터셋 'ENIGMA-360'을 제안하고, 이를 기반으로 한 기초 실험을 통해 기존 모델의 한계를 규명했습니다.
이 논문은 시각적 관찰의 모호성을 극복하고 절차 계획의 정확도를 획기적으로 향상시키기 위해, 비전 - 언어 모델을 활용하여 시각 정보를 언어적 표현으로 변환한 후 이를 확산 모델에 적용하는 새로운 '언어 인식 계획 (LAP)' 모델을 제안하고 여러 벤치마크에서 최첨단 성능을 입증했습니다.
이 논문은 제한된 공간 탐사를 위해 비틀림과 축방향 길이 변화를 동시에 구현하는 강체-연성 혼합형 연속체 로봇을 개발하고, 인공 강모 센서를 통해 표면 감지 및 접촉 기반 탐사를 가능하게 하는 시스템을 제안합니다.
이 논문은 두 개의 경로를 격자 위에 동시에 매립할 때 가장 긴 변의 길이를 최소화하는 문제가 NP-난해임을 증명하고, 한 경로가 x-단조적이고 다른 경로가 y-단조적인 경우 격자의 둘레를 시간에 최소화할 수 있음을 보여줍니다.
이 논문은 인간-컴퓨터 상호작용과 인지과학의 교차점에 위치한 상용 비디오 게임을, 실험실 환경의 생태적 타당성 한계를 극복하고 인지 메커니즘을 연구할 수 있는 풍부하고 체계적인 연구 환경으로 활용해야 한다고 주장하며, 이를 위한 프레임워크와 방법론적 제안을 제시합니다.