ReTac-ACT: A State-Gated Vision-Tactile Fusion Transformer for Precision Assembly
이 논문은 시각적 가림이 발생하는 정밀 조립 작업에서 시각 및 촉각 정보를 융합하여 90% 의 성공률을 달성한 ReTac-ACT 라는 새로운 모방 학습 정책을 제안합니다.
3469 편의 논문
이 논문은 시각적 가림이 발생하는 정밀 조립 작업에서 시각 및 촉각 정보를 융합하여 90% 의 성공률을 달성한 ReTac-ACT 라는 새로운 모방 학습 정책을 제안합니다.
이 논문은 원격 탐사 분야에서 기존 방법의 한계를 극복하고 정밀한 시각 - 언어 정렬을 달성하기 위해 다중 세분화 일관성 학습을 도입한 GeoAlignCLIP 프레임워크와 RSFG-100k 데이터셋을 제안하고, 다양한 벤치마크에서 기존 방법보다 우수한 성능을 입증합니다.
이 논문은 100Gb/s WAN 링크를 통해 외부로 데이터를 전송하는 T2_BR_SPRACE 스토리지 프론트엔드의 가상화 아키텍처를 분석하여, 실제 부하 하에서 51.3Gb/s 의 집계 처리량과 페르미랩으로의 단일 데이터 흐름에서 41.5Gb/s 의 피크 속도를 달성한 성능을 입증했습니다.
이 논문은 핀홀 이미지의 단순 합을 넘어 전경 (panorama) 고유의 전체적 공간 및 맥락 관계를 포착하는 '전경 - 언어 모델링 (PLM)' 패러다임을 제안하고, 이를 위해 재학습 없이 기존 모델에 적용 가능한 희소 어텐션 모듈과 악천후 및 사고 등 다양한 전경 시나리오를 포함하는 대규모 데이터셋 'PanoVQA'를 개발하여 전경 기반의 견고한 시각 - 언어 추론을 가능하게 했습니다.
이 논문은 쿼리와 키의 부호만 남기고 비트 연산으로 어텐션을 계산하는 'BinaryAttention'을 제안하여, 학습 가능한 편향과 양자화 인식 훈련을 통해 1 비트 정량화 손실을 보완하고 기존 풀-프레시전 어텐션보다 정확도를 유지하면서 A100 GPU 에서 FlashAttention2 보다 2 배 이상 빠른 속도를 달성했습니다.
본 논문은 저비용 4 족 로봇이 관성 측정 장치와 관절 엔코더 등 고유 감각 센서만을 활용하여 2.5 차원 지형 지도를 생성하고 이를 접촉 및 상태 추정과 통합하여 안전 장벽 함수 (CBF) 기반의 안전 제어 시스템을 구축함으로써, 불규칙한 지형에서도 로봇의 안전한 보행을 보장하는 방법을 제시합니다.
이 논문은 공격자가 MDP 기반으로 행동하는 고급 지속 위협 (APT) 에 대응하여, 공격자의 정보 수준 (Stackelberg, 무지, 확률적 신념) 에 따라 공격 그래프 상에서의 은밀한 침입을 방어하기 위한 게임 이론적 최적 방어 전략을 제시합니다.
이 논문은 다중 로봇 시스템이 여러 장애물이 있는 비볼록 환경에서 효율적으로 영역을 커버할 수 있도록, 일반화된 보로노이 그래프 (GVG) 를 기반으로 하중 균형 알고리즘과 협력적 커버리지 제어를 결합한 새로운 방법을 제안하고 그 수렴성과 성능을 시뮬레이션을 통해 검증했습니다.
이 논문은 유전적 프로그래밍을 기반으로 드리프트와 확산 함수를 최대우도추정으로 공동 최적화하여, 노이즈가 포함된 확률 미분방정식을 기호적으로 발견하고 해석 가능한 과학적 지식을 확장하는 새로운 방법을 제시합니다.
이 논문은 생성형 AI 와 에이전트 도구가 애자일 소프트웨어 개발을 재편하고 있는 시대에, 애자일 실무와 AI 역량을 통합한 프로젝트 기반 AI 엔지니어링 커리큘럼을 제안하고 그 효과와 시사점을 논의합니다.
이 논문은 로지크 구조 플래시 장치에서 작은 객체 워크로드의 쓰기 증폭을 줄이기 위해 해시 충돌 확률을 높여 세트 채움률을 개선하고, 메모리 오버헤드를 줄이는 불룸 필터 기반 인덱싱 및 하이브리드 핫니스 추적을 도입한 'Nemo'라는 새로운 캐시 아키텍처를 제안합니다.
이 논문은 텍스트와 신체 부위의 정렬 부족 및 전체 동작의 비일관성이라는 기존 한계를 극복하기 위해, 부위별 동작 생성과 전체 동작 생성을 통합하는 'ParTY' 프레임워크를 제안하여 텍스트 기반 인간 동작 생성의 표현력과 일관성을 동시에 향상시킨다는 내용입니다.
이 논문은 DINO 비전 트랜스포머의 어텐션 맵을 인간의 주시 패턴과 유사한 시선 이동 (saccade) 전략으로 활용하여 이미지 전체를 처리하지 않고도 핵심 영역에 집중함으로써 분류 성능을 유지하거나 향상시키는 효율적인 이미지 분류 접근법을 제시합니다.
이 논문은 MRI 물리 특성을 반영한 명시적 가우시안 표현과 물리 기반 볼륨 렌더링을 도입하여, 데이터 의존성과 계산 비용을 줄이면서도 고품질의 제로샷 MRI 초해상도를 달성하는 새로운 프레임워크를 제안합니다.
이 논문은 양자화 인식 학습과 지식 증류의 한계를 극복하기 위해 인코더만 증류하는 '디코더 프리 증류'와 가중치 재조정 기법을 도입한 QDR 프레임워크를 제안하여, 엣지 디바이스에서 고품질 이미지 복원 성능과 실시간 처리 속도를 동시에 달성함을 보여줍니다.
이 논문은 저조도 및 저텍스처 환경에서 기존 점 기반 VIO 의 한계를 극복하기 위해, 학습이 필요 없는 선분 디스크립터와 엔트로피 정규화 최적 수송을 활용한 선분 매칭, 그리고 신뢰도 적응적 가중치 기법을 도입하여 강인성과 정확도를 동시에 향상시킨 스테레오 비전 - 관성 오도메트리 (VIO) 시스템 'OTPL-VIO'를 제안합니다.
이 논문은 참여 예산 배분에서 '동등 분배법 (MES)'과 '프라그멘의 순차적 규칙'의 비례성 정도를 이론적으로 분석하고 실험적으로 검증하여, 공리적 보장이 더 강한 MES 도 두 규칙이 정량적 관점에서는 동일한 비례성 정도를 가진다는 사실을 규명했습니다.
이 논문은 비디오 관측을 통해 바람과 물체의 상호작용을 물리 법칙에 기반한 미분 가능한 프레임워크인 DiffWind 로 모델링하여, 3D 가우스 스플래팅과 MPM, LBM 을 활용하여 바람의 힘장을 재구성하고 새로운 바람 조건에서의 시뮬레이션 및 바람 리타게팅을 가능하게 하는 WD-Objects 데이터셋을 포함해 기존 방법보다 뛰어난 정확도와 충실도를 달성함을 제시합니다.
이 논문은 저조도 영역이나 반사 표면과 같은 신뢰할 수 없는 측정값으로 인한 드리프트를 줄이기 위해, 3D 가우스 스플래팅 기반 SLAM 시스템이 각 스플랫의 불확실성을 명시적으로 학습하고 이를 통해 신뢰할 수 있는 영역에 초점을 맞춘 강건한 추론 및 매핑을 가능하게 하는 'VarSplat'을 제안합니다.
이 논문은 부정확한 주석과 제한된 데이터로 인해 기존 방법들이 한계를 보였던 발의 정밀한 3D 모션 재구성을 위해, 2D 발 키포인트를 3D 로 승격시키고 무릎 및 발 모션 맥락을 활용하는 'FootMR'과 복잡한 발 움직임을 평가할 수 있는 새로운 데이터셋 'MOOF'를 제안하여 기존 최첨단 방법보다 발 관절 각도 오차를 최대 30% 까지 줄이는 성과를 거두었다고 요약할 수 있습니다.