Tether: Autonomous Functional Play with Correspondence-Driven Trajectory Warping

이 논문은 소수의 시연 데이터와 비전 - 언어 모델의 시각적 이해 능력을 활용하여, 의미론적 특징점 대응을 기반으로 행동을 왜곡하는 오픈 - 루프 정책을 통해 자율적 기능적 놀이를 수행하고 이를 통해 인간 수준의 모방 정책을 학습하는 'Tether'라는 새로운 로봇 학습 방법을 제안합니다.

William Liang, Sam Wang, Hung-Ju Wang + 3 more2026-03-04🤖 cs.AI

How to Peel with a Knife: Aligning Fine-Grained Manipulation with Human Preference

이 논문은 힘 감지 데이터 수집과 모방 학습을 통한 초기 정책 학습, 그리고 정량적 지표와 인간 피드백을 결합한 선호도 기반 미세 조정을 통해, 감자나 오이 등 다양한 과일의 껍질 벗기기 작업에서 90% 이상의 성공률과 뛰어난 일반화 능력을 달성하는 로봇 조작 학습 프레임워크를 제안합니다.

Toru Lin, Shuying Deng, Zhao-Heng Yin + 2 more2026-03-04⚡ eess

Towards Accurate One-Stage Object Detection with AP-Loss

이 논문은 1 스테이지 객체 검출기의 극단적인 클래스 불균형 문제를 해결하기 위해 분류 작업을 랭킹 작업으로 전환하고, 비미분 가능하고 비볼록한 평균 정밀도 손실 (AP-loss) 을 최적화할 수 있는 새로운 알고리즘을 제안하여 네트워크 구조 변경 없이 검출 성능을 획기적으로 향상시켰습니다.

Kean Chen, Jianguo Li, Weiyao Lin + 6 more2026-03-03💻 cs

AP-Loss for Accurate One-Stage Object Detection

이 논문은 원스텝 객체 감지기의 극심한 전경 - 배경 불균형 문제를 해결하기 위해 분류 작업을 랭킹 작업으로 전환하고, 비차분 가능하고 비볼록한 평균 정밀도 손실 (AP-loss) 을 최적화하기 위해 퍼셉트론 학습과 역전파를 결합한 새로운 알고리즘을 제안하여 기존 방법보다 뛰어난 성능을 달성함을 보여줍니다.

Kean Chen, Weiyao Lin, Jianguo Li + 3 more2026-03-03💻 cs

Topological Inductive Bias fosters Multiple Instance Learning in Data-Scarce Scenarios

이 논문은 데이터가 부족한 상황에서 약지도 학습인 다중 인스턴스 학습 (MIL) 의 성능을 향상시키기 위해 인스턴스 분포의 위상적 구조를 보존하는 위상적 유도 편향을 도입한 '위상 유도 MIL(TG-MIL)' 방법을 제안하고, 희귀 질환 분류 등 다양한 시나리오에서 기존 최첨단 모델 대비 평균 2.8%~15.3% 의 성능 개선을 입증했습니다.

Salome Kazeminia, Carsten Marr, Bastian Rieck2026-03-03⚡ eess

Beyond DAGs: A Latent Partial Causal Model for Multimodal Learning

이 논문은 대규모 멀티모달 데이터의 복잡성을 포착하기 위해 DAG 를 넘어선 잠재적 부분 인과 모델을 제안하고, 통계적 식별성을 통해 멀티모달 대비 학습 (MMCL) 이 잠재 변수를 학습한다는 이론적 근거를 제시하여 CLIP 과 같은 사전 훈련 모델의 표현 분리 및 도메인 일반화 능력을 입증합니다.

Yuhang Liu, Zhen Zhang, Dong Gong + 6 more2026-03-03🤖 cs.LG

Towards Precision Cardiovascular Analysis in Zebrafish: The ZACAF Paradigm

이 논문은 기존 지도 학습 기반 방법의 한계를 극복하고 전이 학습, 데이터 증강 및 테스트 시간 증강 기법을 도입하여 다양한 실험 환경과 돌연변이 유형에 적용 가능한 정밀한 제브라피시 심혈관 분석 프레임워크 (ZACAF) 를 개발하고, 이를 통해 심근증 모델인 nrap 돌연변이 제브라피시의 심혈관 기능을 성공적으로 정량화했음을 제시합니다.

Amir Mohammad Naderi, Jennifer G. Casey, Mao-Hsiang Huang + 5 more2026-03-03⚡ eess

FiLo: Zero-Shot Anomaly Detection by Fine-Grained Description and High-Quality Localization

이 논문은 대규모 언어 모델을 활용한 적응형 미세-세분화 설명과 위치 강화 고화질 국소화 기법을 통해 다양한 크기와 형태의 이상을 정밀하게 탐지 및 국소화하는 새로운 제로샷 이상 탐지 방법인 FiLo 를 제안하여 MVTec 및 VisA 데이터셋에서 최첨단 성능을 달성했습니다.

Zhaopeng Gu, Bingke Zhu, Guibo Zhu + 4 more2026-03-03🤖 cs.LG

PO-GUISE+: Pose and object guided transformer token selection for efficient driver action recognition

이 논문은 차량 내성 효율성을 위해 드라이버의 자세와 상호작용 객체 정보를 활용하여 토큰을 선택하는 'POGUISE+'라는 다중 태스크 비전 트랜스포머 모델을 제안함으로써, 기존 방법 대비 연산 비용을 크게 줄이면서도 Drive&Act, 100-Driver, 3MDAD 데이터셋에서 최첨단 성능을 달성했다고 요약할 수 있습니다.

Ricardo Pizarro, Roberto Valle, Rafael Barea + 3 more2026-03-03💻 cs