Surprised by Attention: Predictable Query Dynamics for Time Series Anomaly Detection
이 논문은 다변량 시계열 데이터의 이상을 단순한 진폭 변화가 아닌 채널 간 의존성 변화로 포착하기 위해, 어텐션 쿼리의 예측 가능한 동역학을 활용하여 구조적 의존성 변화와 진폭 수준의 이상을 동시에 감지하는 비지도 학습 기반 AxADAD 모델을 제안하고 그 유효성을 입증합니다.
11392 편의 논문
이 논문은 다변량 시계열 데이터의 이상을 단순한 진폭 변화가 아닌 채널 간 의존성 변화로 포착하기 위해, 어텐션 쿼리의 예측 가능한 동역학을 활용하여 구조적 의존성 변화와 진폭 수준의 이상을 동시에 감지하는 비지도 학습 기반 AxADAD 모델을 제안하고 그 유효성을 입증합니다.
이 논문은 ODRL 정책의 복잡성과 비표준화 문제를 해결하기 위해, 정책의 의미론을 보존하면서 이를 최소 구성 요소로 정규화하여 정책 간 비교를 단순화하는 알고리즘과 방법을 제안합니다.
이 논문은 대규모 언어 모델 기반 멀티 에이전트 시스템의 라우팅 비용과 지연 시간을 줄이고 투명성을 높이기 위해, 의도 추론을 위한 소형 언어 모델, 작업별 페로몬 전문화, 그리고 비동기 업데이트 메커니즘을 결합한 효율적이고 해석 가능한 AMRO-S 프레임워크를 제안합니다.
이 논문은 실시간 비디오 스트리밍 환경에서 지연 시간과 계산 비용을 줄이면서 점진적인 추론이 가능하도록 '시청 - 사고 - 발화' 패러다임과 Reasoning-Compressed Streaming Memory(RCSM) 를 도입한 ThinkStream 프레임워크를 제안합니다.
이 논문은 논리적 엄밀성과 LLM 의 해석 가능성을 결합하여, FTSC 기반의 결정적 정립 생성기 Delta1 과 LLM 을 통합함으로써 의료 및 규제 분야에서 신뢰할 수 있고 설명 가능한 추론을 가능하게 하는 신경-상징적 프레임워크를 제안합니다.
이 논문은 자율주행 레이싱의 시스템 복잡성과 추론 지연을 줄이면서도 성능을 향상시키기 위해, 기본 정책을 점진적으로 약화시켜 최종적으로 독립적인 신경망 정책을 생성하는 새로운 방법인 감쇠 잔차 정책 최적화 (-RPO) 를 제안하고 이를 통해 시뮬레이션 및 실제 로봇 차량에서의 제로샷 전이 성능을 입증했습니다.
이 논문은 인간 주석 데이터에 대한 의존을 제거하고 오프더셸 LLM 을 활용한 최소 베이즈 리스크 (MBR) 기반의 반복적 증류 프레임워크를 제안하여, 생성된 의사레이블만으로 학습된 모델이 인간 주석 기반 모델보다 기계 번역 오류 스패니 검출 성능을 향상시킨다는 것을 보여줍니다.
이 논문은 성별 편향을 억제하고 희귀 병변을 효과적으로 포착하기 위해 성별 적대적 주의 기반 다중 인스턴스 학습 (MIL) 프레임워크를 제안하여, PHAROS-AIF-MIH 워크숍의 공정한 폐질환 진단 챌린지에서 성별 간 균형을 맞춘 CT 기반 다중 질병 분류 성능을 극대화했습니다.
이 논문은 소프트웨어 엔지니어링 대화 기록을 4 가지 필드로 구조화하여 요약하는 '구조적 증류' 기법을 제안함으로써, 토큰 수를 11 배 줄이면서도 검색 성능을 거의 유지하거나 오히려 향상시킬 수 있음을 입증했습니다.
이 논문은 외부 클라우드 리소스의 과잉 할당으로 인한 비효율성을 해결하기 위해 액션 수준의 오케스트레이션과 탄력적 스케줄링을 도입하여 에이전트 강화학습의 리소스 효율성과 학습 속도를 획기적으로 개선한 통합 리소스 관리 시스템 'ARL-Tangram'을 제안합니다.
이 논문은 45,320 개의 실행 가능한 Docker 환경과 13,000 개의 정제된 학습 궤적을 포함하는 대규모 오픈 소스 SWE 에이전트 훈련 프레임워크인 'daVinci-Env (OpenSWE)'를 제안하여, SWE-bench Verified 에서 최첨단 성능을 달성하고 수학 및 과학 분야에서도 뛰어난 일반화 능력을 입증했습니다.
이 논문은 언어 프롬프트, 참조 수술 장면, 조직 affordance 마스크, 2D 도구 팁 궤적이라는 네 가지 경량 신호로 조건부 비디오 확산 모델을 학습하여 현실적이고 시간적으로 일관된 수술 행동 영상을 생성하는 'Surgical Action World (SAW)'를 제안하며, 이를 통해 희귀 수술 행동 데이터 증강 및 수술 시뮬레이션의 정확도를 획기적으로 개선함을 보여줍니다.
이 논문은 자동 분류를 위한 소규모 RGB 이미지 데이터셋 'SortScrews'와 재사용 가능한 수집 스크립트, 그리고 효율적인 분류를 위한 베이스라인 모델을 공개하여 나사의 자동 식별 연구를 지원하고 있습니다.
이 논문은 모델 불일치 상황에서 이미지 보호를 무력화하는 'VAE-Trans'와 'EditorClean'이라는 두 가지 정제 프레임워크를 제안하여, 한 번 정제되면 이미지 보호가 해제되어 자유롭게 편집이 가능해지는 취약점을 규명하고 방어 기법의 견고성 강화 필요성을 강조합니다.
이 논문은 생성형 AI 를 활용한 웹 '바이브 코딩'이 디자인의 동질화를 심화시킬 수 있는 위험을 분석하고, 이를 완화하기 위해 생성 과정에 '생산적인 마찰 (productive friction)'을 도입하여 창작자의 다양성을 보호할 수 있는 프레임워크를 제안합니다.
이 논문은 2 차원 의료 영상 분할을 위해 특수 설계된 아키텍처보다 일반 목적 비전 모델 (GP-VMs) 이 더 우수한 성능과 설명 가능성을 보인다는 것을 다양한 데이터셋을 통한 실증적 연구를 통해 입증했습니다.
이 논문은 10 번째 ABAW 대회에서 제안된 팀 RAS 의 다중 모달 (얼굴, 행동, 음성) 감정 인식 접근법을 소개하며, Qwen3-VL, Mamba, WavLM 등 최신 모델을 활용하여 Aff-Wild2 데이터셋에서 0.658 의 CCC 점수를 달성한 결과를 보고합니다.
이 논문은 검색 광고 입찰 환경에서 관찰되지 않는 경쟁 요인을 키워드 의미, 입찰가 동향, 지리적 구조 등을 통해 추정하여 CPC(클릭당 비용) 예측의 안정성과 정확도를 향상시키는 경쟁 인식형 예측 모델을 제안합니다.
이 논문은 이미지 및 표형 데이터용 기존 방법의 한계를 극복하고, LOMATCE 를 통해 생성된 인스턴스 수준의 설명을 클러스터링하고 대표 인스턴스를 선택하여 시계열 분류 모델의 의사결정 패턴을 포괄하는 전역적 설명을 생성하는 모델 독립적 프레임워크인 L2GTX 를 제안합니다.
이 논문은 광상 탐사를 위한 비지도 지화학 이상 탐사의 재현성과 일반화 문제를 해결하기 위해 다양한 지역과 샘플링 조건을 아우르는 오픈소스 벤치마크 데이터셋 'GeoChemAD'와 자기지도 학습을 활용한 트랜스포머 기반 프레임워크 'GeoChemFormer'를 제안하고, 기존 방법론보다 우수한 성능을 입증했습니다.