TA-GGAD: Testing-time Adaptive Graph Model for Generalist Graph Anomaly Detection
이 논문은 그래프 이상 탐지에서의 도메인 이동 문제를 '이상 비연성 (Anomaly Disassortativity)'으로 정의하고, 이를 해결하여 단일 학습 단계로 다양한 도메인에서 최첨단 성능을 보이는 테스트 시간 적응형 그래프 모델 TA-GGAD 를 제안합니다.
2393 편의 논문
이 논문은 그래프 이상 탐지에서의 도메인 이동 문제를 '이상 비연성 (Anomaly Disassortativity)'으로 정의하고, 이를 해결하여 단일 학습 단계로 다양한 도메인에서 최첨단 성능을 보이는 테스트 시간 적응형 그래프 모델 TA-GGAD 를 제안합니다.
이 논문은 결정 트리나 콕스 회귀와 같은 비미분 가능 임상 모델에도 적용 가능한 차분 프라이버시를 갖춘 영차 최적화 기반 데이터 증류 프레임워크를 제안하여, 민감한 환자 정보를 보호하면서도 임상 예측 모델의 성능을 유지하는 데이터 공유를 가능하게 합니다.
이 논문은 기존 자기지도 학습의 한계를 극복하기 위해 다중 뷰 회전 증강과 균형을 기반으로 한 적대적 미니맥스 게임을 도입한 'M3GCLR' 프레임워크를 제안하여, NTU RGB+D 및 PKU-MMD 데이터셋에서 최첨단 성능을 달성한 뼈 기반 동작 인식 연구를 소개합니다.
이 논문은 제한된 주석과 고해상도 의료 영상 처리의 어려움을 해결하기 위해 프리컴퓨팅된 특징을 활용하고 경량화된 다중 인스턴스 학습 헤드를 결합하여, 대규모 유방 촬영 이미지 분류에서 최상의 성능을 달성하면서도 훈련 복잡성을 획기적으로 줄인 'MIL-PF' 프레임워크를 제안합니다.
이 논문은 오프라인 데이터의 행동 지원 범위 내에서 안전한 온라인 탐색을 보장하면서도 디코더의 재구성 손실로 인한 성능 한계를 우회하기 위해, 저차원 잠재 공간 탐색에서 원시 행동 공간 활용으로 점진적으로 전환하는 커리큘럼 학습 프레임워크인 SPAARS 를 제안하고 그 유효성을 입증합니다.
이 논문은 엔진 소리를 지속된 조화 진동이 아닌 배기 압력 펄스 시퀀스로 간주하고, 물리 정보 기반의 인덕티브 바이어를 통합한 미분 가능한 펄스-트레인-레조네이터 (PTR) 모델을 제안하여 기존 모델 대비 조화 재구성 성능을 21% 향상시키고 물리적 현상에 대응하는 해석 가능한 매개변수를 제공함을 보여줍니다.
이 논문은 2024 년 12 월부터 2025 년 4 월까지 진행된 ICDAR 2025 복잡한 레이아웃 문서 이미지 기계 번역 (DIMT) 경연대회에 대한 개요, 데이터셋, 작업 정의, 평가 프로토콜 및 69 개 팀의 참가 결과를 요약하고, 대규모 모델 접근법이 복잡한 레이아웃 문서 번역을 위한 유망한 패러다임을 제시함을 보여줍니다.
이 논문은 트랜스포머 기반의 확산 모델에 비해 계산 효율성과 훈련 속도가 월등히 뛰어난 'FCDM(Fully Convolutional Diffusion Model)'을 제안하며, 이를 통해 현대적인 합성곱 설계가 효율적인 생성 모델링을 위한 강력한 대안이 될 수 있음을 입증합니다.
이 논문은 다양한 도메인의 문서 레이아웃 분석 (DLA) 에서 발생하는 구조적 차이를 극복하고 일반화 성능을 향상시키기 위해, 도메인 특성에 맞춰 생성된 설명적 지식을 단서로 활용하는 'PromptDLA'라는 새로운 프레임워크를 제안하고 있습니다.
이 논문은 반복적 ODE 적분으로 인한 지연을 해결하고 분포 붕괴를 방지하기 위해, 조건부 흐름 매칭 (CFM) 전문가를 IMLE 기반의 단일 단계 학생 모델로 증류하여 고주파수 실시간 다중 모달 로봇 제어 및 재계획을 가능하게 하는 프레임워크를 제안합니다.
본 논문은 프랑스어 환자 기록을 분석하여 대규모 언어 모델이 성별과 다른 사회적 건강 결정 요인 간의 상호작용을 통해 내재된 성 고정관념을 활용하여 성별 관련 결정을 내린다는 사실을 규명함으로써, 기존 편향 평가 방법의 한계를 보완할 수 있는 새로운 접근을 제시합니다.
이 논문은 불완전한 인식과 진화하는 객체 분류를 가진 실제 환경에서 자동주행 차량을 위해 새로운 객체 클래스가 순차적으로 도입되는 '오픈 월드 모션 예측' 설정을 제안하고, 가짜 라벨링과 비전 - 언어 모델, 그리고 쿼리 특징 분산을 활용한 재샘플링 전략을 통해 기존 클래스의 망각을 방지하면서 새로운 클래스에 적응하는 최초의 엔드 - 투 - 엔드 클래스 증분 모션 예측 프레임워크를 제시합니다.
이 논문은 43 개 고위험 국가의 급성 식량 불안정성을 90 일 ahead 로 예측하는 자동화된 확률 기반 조기 경보 시스템 'CERES'를 소개하며, 이는 다중 데이터 소스를 융합하고 모든 예측을 공개적으로 검증 가능하도록 하는 세계 최초의 개방형 시스템임을 강조합니다.
이 논문은 대규모 언어 모델이 도덕적 추론을 상식적 이해보다 우선시하며, 특히 화자보다 부수적 인물의 상식 모순을 더 잘 감지하는 서사적 편향을 보인다는 점을 CoMoral 벤치마크를 통해 규명하고, 이에 대한 개선의 필요성을 강조합니다.
이 논문은 EU AI 법규 준수를 위한 NLP 및 RAG 시스템 평가를 위해, 도메인 지식과 대규모 언어 모델을 결합하여 위험 분류, 조항 검색, 의무 생성, 질문 답변 작업을 포함한 개방적이고 투명하며 재현 가능한 평가 데이터셋을 구축하고 그 유효성을 입증한 연구입니다.
이 논문은 임상 가이드라인을 텍스트로 변환하여 재학습 없이 3 차원 표적 부위를 자동 윤곽화하는 새로운 AI 에이전트 'OncoAgent'를 제안하며, 위암 사례에서 전감시 학습 기반 모델과 유사한 성능과 더 높은 임상적 선호도를 입증했습니다.
이 논문은 베이지안 추론을 MoE 라우팅 단계에만 국한하여 계산 비용을 거의 증가시키지 않으면서도 대규모 베이스 모델의 불확실성 정량화와 안정성을 획기적으로 개선하는 '변분 혼합 전문가 라우팅 (VMoER)' 프레임워크를 제안합니다.
이 논문은 자율주행차의 시나리오 기반 테스트를 위해 선언적 OpenSCENARIO 명세를 실행 가능한 시뮬레이션으로 자동 변환하는 오픈소스 도구 'RoadLogic'을 제안하고, 이를 통해 명세 준수성과 다양한 행동 변형을 효율적으로 검증할 수 있음을 입증합니다.
이 논문은 모델 병합 시 발생하는 '병합 붕괴' 현상을 규명하고, 기존 연구와 달리 파라미터 공간의 충돌보다 작업 간 표현의 비호환성이 주요 원인임을 실증적으로 입증하며, 정보이론을 통해 이를 설명하는 이론적 틀을 제시합니다.
이 논문은 자율주행 비전 - 언어 - 행동 모델의 지각 저하 및 장기 계획 불안정성 문제를 해결하기 위해, 자기 앵커 기반의 시각적 증류와 오라클 가이드 궤적 최적화를 결합한 협업 증류 프레임워크인 EvoDriveVLA 를 제안하여 오픈루프 및 클로즈드루프 평가에서 최첨단 성능을 달성함을 보여줍니다.