Low-rank Orthogonal Subspace Intervention for Generalizable Face Forgery Detection
이 논문은 딥페이크 탐지의 일반화 문제를 해결하기 위해, 위조와 무관한 저랭크 편향을 제거하고 진짜 위조 흔적에 초점을 맞추는 인과적 표현 학습 기반의 'SeLop'이라는 새로운 방법을 제안합니다.
6073 편의 논문
이 논문은 딥페이크 탐지의 일반화 문제를 해결하기 위해, 위조와 무관한 저랭크 편향을 제거하고 진짜 위조 흔적에 초점을 맞추는 인과적 표현 학습 기반의 'SeLop'이라는 새로운 방법을 제안합니다.
이 논문은 GDPR 의 프라이버시 설계 (PbD) 를 위한 요구사항 공학 방법론을 조직의 목표에 부합하는지 평가하기 위한 목표 중심 접근법을 제안하고 있습니다.
이 논문은 무선 은폐 통신 (Covert Communication) 의 엄격한 보안 제약 조건 하에서 LLM 의 능력을 평가하기 위해 CovertComBench 를 제안하고, 현재 LLM 이 개념 이해와 코드 구현에서는 우수한 성능을 보이지만 보안 보장을 위한 고차원 수학적 유도에서는 한계가 있어 신뢰할 수 있는 무선 AI 시스템 구축을 위해 외부 도구 증강이 필요함을 밝힙니다.
이 논문은 알래스카의 카리부 무리를 대상으로 배경 이질성과 클래스 불균형 등 극한 환경의 어려움을 극복하기 위해, 약한 지도 학습 패치 기반 사전 학습을 적용하여 기존 ImageNet 초기화보다 높은 정확도의 야생동물 탐지 및 계수 프레임워크 (HerdNet) 를 제안하고 검증했습니다.
이 논문은 다양한 AI 이미지 생성기가 공유하는 최종 구성 요소를 이용해 실물을 '오염'시켜 학습하는 새로운 탐지 방식을 제안함으로써, 훈련되지 않은 생성 모델에서도 높은 일반화 성능을 달성하는 것을 목표로 합니다.
이 논문은 다중 턴 시각 추론을 위한 새로운 벤치마크 'RegionDial-Bench'를 제안하고, 각 추론 단계에서 명시적인 바운딩 박스 인용과 전역 - 지역 일관성 보상을 통해 강화 학습을 수행하는 'RegionReasoner' 프레임워크를 소개함으로써 시각적 추론의 정확성과 공간적 근거 능력을 획기적으로 향상시킵니다.
이 논문은 [Zhu et al. (2022)] 의 추측을 증명하여, 모든 유효한 RDP 프로파일과 Type I 오류 수준에 대해 단일 차수 RDP 프라이버시 영역의 교차에 기반한 변환 규칙이 -Differential Privacy 로의 최적 변환임을 보여줍니다.
이 논문은 증류된 자기회귀 모델의 장기간 비디오 생성 시 발생하는 오류 누적을 해결하기 위해, 초기 프레임을 안정적 기준점으로 활용하여 샘플링 경로를 보정하는 훈련 없는 '테스트 시간 보정 (TTC)' 방법을 제안하고, 이를 통해 30 초 길이의 비디오 생성에서 기존 훈련 기반 방법과媲美하는 품질을 낮은 오버헤드로 달성함을 입증합니다.
이 논문은 나비의 저주파 날개 짓과 신체 요동을 모방하여 26 그램 규모의 자율 비행 로봇 'AirPulse'를 개발하고, 계층적 제어 아키텍처를 통해 꼬리 없는 날개 플랫폼의 안정적인 자율 비행을 실현했다고 보고합니다.
이 논문은 정보 이론적 관점에서 모달리티 간 경쟁을 완화하고 상호작용을 포착하기 위해 총 상관관계 (Total Correlation) 를 최대화하는 새로운 다중 모달 분류 방법인 TCMax 를 제안하고, 이를 통해 기존 최첨단 기법들을 능가하는 성능을 입증합니다.
이 논문은 ACL 앤솔로지에 게재된 LGBTQIA+ 커뮤니티와 NLP 기술 간의 관계를 다룬 연구들을 체계적으로 검토하여, 현재 연구가 주로 기존 시스템의 편향을 지적하는 수동적 접근에 그치고 있으며, 향후 이해관계자 참여, 교차성, 학제 간 협력 및 비영어권 언어 연구 등 보다 포용적이고 정의로운 NLP 기술 개발을 위한 방향성을 제시합니다.
이 논문은 레코드, 정의, 상속이라는 세 가지 원리를 기반으로 상속을 집합 합집합으로 모델링하여 다중 상속의 선형화 문제를 구조적으로 해결하고, - calculus 보다 더 높은 표현력을 갖는 선언적 프로그래밍의 기초가 되는 '상속 연산 (inheritance-calculus)'을 제시합니다.
이 논문은 학습 시간 제약 하에서 사전 훈련된 정책과 적응 규칙을 결합한 메타 게임 설계를 통해 합리적 선택 하에 알고리즘적 담합이 발생할 수 있는지와 다양한 전략의 효과를 반복 가격 결정 게임에서 평가합니다.
이 논문은 텍스트 기반 모션 생성 시 교차 시퀀스 간 시간적 일관성을 고려한 TCA-T2M 프레임워크를 제안하여, 기존 방법의 한계를 극복하고 물리적으로 타당하며 일관된 인간 모션을 생성하는 새로운 기준을 제시합니다.
이 논문은 희소 데이터 환경에서 클래스 공유 LoRA 와 이미지별 LoRA 를 결합하고 의미 강화 기법을 도입하여 다양성과 세부 묘사를 모두 갖춘 고품질 합성 데이터를 생성함으로써 하류 분류 작업의 정확도를 향상시키는 'ChimeraLoRA' 방법을 제안합니다.
이 논문은 학습 데이터 없이 다양한 문서 위조 검출 방법을 평가한 'DOCFORGE-BENCH' 벤치마크를 제시하며, 기존 방법들이 임계값 보정 실패로 인해 실제 배포 환경에서 성능이 크게 저하됨을 규명하고 문서 위조 탐지가 여전히 해결되지 않은 문제임을 강조합니다.
이 논문은 RGB 와 깊이 (Depth) 모달리티 간의 분포 차이와 최적화 불균형을 해결하기 위해 이종 이중 패치 최적화 및 그래디언트 레벨 모달리티 균형 전략을 도입한 '다중 모달 적대적 품질 정책 (MAQP)'을 제안하여 인간 - 로봇 상호작용 환경에서의 안전한 그리핑을 실현합니다.
이 논문은 보다 큰 노름에서 결정형 격자 덮기 반지름 문제 (GapCRP) 가 명시적인 근사 인자 에 대해 NP-난해함을 증명하여, 해당 문제에 대한 최초의 NP-난해성 결과를 제시합니다.
이 논문은 수억 개의 쿼리 - 문서 상호작용 데이터를 기반으로 Qwen2 기반의 양방향 모델과 Matryoshka 표현 학습을 활용하여 우버 이츠의 스토어, 메뉴, 식료품 등 다양한 카테고리와 다국어 검색을 통합한 대규모 의미 기반 검색 시스템을 구축하고 평가한 내용을 담고 있습니다.
이 논문은 FPGA 기반의 고성능 연산을 위해 캐리 없는 잔여 연산과 경량 지수 스케일링을 결합한 '하이브리드 잔여 부동 소수점 아키텍처 (HRFNA)'를 제안하며, 엄밀한 오차 분석과 함께 IEEE 754 기준 대비 최대 2.4 배의 처리량 향상 및 에너지 효율 개선을 입증합니다.