Probabilistic Verification of Voice Anti-Spoofing Models
이 논문은 기존 음성 위조 탐지 모델의 한계를 극복하고 다양한 생성 기술과 입력 변형에 대한 견고성을 검증하기 위해 제안된 모델 독립적인 확률적 프레임워크인 PV-VASM 과 그 이론적 상한선 및 실험적 유효성을 소개합니다.
12009 편의 논문
이 논문은 기존 음성 위조 탐지 모델의 한계를 극복하고 다양한 생성 기술과 입력 변형에 대한 견고성을 검증하기 위해 제안된 모델 독립적인 확률적 프레임워크인 PV-VASM 과 그 이론적 상한선 및 실험적 유효성을 소개합니다.
이 논문은 열화상과 가시광선 영상을 활용한 교차 스펙트럼 기반의 CTCNet 모델과 교통 규제 지식을 통합한 새로운 대규모 벤치마크 Traffic-VQA 를 제안하여, 열악한 조명 조건에서도 UAV 를 통한 정교한 교통 장면 이해 및 위반 행위 감지를 가능하게 합니다.
이 논문은 대규모 오디오 언어 모델과 인간이 주석한 데이터셋에서 도출된 사고 연쇄 추론을 결합하여, 새로운 오디오 도메인 및 생성기에 대한 일반화 성능과 예측에 대한 인간이 이해할 수 있는 해석 가능성을 동시에 갖춘 새로운 음성 딥페이크 탐지 프레임워크인 HIR-SDD 를 제안합니다.
이 논문은 기존 모델의 재학습 없이도 베이지안 항등 매핑과 구조화된 교란 분석을 통해 알레토릭 및 에피스테믹 불확실성을 동시에 추정할 수 있는 범용 플러그인 프레임워크 'CUPID'를 제안합니다.
이 논문은 제한된 공통 무작위성 하에서 데이터 샘플만을 활용하여 목표 분포와 AE 출력 분포 간의 총변동 거리를 최소화하는 오토인코더 기반의 심층 무작위 분산 함수 계산 (DeepRDFC) 프레임워크를 제안하고, 기존 데이터 압축 방법 대비 뛰어난 통신 부하 효율성을 입증합니다.
이 논문은 비전 언어 모델의 얕은 계층에서 직접 스칼라 활성화 값을 추출하여 '슈퍼 뉴런'을 식별함으로써, 추가 학습 없이도 분류 성능을 향상시키고 최대 5.10 배의 속도 향상을 이루는 새로운 효율적 접근법을 제안합니다.
이 논문은 5G/6G 네트워크 계획의 신뢰성을 높이기 위해 공간적 자기상관으로 인한 데이터 누출을 방지하고 잔차 보정을 적용한 문맥 인식 2 단계 분할 전략을 통해 셀룰러 트래픽 수요를 정확하게 예측하는 AI 기반 프레임워크를 제안합니다.
이 논문은 공개된 배포 기록을 기반으로 스펙트럼 수요를 추정하기 위해 계층적 다해상도 그래프 어텐션 네트워크 (HR-GAT) 를 제안하며, 다섯 개 캐나다 도시에서의 평가 결과 기존 최우수 모델 대비 중앙값 RMSE 를 약 21% 감소시키고 공간적 편향을 줄여 무선 네트워크의 스펙트럼 공유 및 할당을 지원함을 보여줍니다.
이 논문은 금융 서비스 환경에서 LLM 의 위험을 정량화하기 위해 도메인 특화 해악 분류 체계, 자동화된 적색 팀링 파이프라인, 그리고 운영적 심각도를 고려한 '위험 조정 해악 점수 (RAHS)'를 통합한 새로운 평가 프레임워크를 제안합니다.
이 논문은 도메인 전문성을 가진 AI 에이전트 구축을 위한 새로운 패러다임인 '양육 우선 개발 (Nurture-First Development)'을 제안하며, 에이전트를 초기에 최소한의 구조로 설정한 후 전문가와의 대화적 상호작용을 통해 지식을 점진적으로 응고화하고 구조화하는 '지식 결정화 사이클'을 핵심 메커니즘으로 삼아 기존의 코드나 프롬프트 우선 접근법의 한계를 극복함을 설명합니다.
이 논문은 사전 훈련된 확산 모델을 매니폴드 사전으로 활용하여, 단백질의 원하는 특성 달성, 변이 최소화, 그리고 접힘 가능성이라는 세 가지 목표를 균형 있게 충족시키는 생물학적으로 타당한 최소 변이를 생성하는 'MCCOP' 프레임워크를 제안하고 GFP 형광 회복, 열역학적 안정성 향상, E3 리가제 활성 복구 등 다양한 단백질 공학 과제에서 기존 방법론보다 우수한 성능을 입증합니다.
이 논문은 현재 스피치 인식 LLM 의 화자 식별 능력이 부족함을 규명하고, ECAPA-TDNN 임베딩을 주입하고 LoRA 를 미세조정하는 경량 증강 기법을 통해 자연어 인터페이스를 유지하면서 화자 검증 성능을 획기적으로 개선한 'ECAPA-LLM'을 제안합니다.
이 논문은 대규모 기초 모델의 계산 비용을 줄이기 위해 작은 예측 헤드에만 베이지안 불확실성 모델링을 적용하여 불일치 기반의 능동적 프롬프트 선택을 가능하게 하는 'BALD-SAM' 프레임워크를 제안하며, 다양한 도메인에서 인간 및 오라클 프롬프트를 능가하는 상호작용적 분할 성능을 입증합니다.
이 논문은 기존 cue-conflict 벤치마크의 불안정성과 모호성을 지적하고, 명확한 정의와 전체 라벨 공간에 걸친 평가 메커니즘을 통해 모양과 질감 편향을 더 신뢰성 있게 진단할 수 있는 새로운 프레임워크인 REFINED-BIAS 를 제안합니다.
이 논문은 외부 센서나 추가 인프라 없이 상용 노트북의 내장 Wi-Fi 하드웨어만으로 사용자의 존재를 감지할 수 있는 최초의 저비용 솔루션인 '범위 필터링 도플러 스펙트럼 (RF-DS)' 기법과 적응형 다중 속도 처리 프레임워크를 제안합니다.
이 논문은 데이터가 부족한 NPU 커널 합성 분야에서 대규모 언어 모델의 성능 저하를 해결하기 위해, 가치 기반 기억 메커니즘을 통해 경험을 축적하고 단계별로 최적화하는 자기 진화 에이전트 프레임워크인 EvoKernel 을 제안합니다.
이 논문은 기하학적 SLAM 과 GNSS 만으로는 해결하기 어려운 포도원의 행 반복성 문제를 해결하기 위해, 2D LiDAR 와 트렁크/기둥 검출을 통합한 '의미론적 랜드마크 입자 필터 (SLPF)'를 제안하여 로보트의 국소화 정확도와 행 식별 능력을 크게 향상시켰음을 보여줍니다.
이 논문은 희소 롤아웃 환경에서 사전 학습된 일반 가치 모델의 예측을 사전 지식으로 활용하고 실시간 통계 검증을 통해 추가 롤아웃 예산을 동적으로 할당함으로써, 편향과 분산을 균형 있게 제어하여 GRPO 및 DAPO 보다 우수한 성능을 보이는 새로운 가치 모델 를 제안합니다.
이 논문은 그리드, 로드맵, 연속 공간 등 다양한 추상화 수준에서 동일한 작업을 실행할 수 있는 통합된 2D 시뮬레이터 및 벤치마크인 'GRACE'를 제안하여, 다중 로봇 경로 계획 연구의 투명성, 재현성, 그리고 표현 수준 간 비교 가능성을 높이는 것을 목표로 합니다.
이 논문은 영어와 독일어 카탈로그 기록에 통합 권위 파일 (GND) 주석이 달린 대규모 이언어 말뭉치와 머신 액션 가능한 GND 분류 체계를 공개하여, 확장 가능한 주제 색인 및 권위 기반 AI 보조 도구를 위한 오토니지 인식 다중 레이블 분류 연구를 가능하게 한다고 요약할 수 있습니다.