cs.AI 편의 논문 | Gist.Science

Probabilistic Verification of Voice Anti-Spoofing Models

이 논문은 기존 음성 위조 탐지 모델의 한계를 극복하고 다양한 생성 기술과 입력 변형에 대한 견고성을 검증하기 위해 제안된 모델 독립적인 확률적 프레임워크인 PV-VASM 과 그 이론적 상한선 및 실험적 유효성을 소개합니다.

Evgeny Kushnir, Alexandr Kozodaev, Dmitrii Korzh, Mikhail Pautov, Oleg Kiriukhin, Oleg Y. Rogov2026-03-12🤖 cs.AI

UAV traffic scene understanding: A cross-spectral guided approach and a unified benchmark

이 논문은 열화상과 가시광선 영상을 활용한 교차 스펙트럼 기반의 CTCNet 모델과 교통 규제 지식을 통합한 새로운 대규모 벤치마크 Traffic-VQA 를 제안하여, 열악한 조명 조건에서도 UAV 를 통한 정교한 교통 장면 이해 및 위반 행위 감지를 가능하게 합니다.

Yu Zhang, Zhicheng Zhao, Ze Luo, Chenglong Li, Jin Tang2026-03-12🤖 cs.AI

Towards Robust Speech Deepfake Detection via Human-Inspired Reasoning

이 논문은 대규모 오디오 언어 모델과 인간이 주석한 데이터셋에서 도출된 사고 연쇄 추론을 결합하여, 새로운 오디오 도메인 및 생성기에 대한 일반화 성능과 예측에 대한 인간이 이해할 수 있는 해석 가능성을 동시에 갖춘 새로운 음성 딥페이크 탐지 프레임워크인 HIR-SDD 를 제안합니다.

Artem Dvirniak, Evgeny Kushnir, Dmitrii Tarasov, Artem Iudin, Oleg Kiriukhin, Mikhail Pautov, Dmitrii Korzh, Oleg Y. Rogov2026-03-12🤖 cs.AI

CUPID: A Plug-in Framework for Joint Aleatoric and Epistemic Uncertainty Estimation with a Single Model

이 논문은 기존 모델의 재학습 없이도 베이지안 항등 매핑과 구조화된 교란 분석을 통해 알레토릭 및 에피스테믹 불확실성을 동시에 추정할 수 있는 범용 플러그인 프레임워크 'CUPID'를 제안합니다.

Xinran Xu, Xiuyi Fan2026-03-12🤖 cs.LG

Deep Randomized Distributed Function Computation (DeepRDFC): Neural Distributed Channel Simulation

이 논문은 제한된 공통 무작위성 하에서 데이터 샘플만을 활용하여 목표 분포와 AE 출력 분포 간의 총변동 거리를 최소화하는 오토인코더 기반의 심층 무작위 분산 함수 계산 (DeepRDFC) 프레임워크를 제안하고, 기존 데이터 압축 방법 대비 뛰어난 통신 부하 효율성을 입증합니다.

Didrik Bergström, Onur Günlü2026-03-12🔢 math

Taking Shortcuts for Categorical VQA Using Super Neurons

이 논문은 비전 언어 모델의 얕은 계층에서 직접 스칼라 활성화 값을 추출하여 '슈퍼 뉴런'을 식별함으로써, 추가 학습 없이도 분류 성능을 향상시키고 최대 5.10 배의 속도 향상을 이루는 새로운 효율적 접근법을 제안합니다.

Pierre Musacchio, Jaeyi Jeong, Dahun Kim, Jaesik Park2026-03-12🤖 cs.AI

AI-Enhanced Spatial Cellular Traffic Demand Prediction with Contextual Clustering and Error Correction for 5G/6G Planning

이 논문은 5G/6G 네트워크 계획의 신뢰성을 높이기 위해 공간적 자기상관으로 인한 데이터 누출을 방지하고 잔차 보정을 적용한 문맥 인식 2 단계 분할 전략을 통해 셀룰러 트래픽 수요를 정확하게 예측하는 AI 기반 프레임워크를 제안합니다.

Mohamad Alkadamani, Colin Brown, Halim Yanikomeroglu2026-03-12⚡ eess

Towards Intelligent Spectrum Management: Spectrum Demand Estimation Using Graph Neural Networks

이 논문은 공개된 배포 기록을 기반으로 스펙트럼 수요를 추정하기 위해 계층적 다해상도 그래프 어텐션 네트워크 (HR-GAT) 를 제안하며, 다섯 개 캐나다 도시에서의 평가 결과 기존 최우수 모델 대비 중앙값 RMSE 를 약 21% 감소시키고 공간적 편향을 줄여 무선 네트워크의 스펙트럼 공유 및 할당을 지원함을 보여줍니다.

Mohamad Alkadamani, Amir Ghasemi, Halim Yanikomeroglu2026-03-12⚡ eess

Risk-Adjusted Harm Scoring for Automated Red Teaming for LLMs in Financial Services

이 논문은 금융 서비스 환경에서 LLM 의 위험을 정량화하기 위해 도메인 특화 해악 분류 체계, 자동화된 적색 팀링 파이프라인, 그리고 운영적 심각도를 고려한 '위험 조정 해악 점수 (RAHS)'를 통합한 새로운 평가 프레임워크를 제안합니다.

Fabrizio Dimino, Bhaskarjit Sarmah, Stefano Pasquali2026-03-12💰 q-fin

Nurture-First Agent Development: Building Domain-Expert AI Agents Through Conversational Knowledge Crystallization

이 논문은 도메인 전문성을 가진 AI 에이전트 구축을 위한 새로운 패러다임인 '양육 우선 개발 (Nurture-First Development)'을 제안하며, 에이전트를 초기에 최소한의 구조로 설정한 후 전문가와의 대화적 상호작용을 통해 지식을 점진적으로 응고화하고 구조화하는 '지식 결정화 사이클'을 핵심 메커니즘으로 삼아 기존의 코드나 프롬프트 우선 접근법의 한계를 극복함을 설명합니다.

Linghao Zhang2026-03-12🤖 cs.AI

Protein Counterfactuals via Diffusion-Guided Latent Optimization

이 논문은 사전 훈련된 확산 모델을 매니폴드 사전으로 활용하여, 단백질의 원하는 특성 달성, 변이 최소화, 그리고 접힘 가능성이라는 세 가지 목표를 균형 있게 충족시키는 생물학적으로 타당한 최소 변이를 생성하는 'MCCOP' 프레임워크를 제안하고 GFP 형광 회복, 열역학적 안정성 향상, E3 리가제 활성 복구 등 다양한 단백질 공학 과제에서 기존 방법론보다 우수한 성능을 입증합니다.

Weronika Kłos, Sidney Bender, Lukas Kades2026-03-12🤖 cs.LG

Speaker Verification with Speech-Aware LLMs: Evaluation and Augmentation

이 논문은 현재 스피치 인식 LLM 의 화자 식별 능력이 부족함을 규명하고, ECAPA-TDNN 임베딩을 주입하고 LoRA 를 미세조정하는 경량 증강 기법을 통해 자연어 인터페이스를 유지하면서 화자 검증 성능을 획기적으로 개선한 'ECAPA-LLM'을 제안합니다.

Thomas Thebaud, Yuzhe Wang, Laureano Moro-Velazquez, Jesus Villalba-Lopez, Najim Dehak2026-03-12🤖 cs.AI

BALD-SAM: Disagreement-based Active Prompting in Interactive Segmentation

이 논문은 대규모 기초 모델의 계산 비용을 줄이기 위해 작은 예측 헤드에만 베이지안 불확실성 모델링을 적용하여 불일치 기반의 능동적 프롬프트 선택을 가능하게 하는 'BALD-SAM' 프레임워크를 제안하며, 다양한 도메인에서 인간 및 오라클 프롬프트를 능가하는 상호작용적 분할 성능을 입증합니다.

Prithwijit Chowdhury, Mohit Prabhushankar, Ghassan AlRegib2026-03-12🤖 cs.AI

On the Reliability of Cue Conflict and Beyond

이 논문은 기존 cue-conflict 벤치마크의 불안정성과 모호성을 지적하고, 명확한 정의와 전체 라벨 공간에 걸친 평가 메커니즘을 통해 모양과 질감 편향을 더 신뢰성 있게 진단할 수 있는 새로운 프레임워크인 REFINED-BIAS 를 제안합니다.

Pum Jun Kim, Seung-Ah Lee, Seongho Park, Dongyoon Han, Jaejun Yoo2026-03-12🤖 cs.AI

Human Presence Detection via Wi-Fi Range-Filtered Doppler Spectrum on Commodity Laptops

이 논문은 외부 센서나 추가 인프라 없이 상용 노트북의 내장 Wi-Fi 하드웨어만으로 사용자의 존재를 감지할 수 있는 최초의 저비용 솔루션인 '범위 필터링 도플러 스펙트럼 (RF-DS)' 기법과 적응형 다중 속도 처리 프레임워크를 제안합니다.

Jessica Sanson, Rahul C. Shah, Valerio Frascolla2026-03-12⚡ eess

Towards Cold-Start Drafting and Continual Refining: A Value-Driven Memory Approach with Application to NPU Kernel Synthesis

이 논문은 데이터가 부족한 NPU 커널 합성 분야에서 대규모 언어 모델의 성능 저하를 해결하기 위해, 가치 기반 기억 메커니즘을 통해 경험을 축적하고 단계별로 최적화하는 자기 진화 에이전트 프레임워크인 EvoKernel 을 제안합니다.

Yujie Zheng, Zhuo Li, Shengtao Zhang, Hanjing Wang, Junjie Sheng, Jiaqian Wang, Junchi Yan, Weinan Zhang, Ying Wen, Bo Tang, Muning Wen2026-03-12🤖 cs.LG

Semantic Landmark Particle Filter for Robot Localisation in Vineyards

이 논문은 기하학적 SLAM 과 GNSS 만으로는 해결하기 어려운 포도원의 행 반복성 문제를 해결하기 위해, 2D LiDAR 와 트렁크/기둥 검출을 통합한 '의미론적 랜드마크 입자 필터 (SLPF)'를 제안하여 로보트의 국소화 정확도와 행 식별 능력을 크게 향상시켰음을 보여줍니다.

Rajitha de Silva, Jonathan Cox, James R. Heselden, Marija Popovic, Cesar Cadena, Riccardo Polvara2026-03-12🤖 cs.AI

$V_{0.5}$ : Generalist Value Model as a Prior for Sparse RL Rollouts

이 논문은 희소 롤아웃 환경에서 사전 학습된 일반 가치 모델의 예측을 사전 지식으로 활용하고 실시간 통계 검증을 통해 추가 롤아웃 예산을 동적으로 할당함으로써, 편향과 분산을 균형 있게 제어하여 GRPO 및 DAPO 보다 우수한 성능을 보이는 새로운 가치 모델 $V_{0.5}$ 를 제안합니다.

Yi-Kai Zhang, Yueqing Sun, Hongyan Hao, Qi Gu, Xunliang Cai, De-Chuan Zhan, Han-Jia Ye2026-03-12🤖 cs.LG

GRACE: A Unified 2D Multi-Robot Path Planning Simulator & Benchmark for Grid, Roadmap, And Continuous Environments

이 논문은 그리드, 로드맵, 연속 공간 등 다양한 추상화 수준에서 동일한 작업을 실행할 수 있는 통합된 2D 시뮬레이터 및 벤치마크인 'GRACE'를 제안하여, 다중 로봇 경로 계획 연구의 투명성, 재현성, 그리고 표현 수준 간 비교 가능성을 높이는 것을 목표로 합니다.

Chuanlong Zang, Anna Mannucci, Isabelle Barz, Philipp Schillinger, Florian Lier, Wolfgang Hönig2026-03-12🤖 cs.AI

An Extreme Multi-label Text Classification (XMTC) Library Dataset: What if we took "Use of Practical AI in Digital Libraries" seriously?

이 논문은 영어와 독일어 카탈로그 기록에 통합 권위 파일 (GND) 주석이 달린 대규모 이언어 말뭉치와 머신 액션 가능한 GND 분류 체계를 공개하여, 확장 가능한 주제 색인 및 권위 기반 AI 보조 도구를 위한 오토니지 인식 다중 레이블 분류 연구를 가능하게 한다고 요약할 수 있습니다.

Jennifer D'Souza, Sameer Sadruddin, Maximilian Kähler, Andrea Salfinger, Luca Zaccagna, Francesca Incitti, Lauro Snidaro, Osma Suominen2026-03-12💬 cs.CL

← 이전 다음 →

cs.AI