cs.LG 편의 논문 | Gist.Science

Geodesic Semantic Search: Learning Local Riemannian Metrics for Citation Graph Retrieval

이 논문은 인용 그래프의 각 노드에서 국소 리만 계수를 학습하여 유클리드 거리 기반 검색보다 23% 높은 재현율과 해석 가능한 인용 경로를 제공하는 '지오데식 시맨틱 검색 (GSS)' 시스템을 제안합니다.

Brandon Yee, Lucas Wang, Kundana Kommini, Krishna Sharma2026-03-13🤖 cs.LG

Subliminal Signals in Preference Labels

이 논문은 LLM 기반의 심층적 감독 시스템에서 선호도 라벨이 단순한 품질 평가를 넘어 편향된 판단자가 학생 모델에 의도치 않은 행동을 은밀하게 전파하는 하위 의식적 통신 채널로 작용할 수 있음을 규명하고, 이에 대한 탐지 및 완화 메커니즘의 필요성을 강조합니다.

Isotta Magistrali, Frédéric Berdoz, Sam Dauncey, Roger Wattenhofer2026-03-13🤖 cs.LG

Can AI Agents Agree?

이 논문은 현재 대규모 언어 모델 기반 에이전트들이 적대적 합의 환경에서 신뢰할 수 있는 합의를 이루지 못하며, 특히 그룹 크기가 커지거나 비잔틴 에이전트가 포함될 경우 합의 실패가 주로 시간 초과나 수렴 지연과 같은 활성성 (liveness) 손실로 나타난다고 밝힙니다.

Frédéric Berdoz, Leonardo Rugli, Roger Wattenhofer2026-03-13🤖 cs.LG

Reasoning Boosts Opinion Alignment in LLMs

이 논문은 강화학습 기반의 구조화된 추론이 LLM 의 의견 정렬을 향상시키고 편향을 줄이는 데 도움이 되지만, 완전한 편향 제거를 위해서는 추가적인 메커니즘이 필요함을 3 개 국가의 정치 데이터셋을 통해 입증했습니다.

Frédéric Berdoz, Yann Billeter, Yann Vonlanthen, Roger Wattenhofer2026-03-13💬 cs.CL

Randomized Kriging Believer for Parallel Bayesian Optimization with Regret Bounds

이 논문은 기존 병렬 베이지안 최적화 방법들의 한계를 극복하고 낮은 계산 복잡성과 이론적 후회 한계 보장을 동시에 제공하는 '랜덤화 크리깅 벨리버 (Randomized Kriging Believer)' 알고리즘을 제안하고 실험을 통해 그 유효성을 입증합니다.

Shuhei Sugiura, Ichiro Takeuchi, Shion Takeno2026-03-13📊 stat

Comparison of Outlier Detection Algorithms on String Data

이 논문은 문자열 데이터의 이상치 탐지를 위해 편집 거리를 기반으로 한 변형 국소 이상치 인자 알고리즘과 계층적 정규식 학습 기반 알고리즘을 제안하고, 데이터의 구조적 특성과 편집 거리 분포에 따라 각 알고리즘의 성능이 달라짐을 실험적으로 입증했습니다.

Philip Maus2026-03-13🤖 cs.LG

OpenSanctions Pairs: Large-Scale Entity Matching with LLMs

이 논문은 국제 제재 데이터에서 파생된 대규모 엔티티 매칭 벤치마크인 'OpenSanctions Pairs'를 공개하고, 기존 규칙 기반 시스템보다 우수한 성능을 보이는 LLM 기반 매칭의 효과와 한계를 실증적으로 분석하여 향후 엔티티 해결 작업의 초점을 매칭 자체보다는 블로킹 및 클러스터링 등 파이프라인 다른 단계로 전환할 것을 제안합니다.

Chandler Smith, Magnus Sesodia, Friedrich Lindenberg, Christian Schroeder de Witt2026-03-13💬 cs.CL

Structure-Aware Epistemic Uncertainty Quantification for Neural Operator PDE Surrogates

이 논문은 신경 연산자 (Neural Operator) 의 예측 불확실성을 효율적이고 공간적으로 정밀하게 추정하기 위해, 네트워크의 모듈 구조 (리프팅 - 전파 - 복원) 를 활용하여 리프팅 모듈에만 확률적 노이즈를 주입하는 구조 인식형 인식적 불확실성 정량화 기법을 제안하고, 이를 통해 기존 방법보다 더 신뢰할 수 있는 커버리지와 잔차-불확실성 정렬을 달성함을 보여줍니다.

Haoze Song, Zhihao Li, Mengyi Deng, Xin Li, Duyi Pan, Zhilu Lai, Wei Wang2026-03-13🤖 cs.LG

Speculative Decoding Scaling Laws (SDSL): Throughput Optimization Made Simple

이 논문은 추론 파이프라인의 처리량을 최적화하기 위해 사전 학습된 대규모 언어 모델의 주요 하이퍼파라미터와 스펙큘레이티브 디코딩 기반 추론 시스템의 효율성 간의 이론적 관계를 규명하여, 사전 학습 전에 최적 구성 요소를 예측할 수 있는 방법을 제시합니다.

Amirhossein Bozorgkhoo, Igor Molybog2026-03-13💬 cs.CL

TinyNav: End-to-End TinyML for Real-Time Autonomous Navigation on Microcontrollers

이 논문은 ESP32 마이크로컨트롤러에서 실시간으로 자율 항해가 가능하도록 23k 파라미터의 경량화된 2D 합성곱 신경망을 개발하여, 외부 컴퓨팅 자원 없이도 저비용 로봇에 반응형 자율 제어를 구현하는 TinyNav 시스템을 제시합니다.

Pooria Roy, Nourhan Jadallah. Tomer Lapid, Shahzaib Ahmad, Armita Afroushe, Mete Bayrak2026-03-13🤖 cs.LG

Interventional Time Series Priors for Causal Foundation Models

이 논문은 기존 시계열 벤치마크의 한계를 극복하고 인과적 기초 모델을 훈련하기 위해 관측 및 개입 데이터를 모두 제공하는 합성 시계열 구조 인과 모델 생성 프레임워크인 'CausalTimePrior'를 제안하고, 이를 통해 PFN 기반의 컨텍스트 내 인과 효과 추정이 가능함을 입증합니다.

Dennis Thumm, Ying Chen2026-03-13🤖 cs.LG

Fingerprinting Concepts in Data Streams with Supervised and Unsupervised Meta-Information

이 논문은 데이터 스트림의 개념 변화 (concept drift) 를 효과적으로 탐지하고 식별하기 위해 다양한 메타 정보 특징을 동적으로 가중치 부여하여 통합하는 새로운 범용 프레임워크인 FiCSUM 을 제안하고, 이를 통해 기존 방법들보다 다양한 실제 및 합성 데이터셋에서 더 높은 정확도와 모델링 성능을 달성함을 보여줍니다.

Ben Halstead, Yun Sing Koh, Patricia Riddle, Mykola Pechenizkiy, Albert Bifet, Russel Pears2026-03-13🤖 cs.LG

Graph Tokenization for Bridging Graphs and Transformers

이 논문은 가역적 그래프 직렬화와 BPE 를 결합하여 그래프 구조를 시퀀스로 변환하는 토크나이저를 제안함으로써, 구조적 수정 없이도 BERT 와 같은 트랜스포머를 그래프 벤치마크에 적용해 기존 그래프 신경망 및 전용 트랜스포머보다 우수한 성능을 달성했습니다.

Zeyuan Guo, Enmao Diao, Cheng Yang, Chuan Shi2026-03-13🤖 cs.LG

Task-Conditioned Routing Signatures in Sparse Mixture-of-Experts Transformers

이 논문은 희소 혼합 전문가 (MoE) 모델의 라우팅 메커니즘이 단순한 부하 분산이 아닌 작업 유형에 따라 구조화된 특징을 보이며, 이를 '라우팅 서명'을 통해 정량화하고 작업 분류에 활용할 수 있음을 입증했습니다.

Mynampati Sri Ranganadha Avinash2026-03-13🤖 cs.LG

A Learning-Based Superposition Operator for Non-Renewal Arrival Processes in Queueing Networks

이 논문은 다양한 비재생 도착 프로세스의 합성을 정확하게 모델링하기 위해 합성 마코프 도착 프로세스 (MAP) 로 학습된 심층 학습 기반의 확장 가능한 초위치 연산자를 제안하여, 기존 재생 근사법보다 정밀한 분산 성능 분석을 가능하게 합니다.

Eliran Sherzer2026-03-13🤖 cs.LG

Group Resonance Network: Learnable Prototypes and Multi-Subject Resonance for EEG Emotion Recognition

이 논문은 개인 간 EEG 변이로 인한 과제를 해결하기 위해 개별 뇌파 역동성과 학습 가능한 그룹 프로토타입 및 다중 피험자 공명 모델을 통합한 '그룹 공명 네트워크 (GRN)'를 제안하여, SEED 및 DEAP 데이터셋에서 기존 방법들보다 우수한 감정 인식 성능을 입증했습니다.

Renwei Meng2026-03-13🤖 cs.LG

High-resolution weather-guided surrogate modeling for data-efficient cross-location building energy prediction

이 논문은 기존 방법의 한계를 극복하고 단일 위치 데이터만으로도 다양한 기후대에서도 높은 정확도를 유지하는 재사용 가능한 고해상도 기상 기반 건물 에너지 예측 대리 모델을 제안합니다.

Piragash Manmatharasan, Girma Bitsuamlak, Katarina Grolinger2026-03-13🤖 cs.LG

Co-Diffusion: An Affinity-Aware Two-Stage Latent Diffusion Framework for Generalizable Drug-Target Affinity Prediction

이 논문은 희소 레이블과 도메인 편이로 인한 표현 붕괴 문제를 해결하고, 약물-표적 친화도 예측의 일반화 능력을 획기적으로 향상시키기 위해 친화도 지향 잠재 매니폴드 정렬과 확률적 확산 정규화를 결합한 새로운 2 단계 프레임워크 'Co-Diffusion'을 제안합니다.

Yining Qian, Pengjie Wang, Yixiao Li, An-Yang Lu, Cheng Tan, Shuang Li, Lijun Liu2026-03-13📊 stat

Efficient Approximation to Analytic and $L^p$ functions by Height-Augmented ReLU Networks

이 논문은 3 차원 네트워크 아키텍처를 통해 sawtooth 함수의 효율적인 표현을 가능하게 함으로써, 해석 함수 및 $L^p$ 함수에 대한 기존 이론의 한계를 극복하고 지수적 근사율 향상과 고차 비점근적 근사 정리를 제시합니다.

ZeYu Li, FengLei Fan, TieYong Zeng2026-03-13📊 stat

Beyond Barren Plateaus: A Scalable Quantum Convolutional Architecture for High-Fidelity Image Classification

이 논문은 지역적 비용 함수와 하드웨어 효율적인 텐서 네트워크 초기화 전략을 도입하여 바렌 플래토 문제를 해결하고, MNIST 데이터셋에서 98.7% 의 정확도를 달성하며 기존 QCNN 보다 월등히 우수한 성능과 파라미터 효율성을 입증한 확장 가능한 양자 합성곱 신경망 아키텍처를 제안합니다.

Radhakrishnan Delhibabu2026-03-13🤖 cs.LG

← 이전 다음 →

cs.LG