cs.LG 편의 논문 | Gist.Science

Maximizing Asynchronicity in Event-based Neural Networks

이 논문은 이벤트 카메라의 비동기적 특성을 언어 모델링 기법에 빗대어 고안된 EVA 프레임워크를 통해 기존 동기화 방식보다 표현력과 일반화 성능을 극대화하고, 인식 및 검출 태스크에서 새로운 성능 기준을 제시했습니다.

Haiqing Hao, Nikola Zubic, Weihua He, Zhipeng Sui, Davide Scaramuzza, Wenhui Wang2026-03-09🤖 cs.AI

ESGenius: Benchmarking LLMs on Environmental, Social, and Governance (ESG) and Sustainability Knowledge

이 논문은 ESG 및 지속 가능성 분야에 특화된 대규모 언어 모델 (LLM) 의 능력을 평가하고 향상시키기 위해, 전문가 검증을 거친 1,136 개의 질문과 231 개의 핵심 문서로 구성된 'ESGenius'라는 최초의 종합 벤치마크를 소개하고, 이를 통해 RAG(검색 증강 생성) 방식이 특히 소형 모델의 성능을 크게 향상시킨다는 것을 입증했습니다.

Chaoyue He, Xin Zhou, Yi Wu + 9 more2026-03-09💬 cs.CL

ContextBench: Modifying Contexts for Targeted Latent Activation

이 논문은 언어 모델의 특정 잠재적 특징이나 행동을 유도하는 입력을 생성하는 '맥락 수정' 접근법을 제안하고, 이를 평가하는 벤치마크 'ContextBench'를 소개하며, LLM 보조와 확산 모델 인페인팅을 결합한 진화적 프롬프트 최적화 (EPO) 변형이 유창성과 유도 효과를 동시에 달성하는 최첨단 성능을 보인다고 주장합니다.

Robert Graham, Edward Stevinson, Leo Richter, Alexander Chia, Joseph Miller, Joseph Isaac Bloom2026-03-09🤖 cs.AI

Sysformer: Safeguarding Frozen Large Language Models with Adaptive System Prompts

이 논문은 파인튜닝 없이 고정된 LLM 의 시스템 프롬프트를 사용자 입력에 맞춰 적응적으로 조정하는 'Sysformer'를 제안하여, 유해한 입력에 대한 거절률을 최대 80% 향상시키고 안전한 입력에 대한 준수율을 최대 90% 높이며 다양한 재킹킹 공격에 대한 모델의 견고성을 극대화한다고 요약할 수 있습니다.

Kartik Sharma, Yiqiao Jin, Vineeth Rakesh, Yingtong Dou, Menghai Pan, Mahashweta Das, Srijan Kumar2026-03-09🤖 cs.AI

SPoT: Subpixel Placement of Tokens in Vision Transformers

이 논문은 비전 트랜스포머의 그리드 기반 토큰화 한계를 극복하고, 오라클 가이드 탐색을 통해 이미지의 연속적인 서브픽셀 위치에 토큰을 배치하는 SPoT 기법을 제안하여 추론 시 필요한 토큰 수를 획기적으로 줄이면서도 정확도를 향상시키는 새로운 패러다임을 제시합니다.

Martine Hjelkrem-Tan, Marius Aasan, Gabriel Y. Arteaga, Adín Ramírez Rivera2026-03-09🤖 cs.LG

Quantifying Cross-Attention Interaction in Transformers for Interpreting TCR-pMHC Binding

이 논문은 TCR-pMHC 결합을 해석하기 위해 기존 XAI 방법의 한계를 극복하는 새로운 사후 해석 기법인 QCAI 를 제안하고, 실험적으로 확인된 274 개 TCR-pMHC 구조로 구성된 TCR-XAI 벤치마크를 통해 해석 가능성과 예측 정확도 측면에서 최첨단 성능을 입증했습니다.

Jiarui Li, Zixiang Yin, Haley Smith, Zhengming Ding, Samuel J. Landry, Ramgopal R. Mettu2026-03-09🤖 cs.LG

Temporal Misalignment Attacks against Multimodal Perception in Autonomous Driving

이 논문은 자율주행의 다중모달 융합 인식을 위해 차량 내 네트워크를 통해 시계열 동기화를 교란하는 '데자뷰 (DejaVu)' 공격을 제안하며, 이는 객체 감지 및 추적 성능을 극도로 저하시켜 충돌이나 유령 제동과 같은 심각한 안전 사고를 유발할 수 있음을 실증합니다.

Md Hasan Shahriar, Md Mohaimin Al Barat, Harshavardhan Sundar, Ning Zhang, Naren Ramakrishnan, Y. Thomas Hou, Wenjing Lou2026-03-09🤖 cs.LG

Diverse and Adaptive Behavior Curriculum for Autonomous Driving: A Student-Teacher Framework with Multi-Agent RL

이 논문은 자율주행 에이전트가 규칙 기반 시나리오의 한계를 극복하고 일상부터 위기 상황까지 다양한 교통 행동을 학습할 수 있도록, 학생 - 교사 프레임워크와 적응형 다중 에이전트 강화학습을 통해 자동 커리큘럼을 생성하는 새로운 방법을 제안합니다.

Ahmed Abouelazm, Johannes Ratz, Philip Schörner, J. Marius Zöllner2026-03-09🤖 cs.LG

Merging Memory and Space: A State Space Neural Operator

이 논문은 적응형 감쇠와 학습 가능한 주파수 변조를 도입하여 시간 의존 편미분 방정식의 해 연산자를 효율적으로 학습하는 새로운 '상태 공간 신경 연산자 (SS-NO)' 아키텍처를 제안하고, 다양한 PDE 벤치마크에서 기존 방법보다 적은 파라미터로 최첨단 성능을 달성함을 보여줍니다.

Nodens Koren, Samuel Lanthaler2026-03-09🤖 cs.LG

Multivariate Fields of Experts for Convergent Image Reconstruction

이 논문은 $\ell_\infty$ -노름의 모reau 포락선을 기반으로 한 다변량 잠재 함수를 도입하여 기존 Fields of Experts 방법을 일반화함으로써, 딥러닝 기반 정규화자와 유사한 성능을 유지하면서도 더 적은 데이터와 파라미터로 빠른 수렴 보장을 제공하는 새로운 이미지 재구성 프레임워크를 제안합니다.

Stanislas Ducotterd, Michael Unser2026-03-09🤖 cs.LG

Characterizing Evolution in Expectation-Maximization Estimates for Overspecified Mixed Linear Regression

이 논문은 과지정된 2 성분 혼합 선형 회귀 모델에서 EM 알고리즘의 거동을 이론적으로 분석하여, 초기 혼합 가중치의 균형 여부에 따라 회귀 파라미터의 수렴 속도 (선형 대 하선형) 와 유한 표본에서의 통계적 정확도 ( $O((d/n)^{1/2})$ 대 $O((d/n)^{1/4})$ ) 가 어떻게 달라지는지 규명했습니다.

Zhankun Luo, Abolfazl Hashemi2026-03-09🤖 cs.LG

Kernel VICReg for Self-Supervised Learning in Reproducing Kernel Hilbert Space

이 논문은 기존 유클리드 공간의 한계를 극복하고 비선형 구조를 효과적으로 포착하기 위해 VICReg 목적 함수를 재생 커널 힐베르트 공간 (RKHS) 으로 확장한 'Kernel VICReg'를 제안하고, 다양한 데이터셋에서 기존 방법보다 우수한 성능을 입증합니다.

M. Hadi Sepanj, Benyamin Ghojogh, Saed Moradi, Paul Fieguth2026-03-09🤖 cs.LG

One Model for All Tasks: Leveraging Efficient World Models in Multi-Task Planning

이 논문은 이기적인 다중 작업 환경에서 그래디언트 충돌을 완화하기 위해 전문가 혼합 (MoE) 아키텍처를 도입하고 학습 과정 중 동적 파라미터 확장 (DPS) 전략을 적용하여, 단일 모델로도 전문 단일 작업 에이전트와 경쟁력 있는 성능을 달성하면서도 환경 상호작용을 71.5% 로 줄인 'ScaleZero'를 제안합니다.

Yuan Pu, Yazhe Niu, Jia Tang, Junyu Xiong, Shuai Hu, Hongsheng Li2026-03-09🤖 cs.LG

Quantum parameter estimation with uncertainty quantification from continuous measurement data using neural network ensembles

이 논문은 심층 앙상블 신경망을 활용하여 연속 측정 데이터로부터 양자 매개변수를 추정할 때 불확실성을 정량화하고, 드리프트를 감지하며, 기존 베이지안 추론보다 빠른 추론 속도를 달성할 수 있음을 보여줍니다.

Amanuel Anteneh2026-03-09⚛️ quant-ph

← 이전 다음 →

cs.LG