Safe Transformer: An Explicit Safety Bit For Interpretable And Controllable Alignment

이 논문은 사전 훈련된 언어 모델의 레이어 사이에 명시적인 안전 비트를 삽입하여 모델의 안전 판단을 해석 가능하고 제어 가능하게 만들며, 경량 미세 조정을 통해 공격 성공률을 극도로 낮추는 'Safe Transformer' 아키텍처를 제안합니다.

Jingyuan Feng, Andrew Gambardella, Gouki Minegishi, Takeshi Kojima, Yusuke Iwasawa, Yutaka Matsuo2026-03-10🤖 cs.LG

PolyBlocks: A Compiler Infrastructure for AI Chips and Programming Frameworks

이 논문은 MLIR 기반의 모듈형 컴파일러 인프라인 PolyBlocks 를 제안하여, 분석적 비용 모델과 휴리스틱을 활용한 자동 최적화를 통해 PyTorch 와 JAX 에서 Torch Inductor 나 XLA 와 경쟁력 있는 성능을 달성하고 새로운 AI 칩으로의 이식을 용이하게 한다는 내용을 담고 있습니다.

Uday Bondhugula, Akshay Baviskar, Navdeep Katel, Vimal Patel, Anoop JS, Arnab Dutta2026-03-10🤖 cs.LG

Calibrated Credit Intelligence: Shift-Robust and Fair Risk Scoring with Bayesian Uncertainty and Gradient Boosting

이 논문은 베이지안 신경망, 공정성 제약이 적용된 그래디언트 부스팅, 그리고 시프트 인식 융합 전략을 결합하여 데이터 분포 변화와 공정성 요구사항 하에서도 신뢰할 수 있는 신용 위험 점수를 산출하는 '보정된 신용 지능 (CCI)' 프레임워크를 제안하고, 이를 통해 기존 모델 대비 우수한 판별력, 보정 정확도, 안정성 및 공정성을 입증합니다.

Srikumar Nayak2026-03-10🤖 cs.LG

Rank-Factorized Implicit Neural Bias: Scaling Super-Resolution Transformer with FlashAttention

이 논문은 FlashAttention 을 활용하여 초해상도 Transformer 의 확장성을 가능하게 하는 랭크 분해 암시적 신경 편향 (RIB) 을 제안하고, 이를 통해 기존 방법 대비 훈련 및 추론 시간을 획기적으로 단축하면서도 Urban100 데이터셋에서 35.63dB 의 높은 PSNR 성능을 달성했습니다.

Dongheon Lee, Seokju Yun, Jaegyun Im, Youngmin Ro2026-03-10🤖 cs.LG

Heterogeneous Decentralized Diffusion Models

이 논문은 서로 다른 학습 목표 (DDPM 및 Flow Matching) 를 가진 전문가들을 동기화 없이 통합하고, 사전 학습된 체크포인트 변환과 효율적인 아키텍처를 통해 기존 분산 확산 모델 대비 연산 및 데이터 요구량을 획기적으로 줄이면서도 더 우수한 생성 품질을 달성하는 이질적 분산 확산 모델 프레임워크를 제안합니다.

Zhiying Jiang, Raihan Seraj, Marcos Villagra, Bidhan Roy2026-03-10🤖 cs.LG

Implementation of Quantum Implicit Neural Representation in Deterministic and Probabilistic Autoencoders for Image Reconstruction/Generation Tasks

이 논문은 양자 암시적 신경 표현 (QINR) 을 디코더에 통합한 하이브리드 오토인코더 및 변이형 오토인코더를 제안하여, 제한된 파라미터와 데이터로도 MNIST 등 다양한 데이터셋에서 고주파 특징이 풍부한 선명한 이미지 재구성과 생성이 가능하며 기존 양생성 모델보다 안정적이고 다양성이 높음을 입증합니다.

Saadet Müzehher Eren2026-03-10⚛️ quant-ph

Enhancing SHAP Explainability for Diagnostic and Prognostic ML Models in Alzheimer Disease

이 논문은 알츠하이머병 진단 및 예후를 위한 머신러닝 모델의 SHAP 설명이 질병 단계와 모델 아키텍처에 걸쳐 일관되고 안정적임을 NACC 데이터셋 기반 실험을 통해 입증함으로써, 임상 현장에서의 신뢰할 수 있는 해석을 가능하게 하는 다단계 설명 가능성 프레임워크를 제안합니다.

Pablo Guillén, Enrique Frias-Martinez2026-03-10🤖 cs.LG

Diversity-Aware Adaptive Collocation for Physics-Informed Neural Networks via Sparse QUBO Optimization and Hybrid Coresets

이 논문은 PDE 잔차 기반 중요도와 공간적 다양성을 동시에 고려하여 QUBO 최적화와 희소 그래프 기반 하이브리드 코어셋을 통해 물리 정보 신경망 (PINN) 의 콜로케이션 점 선택을 최적화하고, 기존 방법 대비 선택 오버헤드를 줄이면서 정확도를 향상시키는 새로운 방법을 제안합니다.

Hadi Salloum, Maximilian Mifsud Bonici, Sinan Ibrahim, Pavel Osinenko, Alexei Kornaev2026-03-10🤖 cs.LG

Metalearning traffic assignment for network disruptions with graph convolutional neural networks

이 논문은 그래프 합성곱 신경망과 메타러닝 아키텍처를 결합하여 도로 네트워크 구조 변화 및 수요 패턴 변동이 동시에 발생하는 미지의 교통 혼란 상황에서도 신속하게 적응하고 높은 예측 정확도 (R² 약 0.85) 를 달성하는 교통 배정 모델을 제안합니다.

Serio Agriesti (Department of Technology, Management and Economics, Technical University of Denmark, Lyngby, Denmark), Guido Cantelmo (Department of Technology, Management and Economics, Technical University of Denmark, Lyngby, Denmark), Francisco Camara Pereira (Department of Technology, Management and Economics, Technical University of Denmark, Lyngby, Denmark)2026-03-10🤖 cs.LG

Failure Detection in Chemical Processes using Symbolic Machine Learning: A Case Study on Ethylene Oxidation

이 논문은 안전이 중요한 화학 공정 분야에서 설명 가능성과 해석 가능성이 부족하며 실제 고장 데이터가 희소한 기존 AI 의 한계를 극복하기 위해, 에틸렌 산화 공정을 사례로 상징적 기계 학습을 활용하여 고장을 예측하고 해석 가능한 규칙 기반 모델을 생성하는 방법을 제안합니다.

Julien Amblard, Niklas Groll, Matthew Tait, Mark Law, Gürkan Sin, Alessandra Russo2026-03-10🤖 cs.LG