DMS2F-HAD: A Dual-branch Mamba-based Spatial-Spectral Fusion Network for Hyperspectral Anomaly Detection

이 논문은 CNN 의 장기 의존성 한계와 Transformer 의 높은 계산 비용을 극복하기 위해, 공간 및 스펙트럼 특징을 효율적으로 학습하고 동적 게이트 융합 메커니즘을 통해 통합하는 듀얼 브랜치 Mamba 기반 모델인 DMS2F-HAD 를 제안하여, 14 개 벤치마크 데이터셋에서 최첨단 성능과 4.6 배의 빠른 추론 속도를 달성했다고 요약할 수 있습니다.

Aayushma Pant, Lakpa Tamang, Tsz-Kwan Lee + 1 more2026-03-12🤖 cs.AI

Long Chain-of-Thought Compression via Fine-Grained Group Policy Optimization

이 논문은 그룹 상대 정책 최적화 (GRPO) 의 데이터 활용 비효율성과 엔트로피 붕괴 문제를 해결하면서, 대형 언어 모델의 불필요한 추론 과정을 효율적으로 압축하여 성능 저하 없이 계산 비용과 지연 시간을 줄이는 '세분화된 그룹 정책 최적화 (FGO)' 알고리즘을 제안합니다.

Xinchen Han, Hossam Afifi, Michel Marot, Xilu Wang, Lu Yin2026-03-12🤖 cs.LG

UniWeTok: An Unified Binary Tokenizer with Codebook Size 2128\mathit{2^{128}} for Unified Multimodal Large Language Model

이 논문은 $2^{128}$ 크기의 거대한 이진 코드북, Pre-Post 증류 및 생성 인식 사전 지식, 그리고 시그루 (SigLu) 활성화 함수를 활용한 하이브리드 아키텍처를 통해 고충실도 재구성, 복잡한 의미 추출, 생성 적합성을 동시에 달성하는 통합 멀티모달 대형 언어 모델용 유니토크 (UniWeTok) 를 제안합니다.

Shaobin Zhuang, Yuang Ai, Jiaming Han, Weijia Mao, Xiaohui Li, Fangyikang Wang, Xiao Wang, Yan Li, Shanchuan Lin, Kun Xu, Zhenheng Yang, Huaibo Huang, Xiangyu Yue, Hao Chen, Yali Wang2026-03-12🤖 cs.AI

TikArt: Stabilizing Aperture-Guided Fine-Grained Visual Reasoning with Reinforcement Learning

이 논문은 미세한 시각적 추론의 병목 현상을 해결하기 위해 Think-Aperture-Observe 루프를 통해 관심 영역을 순차적으로 확대 및 분할하며 관찰하는 강화학습 기반 에이전트 'TikArt'를 제안하고, 상대적 불확실성 감소 (RUR) 보상 함수를 통해 장기적 도구 통합 학습을 안정화하여 고해상도 추론 및 픽셀 수준의 그라운딩 성능을 향상시킨다는 내용을 담고 있습니다.

Hao Ding, Zhichuan Yang, Weijie Ge, Ziqin Gao, Chaoyi Lu, Lei Zhao2026-03-12🤖 cs.AI

GOT-JEPA: Generic Object Tracking with Model Adaptation and Occlusion Handling using Joint-Embedding Predictive Architecture

이 논문은 JEPA 아키텍처를 추적 모델 예측으로 확장하여 GOT-JEPA 프레임워크를 제안하고, 가시성 추정을 위한 OccuSolver 를 결합함으로써 가려짐과 같은 열악한 환경에서도 일반화 능력과 강건성을 크게 향상시킨 객체 추적 방법을 제시합니다.

Shih-Fang Chen, Jun-Cheng Chen, I-Hong Jhuo, Yen-Yu Lin2026-03-12🤖 cs.AI

Many AI Analysts, One Dataset: Navigating the Agentic Data Science Multiverse

이 논문은 대규모 언어 모델을 기반으로 한 자율적 AI 분석가들이 인간 다중 분석가 연구와 유사한 분석적 다양성과 결과 불일치를 저렴하게 재현할 수 있음을 보여주며, 이에 따라 AI 자동화 과학의 투명성을 위해 다중 우주식 보고와 프롬프트 공개가 필수적임을 주장합니다.

Martin Bertran, Riccardo Fogliato, Zhiwei Steven Wu2026-03-12🤖 cs.AI

Adversarial Hubness Detector: Detecting Hubness Poisoning in Retrieval-Augmented Generation Systems

이 논문은 RAG 시스템의 보안 취약점인 허브성 (hubness) 중독을 탐지하기 위해 통계적 분석, 군집 확산 평가, 안정성 테스트 등을 통합한 오픈소스 스캐너 'Hubscan'을 제안하고, 다양한 벤치마크와 실전 데이터에서 높은 탐지 성능을 입증했습니다.

Idan Habler, Vineeth Sai Narajala, Stav Koren, Amy Chang, Tiffany Saade2026-03-12🤖 cs.AI

AMLRIS: Alignment-aware Masked Learning for Referring Image Segmentation

이 논문은 텍스트 설명과 시각적 특징 간의 정렬 정도를 정량화하여 신뢰할 수 없는 픽셀을 학습 과정에서 필터링함으로써, 기존 아키텍처 변경 없이 추론 오버헤드 없이도 Referring Image Segmentation 성능을 획기적으로 개선하는 '정렬 인식 마스킹 학습 (AMLRIS)'을 제안합니다.

Tongfei Chen, Shuo Yang, Yuguang Yang, Linlin Yang, Runtang Guo, Changbai Li, He Long, Chunyu Xie, Dawei Leng, Baochang Zhang2026-03-12🤖 cs.AI

A Minimal Agent for Automated Theorem Proving

이 논문은 반복적 증명 정제, 라이브러리 검색, 컨텍스트 관리 등 최첨단 시스템의 핵심 기능을 간소화하여 구현한 최소한의 자동 증명 에이전트를 제안하고, 다양한 벤치마크에서 복잡한 아키텍처와 경쟁력 있는 성능을 보이면서도 샘플 효율성과 비용 효율성 면에서 단일 생성 방식보다 우월함을 입증했습니다.

Borja Requena, Austin Letson, Krystian Nowakowski, Izan Beltran Ferreiro, Leopoldo Sarra2026-03-12🤖 cs.AI

Defensive Refusal Bias: How Safety Alignment Fails Cyber Defenders

이 논문은 사이버 보안 방어 임무 수행 시 안전성 정렬된 대규모 언어 모델이 공격적 어휘와 유사한 키워드 사용만으로 합법적인 방어 요청을 과도하게 거부하는 '방어적 거부 편향'을 발견하고, 이를 해결하기 위해 단순한 의미 유사성 대신 의도와 권한을 분석하는 새로운 정렬 접근법의 필요성을 제기합니다.

David Campbell, Neil Kale, Udari Madhushani Sehwag, Bert Herring, Nick Price, Dan Borges, Alex Levinson, Christina Q Knight2026-03-12🤖 cs.AI

SEED-SET: Scalable Evolving Experimental Design for System-level Ethical Testing

이 논문은 자율 시스템의 윤리적 정렬을 평가하기 위해 이해관계자의 주관적 가치 판단과 객관적 평가를 계층적 가우시안 프로세스로 통합하고 새로운 획득 전략을 통해 효율적인 테스트 후보를 생성하는 'SEED-SET'이라는 확장 가능한 진화 실험 설계 프레임워크를 제안합니다.

Anjali Parashar, Yingke Li, Eric Yang Yu, Fei Chen, James Neidhoefer, Devesh Upadhyay, Chuchu Fan2026-03-12📊 stat

One Model, Many Skills: Parameter-Efficient Fine-Tuning for Multitask Code Analysis

이 논문은 코드 분석을 위한 단일 모델의 다중 태스크 파라미터 효율적 미세 조정 (PEFT) 을 체계적으로 평가하여, 단일 태스크 미세 조정과 유사한 성능을 유지하면서 저장 공간과 계산 비용을 대폭 절감할 수 있음을 입증하고, 작업 간 상호 보완성 및 모델 아키텍처 등 성공 요인을 규명했습니다.

Amal Akli, Maxime Cordy, Mike Papadakis, Yves Le Traon2026-03-12💻 cs

AraModernBERT: Transtokenized Initialization and Long-Context Encoder Modeling for Arabic

이 논문은 아랍어에 ModernBERT 아키텍처를 적용하고 트랜스토크나이제이션 초기화 및 최대 8,192 토큰의 긴 컨텍스트 모델링을 통해 언어 모델링 성능과 다양한 다운스트림 태스크에서의 전이 능력을 크게 향상시킨 'AraModernBERT'를 제안합니다.

Omar Elshehy, Omer Nacar, Abdelbasset Djamai, Muhammed Ragab, Khloud Al Jallad, Mona Abdelazim2026-03-12💬 cs.CL

MoE-SpAc: Efficient MoE Inference Based on Speculative Activation Utility in Heterogeneous Edge Scenarios

이 논문은 이기종 엣지 환경에서 MoE 모델의 추론 성능을 향상시키기 위해, 메모리 관리를 위한 정보적 사전 탐색 센서로서 스펙큘레이티브 디코딩을 활용하는 MoE-SpAc 프레임워크를 제안하고, 이를 통해 기존 기법 대비 4.04 배의 속도 향상을 달성했음을 보여줍니다.

Shuhuai Li, Jianghao Lin, Dongdong Ge, Yinyu Ye2026-03-12🤖 cs.LG

The Dunning-Kruger Effect in Large Language Models: An Empirical Study of Confidence Calibration

본 논문은 4 개의 최신 대규모 언어 모델을 대상으로 한 실증 연구를 통해, 성능이 낮은 모델일수록 자신의 능력을 과대평가하는 인간 고유의 '더닝-크루거 효과'와 유사한 과도한 자신감 편향을 보임을 확인하고, 이를 고위험 환경에서의 안전한 LLM 배포에 중요한 시사점으로 제시했습니다.

Sudipta Ghosh, Mrityunjoy Panday2026-03-12💬 cs.CL