cs.LG 편의 논문 | Gist.Science

GATech at AbjadGenEval Shared Task: Multilingual Embeddings for Arabic Machine-Generated Text Classification

이 논문은 GATech 팀이 아랍어 AI 생성 텍스트 탐지 과제에서 복잡한 풀링 전략보다 단순한 평균 풀링이 제한된 데이터 환경에서 더 뛰어난 성능 (F1 0.75) 을 보였으며, 인간 작성 텍스트가 기계 생성 텍스트보다 일반적으로 길다는 패턴을 발견했다고 보고합니다.

Ahmed Khaled Khamis2026-03-12💬 cs.CL

GATech at AbjadMed: Bidirectional Encoders vs. Causal Decoders: Insights from 82-Class Arabic Medical Classification

이 논문은 82 개 아랍어 의료 분류 태스크에서 아랍어 특화 양방향 인코더 (AraBERTv2) 가 다음 토큰 예측에 최적화된 인과적 디코더보다 정밀한 의미 경계 포착과 전반적인 성능에서 우월함을 입증했습니다.

Ahmed Khaled Khamis2026-03-12💬 cs.CL

Personalized Group Relative Policy Optimization for Heterogenous Preference Alignment

이 논문은 기존 GRPO 의 한계를 극복하고 이질적인 사용자 선호도를 효과적으로 정렬하기 위해, 그룹별 보상 이력을 기반으로 이득을 정규화하는 새로운 프레임워크인 '개인화 GRPO(P-GRPO)'를 제안하고 그 유효성을 입증합니다.

Jialu Wang, Heinrich Peters, Asad A. Butt, Navid Hashemi, Alireza Hashemi, Pouya M. Ghari, Joseph Hoover, James Rae, Morteza Dehghani2026-03-12🤖 cs.LG

Defining AI Models and AI Systems: A Framework to Resolve the Boundary Problem

이 논문은 AI 규제에서 모호한 'AI 모델'과 'AI 시스템'의 경계 문제를 해결하기 위해 학술 및 규제 문헌을 분석하고, 모델을 '학습된 매개변수와 아키텍처'로, 시스템을 '모델과 입출력 처리 구성요소를 포함한 전체'로 정의함으로써 규제 책임 소재를 명확히 하는 프레임워크를 제안합니다.

Yuanyuan Sun, Timothy Parker, Lara Gierschmann, Sana Shams, Teo Canmetin, Mathieu Duteil, Rokas Gipiškis, Ze Shen Chin2026-03-12🤖 cs.AI

LWM-Temporal: Sparse Spatio-Temporal Attention for Wireless Channel Representation Learning

이 논문은 물리적 전파 특성을 반영한 희소 시공간 어텐션 메커니즘과 물리 기반 마스킹 전략을 통해 이동성 환경에서의 채널 진화를 포착하고 다양한 하위 작업에 적용 가능한 범용 무선 채널 임베딩을 학습하는 새로운 대형 무선 모델인 LWM-Temporal 을 제안합니다.

Sadjad Alikhani, Akshay Malhotra, Shahab Hamidi-Rad, Ahmed Alkhateeb2026-03-12🤖 cs.LG

HTM-EAR: Importance-Preserving Tiered Memory with Hybrid Routing under Saturation

이 논문은 제한된 컨텍스트 하에서 장기 실행 에이전트의 필수 정보를 보존하기 위해 중요도 기반 추방과 하이브리드 라우팅을 통합한 계층적 티어드 메모리 시스템 HTM-EAR 을 제안하며, 포화 상태에서도 오라클 수준의 성능을 유지하면서 LRU 와 같은 기존 방식보다 필수 사실의 영구적 손실을 효과적으로 방지함을 입증합니다.

Shubham Kumar Singh2026-03-12🤖 cs.AI

Tureis: Transformer-based Unified Resilience for IoT Devices in Smart Homes

Tureis 는 스마트 홈 IoT 환경에서 라벨 없이 자가 지도 학습을 통해 다중 고장과 다중 거주자 상황을 실시간으로 감지하고 정밀하게 국소화할 수 있는 경량 트랜스포머 기반의 통합 복원력 프레임워크입니다.

Alireza Borhani, Vafa Andalibi, Bahar Asgari2026-03-12💻 cs

Evaluating Generalization Mechanisms in Autonomous Cyber Attack Agents

이 논문은 NetSecGame 환경에서 IP 주소 재배치와 같은 미세한 변화가 자율 공격 에이전트의 일반화 능력을 어떻게 저해하는지 평가하고, 기존 강화학습 및 적응형 에이전트보다 추론 비용과 투명성 문제가 있음에도 불구하고 프롬프트 기반 사전 훈련 LLM 에이전트가 가장 높은 성공률을 보였음을 밝혔습니다.

Ondřej Lukáš, Jihoon Shin, Emilia Rivas, Diego Forni, Maria Rigaki, Carlos Catania, Aritran Piplai, Christopher Kiekintveld, Sebastian Garcia2026-03-12💻 cs

Safety Under Scaffolding: How Evaluation Conditions Shape Measured Safety

이 논문은 언어 모델의 안전성 평가 시 단일 모델 테스트와 실제 배포 환경 (스캐폴딩) 간의 차이, 특히 평가 형식 (객관식 대 서술형) 이 안전성 점수에 미치는 영향이 더 크며, 모델과 구성에 따라 안전성 결과가 극명하게 달라지므로 개별 모델과 구성별 테스트가 필수적임을 대규모 실험을 통해 규명했습니다.

David Gringras2026-03-12🤖 cs.AI

Gated Adaptation for Continual Learning in Human Activity Recognition

이 논문은 웨어러블 센서 기반의 인간 활동 인식 (HAR) 에서 새로운 사용자의 데이터에 적응하면서도 기존 지식을 유지하기 위해, 사전 훈련된 특징의 채널별 게이트 조절을 통해 매개변수 효율적으로 catastrophic forgetting 을 해결하는 continual learning 프레임워크를 제안합니다.

Reza Rahimi Azghan, Gautham Krishna Gudur, Mohit Malu, Edison Thomaz, Giulia Pedrielli, Pavan Turaga, Hassan Ghasemzadeh2026-03-12🤖 cs.LG

Revisiting Sharpness-Aware Minimization: A More Faithful and Effective Implementation

이 논문은 Sharpness-Aware Minimization (SAM) 의 기존 구현 방식에 대한 직관적 해석을 제시하고, 근사 오차와 다단계 상승 시의 품질 저하 문제를 해결하기 위해 명시적 방향 추정과 최적화된 탐색 공간을 도입한 새로운 알고리즘인 eXplicit SAM (XSAM) 을 제안하여 기존 방법보다 우수한 일반화 성능을 입증합니다.

Jianlong Chen, Zhiming Zhou2026-03-12🤖 cs.LG

InFusionLayer: a CFA-based ensemble tool to generate new classifiers for learning and modeling

이 논문은 랭크 - 스코어 특성 (RSC) 함수와 인지 다양성 (CD) 을 기반으로 한 조합 융합 분석 (CFA) 기법을 적용하여 PyTorch, TensorFlow, Scikit-learn 등 다양한 워크플로우에서 다중 분류 문제를 해결하는 새로운 앙상블 도구인 'InFusionLayer'를 소개하고 그 성능을 검증합니다.

Eric Roginek, Jingyan Xu, D. Frank. Hsu2026-03-12🤖 cs.LG

Where Do Flow Semantics Reside? A Protocol-Native Tabular Pretraining Paradigm for Encrypted Traffic Classification

이 논문은 암호화 트래픽 분류에서 시퀀스 기반 접근법의 한계를 지적하고, 프로토콜 정의 semantics 를 구조적 우선순위로 삼아 학습 가능한 필드만 선별하고 메타데이터를 보존하는 표본 기반 자기지도 학습 모델인 FlowSem-MAE 를 제안하여 적은 레이블 데이터로도 최첨단 성능을 달성함을 보여줍니다.

Sizhe Huang, Shujie Yang2026-03-12🤖 cs.AI

OmniGuide: Universal Guidance Fields for Enhancing Generalist Robot Policies

이 논문은 3D 공간의 에너지 함수로 표현된 다양한 안내 소스를 활용하여 복잡한 작업에서 시각 - 언어 - 행동 (VLA) 모델의 성능과 안전성을 획기적으로 향상시키는 범용 프레임워크인 '오미가이드 (OmniGuide)'를 제안합니다.

Yunzhou Song, Long Le, Yong-Hyun Park, Jie Wang, Junyao Shi, Lingjie Liu, Jiatao Gu, Eric Eaton, Dinesh Jayaraman, Kostas Daniilidis2026-03-12💻 cs

Cluster-Aware Attention-Based Deep Reinforcement Learning for Pickup and Delivery Problems

이 논문은 픽업 및 배송 문제 (PDP) 의 군집 구조를 명시적으로 활용하여 기존 딥러닝 기반 방법들보다 높은 효율성과 성능을 달성하는 'CAADRL'이라는 새로운 심층 강화 학습 프레임워크를 제안합니다.

Wentao Wang, Lifeng Han, Guangyu Zou2026-03-12🤖 cs.LG

Quantization of Ricci Curvature in Information Geometry

이 논문은 2004 년 제안된 피셔 정보 계량에 따른 리치 스칼라 부피 평균의 양의 반정수 양자화 가설을 트리 및 완전 그래프 비트넷에서는 증명하고 일반적 경우에는 반례를 들어 반증하였으며, 가우시안 DAG 네트워크로 확장하여 이산 비트넷과 가우시안 네트워크 간의 양의 곡수와 음의 곡수라는 부호 이분법을 규명했습니다.

Carlos C. Rodriguez2026-03-12🔢 math

Training Language Models via Neural Cellular Automata

이 논문은 신경 세포 자동자 (NCA) 를 통해 생성된 합성 비언어 데이터를 사전-사전 학습에 활용함으로써, 자연어 학습보다 효율적으로 언어 모델의 성능과 추론 능력을 향상시키는 새로운 접근법을 제시합니다.

Dan Lee, Seungwook Han, Akarsh Kumar, Pulkit Agrawal2026-03-12🤖 cs.LG

HTMuon: Improving Muon via Heavy-Tailed Spectral Correction

이 논문은 무언 (Muon) 알고리즘의 중력 꼬리 분포 억제 문제를 해결하고 성능을 향상시키기 위해 헤비-테일 자기 정규화 이론에 기반한 'HTMuon'을 제안하고, 이를 통해 LLM 사전 학습 및 이미지 분류에서 기존 최첨단 방법보다 우수한 결과를 입증합니다.

Tianyu Pang, Yujie Fang, Zihang Liu, Shenyang Deng, Lei Hsiung, Shuhua Yu, Yaoqing Yang2026-03-12🤖 cs.LG

Improving Search Agent with One Line of Code

이 논문은 GRPO 기반 검색 에이전트 훈련에서 발생하는 ISDD 문제를 해결하기 위해 조건부 토큰 수준 KL 제약을 도입한 SAPO 를 제안하며, 이는 단 한 줄의 코드 수정으로 Search-R1 대비 10.6% 의 절대적 성능 향상을 달성함을 보여줍니다.

Jian Li, Dongsheng Chen, Zhenhua Xu, Yizhang Jin, Jiafu Wu, Chengjie Wang, Xiaotong Yuan, Yabiao Wang2026-03-12🤖 cs.LG

Dissecting Chronos: Sparse Autoencoders Reveal Causal Feature Hierarchies in Time Series Foundation Models

이 논문은 희소 오토인코더 (SAE) 를 시계열 파운데이션 모델 Chronos-T5-Large 에 적용하여, 주기적 패턴 인식보다 급격한 동적 변화 탐지가 예측에 더 중요하며 중간 레이어의 특징이 최종 레이어보다 인과적으로 결정적임을 규명했습니다.

Anurag Mishra2026-03-12🤖 cs.LG

← 이전 다음 →