cs.CL 편의 논문 | Gist.Science

ACE-Merging: Data-Free Model Merging with Adaptive Covariance Estimation

이 논문은 데이터 접근 없이도 미세조정된 모델의 매개변수 차이를 통해 입력 공분산을 추정하여 간섭을 완화하는 이론적으로 정립된 폐형식 (closed-form) 솔루션인 ACE-Merging 을 제안함으로써, 데이터 없는 모델 병합 분야에서 새로운 최고 성능을 달성했습니다.

Bo Xu, Haotian Wu, Hehai Lin + 4 more2026-03-04💬 cs.CL

Contextualized Privacy Defense for LLM Agents

이 논문은 강화학습을 통해 실행 단계별 맥락을 고려한 사전적 프라이버시 지침을 생성하는 'Contextualized Defense Instructing(CDI)' 패러다임을 제안함으로써, 기존 정적 방어 방식보다 프라이버시 보호와 유용성 간의 균형을 획기적으로 개선하고 적대적 조건에서도 강력한 성능을 보임을 입증합니다.

Yule Wen, Yanzhe Zhang, Jianxun Lian + 3 more2026-03-04💬 cs.CL

MaBERT:A Padding Safe Interleaved Transformer Mamba Hybrid Encoder for Efficient Extended Context Masked Language Modeling

이 논문은 긴 문맥 모델링 시 발생하는 계산 비용과 패딩으로 인한 상태 오염 문제를 해결하기 위해, 전역 의존성 모델링을 위한 트랜스포머 레이어와 선형 시간 상태 업데이트를 위한 마밤 (Mamba) 레이어를 교차 배치하고 패딩 안전 마스킹 기법을 도입한 하이브리드 인코더 'MaBERT'를 제안합니다.

Jinwoong Kim, Sangjin Park2026-03-04💬 cs.CL

← 이전 다음 →

cs.CL

ACE-Merging: Data-Free Model Merging with Adaptive Covariance Estimation

Contextualized Privacy Defense for LLM Agents

MaBERT:A Padding Safe Interleaved Transformer Mamba Hybrid Encoder for Efficient Extended Context Masked Language Modeling

TrustMH-Bench: A Comprehensive Benchmark for Evaluating the Trustworthiness of Large Language Models in Mental Health

TikZilla: Scaling Text-to-TikZ with High-Quality Data and Reinforcement Learning

TAO-Attack: Toward Advanced Optimization-Based Jailbreak Attacks for Large Language Models

Compact Prompting in Instruction-tuned LLMs for Joint Argumentative Component Detection

Interpreting Speaker Characteristics in the Dimensions of Self-Supervised Speech Features

Evaluating Performance Drift from Model Switching in Multi-Turn LLM Systems

UniSkill: A Dataset for Matching University Curricula to Professional Competencies

APRES: An Agentic Paper Revision and Evaluation System

Type-Aware Retrieval-Augmented Generation with Dependency Closure for Solver-Executable Industrial Optimization Modeling

MoD-DPO: Towards Mitigating Cross-modal Hallucinations in Omni LLMs using Modality Decoupled Preference Optimization

BeyondSWE: Can Current Code Agent Survive Beyond Single-Repo Bug Fixing?

ACE-Brain-0: Spatial Intelligence as a Shared Scaffold for Universal Embodiments

Learning When to Act or Refuse: Guarding Agentic Reasoning Models for Safe Multi-Step Tool Use

Understanding and Mitigating Dataset Corruption in LLM Steering

Density-Guided Response Optimization: Community-Grounded Alignment via Implicit Acceptance Signals

Using Learning Progressions to Guide AI Feedback for Science Learning

Factuality Challenges in the Era of Large Language Models