cs.CL 편의 논문 | Gist.Science

HatePrototypes: Interpretable and Transferable Representations for Implicit and Explicit Hate Speech Detection

이 논문은 명시적 및 암시적 혐오 표현 감지를 위해 소량의 예시만으로 학습된 'HatePrototypes'을 활용하여 반복적인 파인튜닝 없이도 효과적인 전이 학습과 파라미터 없는 조기 종료 방식을 가능하게 하는 새로운 접근법을 제시합니다.

Irina Proskurina, Marc-Antoine Carpentier, Julien Velcin2026-03-10💬 cs.CL

SPOT: An Annotated French Corpus and Benchmark for Detecting Critical Interventions in Online Conversations

이 논문은 온라인 토론에서 논의를 중단하거나 방향을 전환하는 '중단점 (stopping points)'을 탐지하기 위한 프랑스어 주석 데이터셋 SPOT 과 벤치마크를 소개하며, 이를 통해 CamemBERT 기반의 미세 조정 모델이 지시 기반 LLM 보다 더 우수한 성능을 보임과 동시에 문맥 메타데이터의 중요성을 입증했습니다.

Manon Berriche, Célia Nouri, Chloée Clavel, Jean-Philippe Cointet2026-03-10💬 cs.CL

Multimodal LLMs Do Not Compose Skills Optimally Across Modalities

이 논문은 멀티모달 대규모 언어 모델 (MLLM) 이 모달리티 간에 학습된 기술을 조합하는 데 있어 상당한 격차가 존재하며, 프롬프팅이나 미세 조정과 같은 기존 전략으로도 이를 완전히 해결하지 못함을 규명했습니다.

Paula Ontalvilla, Aitor Ormazabal, Gorka Azkune2026-03-10💬 cs.CL

Stealth Fine-Tuning: Efficiently Breaking Alignment in RVLMs Using Self-Generated CoT

이 논문은 RVLM(추론 강화 비전 - 언어 모델) 의 안전성 정렬을 깨뜨리기 위해 자기 생성 추론을 활용한 '은밀한 미세 조정 (Stealth Fine-Tuning)'이라는 새로운 공격 기법을 제안하며, 소량의 데이터와 짧은 시간으로도 기존 방법보다 훨씬 높은 성공률로 정렬 우회를 달성할 수 있음을 보여줍니다.

Le Yu, Zhengyue Zhao, Yawen Zheng, Yunhao Liu2026-03-10💬 cs.CL

Process-Centric Analysis of Agentic Software Systems

이 논문은 에이전트 소프트웨어 시스템의 실행 과정을 그래프 기반으로 체계적으로 분석하는 'Graphectory'를 제안하여, 에이전트의 추론 및 전략 패턴을 심층적으로 규명하고 실시간 모니터링을 통해 문제 해결률을 6.9%~23.5% 향상시키는 효과를 입증했습니다.

Shuyang Liu, Yang Chen, Rahul Krishna, Saurabh Sinha, Jatin Ganhotra, Reyhan Jabbarvand2026-03-10💬 cs.CL

SETUP: Sentence-level English-To-Uniform Meaning Representation Parser

이 논문은 기존 AMR 파서를 미세 조정하거나 Universal Dependencies 변환기를 활용하는 두 가지 방법을 제안하여 영어 텍스트를 자동으로 Uniform Meaning Representation (UMR) 그래프로 변환하는 SETUP 모델을 개발하고, 이를 통해 UMR 파싱의 정확도를 크게 향상시켰음을 보여줍니다.

Emma Markle, Javier Gutierrez Bach, Shira Wein2026-03-10💬 cs.CL

Parallel Decoder Transformer: Planner-Seeded Latent Coordination for Synchronized Parallel Decoding

이 논문은 고정된 트랜스포머 트렁크에 플래너가 시드하는 잠재 작업 공간과 동기화된 다중 스트림 출력 프로토콜을 도입하여, 외부 오케스트레이션이 아닌 모델 내부 메커니즘을 통해 병렬 디코딩을 가능하게 하는 '병렬 디코더 트랜스포머 (PDT)'를 제안합니다.

Logan Robbins2026-03-10💬 cs.CL

CompanionCast: Toward Social Collaboration with Multi-Agent Systems in Shared Experiences

이 논문은 고립된 미디어 소비를 해결하기 위해 다중 AI 에이전트를 실시간 공유 경험의 사회적 협력자로 조율하는 'CompanionCast' 프레임워크를 제안하고, 축구 팬을 대상으로 한 실증을 통해 고립된 시청보다 사회적 존재감과 감정 공유를 크게 향상시킨다고 밝힙니다.

Yiyang Wang, Chen Chen, Tica Lin, Vishnu Raj, Josh Kimball, Alex Cabral, Josiah Hester2026-03-10💬 cs.CL

Adaptation of Agentic AI: A Survey of Post-Training, Memory, and Skills

본 논문은 사전 학습 이후 에이전트와 도구의 적응을 포괄하는 4 가지 패러다임 (A1, A2, T1, T2) 프레임워크를 제시하며, 후학습, 메모리, 기술 시스템에 대한 연구 동향을 통합적으로 분석하고 평가 기준 및 향후 과제를 정리합니다.

Pengcheng Jiang, Jiacheng Lin, Zhiyi Shi, Zifeng Wang, Luxi He, Yichen Wu, Ming Zhong, Peiyang Song, Qizheng Zhang, Heng Wang, Xueqiang Xu, Hanwen Xu, Pengrui Han, Dylan Zhang, Jiashuo Sun, Chaoqi Yang, Kun Qian, Tian Wang, Changran Hu, Manling Li, Quanzheng Li, Hao Peng, Sheng Wang, Jingbo Shang, Chao Zhang, Jiaxuan You, Liyuan Liu, Pan Lu, Yu Zhang, Heng Ji, Yejin Choi, Dawn Song, Jimeng Sun, Jiawei Han2026-03-10💬 cs.CL

A Two-Stage Multitask Vision-Language Framework for Explainable Crop Disease Visual Question Answering

이 논문은 Swin Transformer 비전 인코더와 시퀀스 - 시퀀스 언어 디코더를 통합한 경량 2 단계 멀티태스크 프레임워크를 제안하여 작물 질병 시각적 질문 응답 (VQA) 에서 높은 정확도와 설명 가능성을 달성하고 PlantVillageVQA 벤치마크에서도 우수한 일반화 성능을 입증했습니다.

Md. Zahid Hossain, Most. Sharmin Sultana Samu, Md. Rakibul Islam, Md. Siam Ansary2026-03-10💬 cs.CL

NC-Bench: An LLM Benchmark for Evaluating Conversational Competence

NC-Bench 는 IBM 의 자연 대화 프레임워크에 기반하여 LLM 의 주제나 작업 수행이 아닌 대화의 형식과 구조적 순서 관리 능력을 평가하는 새로운 벤치마크를 제안합니다.

Robert J. Moore, Sungeun An, Farhan Ahmed, Jay Pankaj Gala2026-03-10💬 cs.CL

A Component-Based Survey of Interactions between Large Language Models and Multi-Armed Bandits

이 논문은 대규모 언어 모델 (LLM) 과 다중 팔 밴딧 (MAB) 간의 양방향 상호작용을 구성 요소 수준에서 체계적으로 검토하여, MAB 가 LLM 의 학습 및 개인화 문제를 해결하고 LLM 이 MAB 의 핵심 구성 요소를 재정의하여 의사결정을 개선하는 상호 보완적 관계와 향후 연구 방향을 제시합니다.

Siguang Chen, Chunli Lv, Miao Xie2026-03-10🤖 cs.LG

MAS-Orchestra: Understanding and Improving Multi-Agent Reasoning Through Holistic Orchestration and Controlled Benchmarks

이 논문은 전역적 오케스트레이션을 강화학습 기반으로 구현한 'MAS-Orchestra' 프레임워크와 다중 에이전트 시스템의 효용을 체계적으로 분석하는 'MASBENCH' 벤치마크를 제안하여, 단일 에이전트 대비 다중 에이전트 시스템의 성능 향상을 효율적으로 달성하고 그 작동 원리를 규명합니다.

Zixuan Ke, Yifei Ming, Austin Xu, Ryan Chin, Xuan-Phi Nguyen, Prathyusha Jwalapuram, Jiayu Wang, Semih Yavuz, Caiming Xiong, Shafiq Joty2026-03-10💬 cs.CL

Replayable Financial Agents: A Determinism-Faithfulness Assurance Harness for Tool-Using LLM Agents

이 논문은 금융 서비스용 도구 활용 LLM 에이전트의 규제 감사 재현성을 보장하기 위해 결정론적 일관성과 정확도를 독립적으로 측정하는 '결정론-신뢰성 보장 하네스 (DFAH)' 프레임워크와 관련 벤치마크를 제안하며, 두 지표가 서로 상관관계가 없으므로 모두 독립적으로 평가해야 함을 실증합니다.

Raffi Khatchadourian2026-03-10💬 cs.CL

EFT-CoT: A Multi-Agent Chain-of-Thought Framework for Emotion-Focused Therapy

이 논문은 인지적 재구조화 중심의 기존 접근법의 한계를 극복하기 위해 감정중심치료 (EFT) 기반의 다중 에이전트 체인 오브 씽킹 프레임워크인 'EFT-CoT'를 제안하고, 이를 통해 고품질 데이터셋과 전용 모델을 구축하여 공감의 깊이와 전문성 측면에서 기존 모델 및 인간 응답을 능가하는 정신 건강 지원 시스템을 제시합니다.

Lanqing Du, Yunong Li, YuJie Long, Shihong Chen2026-03-10💬 cs.CL

Improving X-Codec-2.0 for Multi-Lingual Speech: 25 Hz Latent Rate and 24 kHz Sampling

이 논문은 X-Codec-2.0 의 잠재 공간 레이트를 50Hz 에서 25Hz 로 낮추고 샘플링 주파수를 16kHz 에서 24kHz 로 높이는 간단한 구조 개선을 통해 다국어 음성 모델의 효율성과 음질 (MOS 점수 0.29 향상) 을 동시에 개선한 결과를 제시합니다.

Husein Zolkepli2026-03-10💬 cs.CL

RedSage: A Cybersecurity Generalist LLM

이 논문은 118 억 토큰 규모의 사이버 보안 데이터와 에이전트 기반 증강 파이프라인을 활용하여 훈련된 오픈소스 사이버 보안 특화 LLM 인 'RedSage'를 제안하고, 이를 통해 사이버 보안 전문성과 일반 추론 능력을 동시에 향상시켰음을 입증합니다.

Naufal Suryanto, Muzammal Naseer, Pengfei Li, Syed Talal Wasim, Jinhui Yi, Juergen Gall, Paolo Ceravolo, Ernesto Damiani2026-03-10💬 cs.CL

Mem-T: Densifying Rewards for Long-Horizon Memory Agents

이 논문은 희소하고 지연된 보상 문제를 해결하기 위해 메모리 작업 트리를 통한 힌드사이트 크레딧 할당을 도입한 MoT-GRPO 학습 프레임워크와 경량 계층적 메모리 데이터베이스를 활용한 Mem-T 에이전트를 제안하여 장기 기억 관리 정책의 종단간 최적화와 성능 향상을 달성했습니다.

Yanwei Yue, Boci Peng, Xuanbo Fan, Jiaxin Guo, Qiankun Li, Yan Zhang2026-03-10🤖 cs.LG

Do Schwartz Higher-Order Values Help Sentence-Level Human Value Detection? A Study of Hierarchical Gating and Calibration

이 논문은 Schwartz 의 고차원 가치 범주가 단일 문장 기반 인간 가치 감지 작업에서 경성 계층적 게이트링보다는 인덕티브 바이어스나 보정 및 앙상블 기법과 결합될 때 더 유용함을 보여줍니다.

Víctor Yeste, Paolo Rosso2026-03-10🤖 cs.LG

LatentMem: Customizing Latent Memory for Multi-Agent Systems

이 논문은 역할 인식 맞춤형 메모리와 정보 과부하 문제를 해결하기 위해 토큰 효율적인 잠재 메모리 프레임워크인 LatentMem 과 이를 최적화하는 LMPO 를 제안하여 다중 에이전트 시스템의 성능을 기존 방식 대비 최대 19.36% 향상시킨 연구입니다.

Muxin Fu, Xiangyuan Xue, Yafu Li, Zefeng He, Siyuan Huang, Xiaoye Qu, Yu Cheng, Yang Yang2026-03-10🤖 cs.LG

← 이전 다음 →