Hate Speech Detection using Large Language Models with Data Augmentation and Feature Enhancement

이 논문은 데이터 증강과 특징 향상 기법을 적용하여 전통적 분류기와 다양한 대규모 언어 모델을 비교 분석한 결과, 오픈소스 gpt-oss-20b 모델이 가장 높은 성능을 보였으며 데이터셋과 모델 간 상호작용이 혐오 발언 탐지 효율성에 결정적임을 규명했습니다.

Brian Jing Hong Nge, Stefan Su, Thanh Thi Nguyen + 3 more2026-03-06💻 cs

Detection of Illicit Content on Online Marketplaces using Large Language Models

이 연구는 다국어 DUTA10K 데이터셋을 기반으로 Llama 3.2 와 Gemma 3 와 같은 대규모 언어 모델 (LLM) 이 기존 머신러닝 및 BERT 모델보다 40 개 이상의 복잡한 불법 카테고리 분류에서 뛰어난 성능을 보이며 온라인 마켓플레이스의 불법 콘텐츠 탐지 및 규제에 효과적임을 입증했습니다.

Quoc Khoa Tran, Thanh Thi Nguyen, Campbell Wilson2026-03-06💻 cs

AI-Assisted Moot Courts: Simulating Justice-Specific Questioning in Oral Arguments

이 논문은 미국 대법원 구두 변론 기록을 기반으로 AI 가 모의 재판 훈련에서 판사들의 질문을 효과적으로 시뮬레이션할 수 있는지 검증하고, 현실성과 교육적 유용성을 평가하는 새로운 프레임워크를 제시하여 AI 모델이 질문의 다양성 부족과 아첨 성향 등 여전히 해결해야 할 과제가 있음을 밝힙니다.

Kylie Zhang, Nimra Nadeem, Lucia Zheng + 2 more2026-03-06💻 cs

Solving an Open Problem in Theoretical Physics using AI-Assisted Discovery

이 논문은 제미니 딥 싱크 기반의 신경-심볼릭 시스템을 활용하여 우주 끈에서 방출되는 중력파의 파워 스펙트럼에 대한 새로운 정확한 해석적 해를 도출함으로써 인공지능이 이론 물리학의 미해결 문제를 자율적으로 해결하고 수학적 발견을 가속화할 수 있음을 입증합니다.

Michael P. Brenner, Vincent Cohen-Addad, David Woodruff2026-03-06💻 cs

DARE: Aligning LLM Agents with the R Statistical Ecosystem via Distribution-Aware Retrieval

이 논문은 R 통계 생태계의 데이터 분포 정보를 함수 표현에 통합한 경량 검색 모델 DARE 와 이를 활용한 R 코딩 에이전트 RCodingAgent 를 제안하여, 기존 LLM 에이전트의 통계적 지식 부족과 도구 검색의 한계를 극복하고 R 패키지 검색 및 코드 생성 성능을 획기적으로 향상시켰습니다.

Maojun Sun, Yue Wu, Yifei Xie + 5 more2026-03-06💻 cs

HiMAP-Travel: Hierarchical Multi-Agent Planning for Long-Horizon Constrained Travel

이 논문은 예산과 다양성 같은 제약 조건을 가진 장거리 여행 계획 문제를 해결하기 위해, 전략적 조정과 병렬 실행을 결합하고 거래형 모니터링 및 협상 프로토콜을 통해 제약 준수를 보장하는 계층적 다중 에이전트 프레임워크 'HiMAP-Travel'을 제안하며, TravelPlanner 벤치마크에서 기존 Sequential 기반 방법론들을 크게 능가하는 성능을 입증합니다.

The Viet Bui, Wenjun Li, Yong Liu2026-03-06💻 cs

Stacked from One: Multi-Scale Self-Injection for Context Window Extension

이 논문은 동일한 LLM 레이어를 기반으로 하단 모델이 긴 입력을 다중 그레인 표현으로 압축하고 상단 모델이 이를 복원하는 '자기 주입 (self-injection)' 아키텍처를 제안함으로써, 기존 모델의 제한된 컨텍스트 창을 효율적으로 확장하면서도 메모리 사용량과 추론 지연을 획기적으로 줄이는 방법을 제시합니다.

Wei Han, Pan Zhou, Shuicheng Yan2026-03-06💻 cs

TSEmbed: Unlocking Task Scaling in Universal Multimodal Embeddings

이 논문은 Mixture-of-Experts(MoE) 와 Low-Rank Adaptation(LoRA) 을 결합하고 전문가 인식 부정 샘플링 (EANS) 전략을 도입하여 작업 간 충돌을 해소하고 범용 멀티모달 임베딩의 태스크 스케일링을 가능하게 하는 TSEmbed 프레임워크를 제안하며, 이를 통해 MMEB 벤치마크 및 실제 산업 데이터에서 최첨단 성능을 달성했다고 요약할 수 있습니다.

Yebo Wu, Feng Liu, Ziwei Xie + 4 more2026-03-06💻 cs

Breaking Contextual Inertia: Reinforcement Learning with Single-Turn Anchors for Stable Multi-Turn Interaction

이 논문은 다중 턱 상호작용에서 이전 추론에 과도하게 집착하는 '맥락 관성' 문제를 해결하기 위해, 모델의 단일 턱 능력을 안정적 기준점으로 활용하는 강화 학습 기법인 RLSTA 를 제안하여 다양한 도메인에서 성능을 획기적으로 개선함을 보여줍니다.

Xingwu Chen, Zhanqiu Zhang, Yiwen Guo + 1 more2026-03-06💻 cs

Beyond Linear LLM Invocation: An Efficient and Effective Semantic Filter Paradigm

이 논문은 대규모 언어 모델 (LLM) 을 활용한 의미 필터링의 선형적 호출 한계를 극복하기 위해, 튜플을 의미 클러스터로 그룹화하고 샘플링 및 투표 전략을 통해 LLM 호출 횟수를 부분 선형 복잡도로 획기적으로 줄이면서도 정확도를 유지하는 '클러스터링 - 샘플링 - 투표 (CSV)' 프레임워크를 제안합니다.

Nan Hou, Kangfei Zhao, Jiadong Xie + 1 more2026-03-06💻 cs

Beyond the Context Window: A Cost-Performance Analysis of Fact-Based Memory vs. Long-Context LLMs for Persistent Agents

이 논문은 장문맥 LLM 과 사실 기반 메모리 시스템 (Mem0) 을 정확도와 비용 측면에서 비교 분석하여, 대화 길이가 길어질수록 메모리 시스템이 비용 효율성이 높아진다는 결론을 도출하고 생산 환경에서의 최적 아키텍처 선택 기준을 제시합니다.

Natchanon Pollertlam, Witchayut Kornsuwannawit2026-03-06💬 cs.CL

Autoscoring Anticlimax: A Meta-analytic Understanding of AI's Short-answer Shortcomings and Wording Weaknesses

이 논문은 890 개의 결과를 메타 분석하여 단답형 채점에서 LLM 의 성능이 인간 전문가의 난이도 인식과 무관하며, 디코더 전용 아키텍처가 인코더보다 현저히 낮고 토크나이저 어휘 크기 증가에도 한계가 있으며, 고위험 교육 맥락에서 인종 차별적 편향이 발생할 수 있음을 규명했습니다.

Michael Hardy2026-03-06💬 cs.CL

From Unfamiliar to Familiar: Detecting Pre-training Data via Gradient Deviations in Large Language Models

이 논문은 사전 학습 데이터의 학습 과정에서 나타나는 경사도 변화 패턴 (크기, 위치, 활성화 집중도) 을 분석하여 저작권 문제와 벤치마크 오염을 해결하는 새로운 데이터 탐지 방법인 GDS 를 제안하고, 기존 방법보다 뛰어난 성능과 전이성을 입증합니다.

Ruiqi Zhang, Lingxiang Wang, Hainan Zhang + 2 more2026-03-06💬 cs.CL