AILS-NTUA at SemEval-2026 Task 3: Efficient Dimensional Aspect-Based Sentiment Analysis

이 논문은 다국어 및 다도메인 환경에서 차원 기반 감정 분석의 세 가지 하위 과제를 효율적으로 해결하기 위해 언어별 인코더 미세 조정과 LoRA 기반 대규모 언어 모델 지시 미세 조정을 결합한 AILS-NTUA 시스템을 제안하고, 이를 통해 베이스라인을 능가하는 경쟁력 있는 성능을 입증합니다.

Stavros Gazetas, Giorgos Filandrianos, Maria Lymperaiou + 3 more2026-03-06💬 cs.CL

Federated Heterogeneous Language Model Optimization for Hybrid Automatic Speech Recognition

이 논문은 프라이버시를 보호하는 분산형 자동 음성 인식 시스템을 위해 이질적인 언어 모델을 효과적으로 통합하기 위해 유전 알고리즘과 강화 학습을 기반으로 한 '매치 앤 머지' 패러다임을 제안하고, 이를 통해 기존 방법보다 빠른 수렴 속도와 우수한 일반화 성능을 입증했습니다.

Mengze Hong, Yi Gu, Di Jiang + 4 more2026-03-06💬 cs.CL

Mixture of Universal Experts: Scaling Virtual Width via Depth-Width Transformation

이 논문은 MoE 아키텍처의 확장성 한계를 극복하기 위해 고정된 토큰 활성화 예산 하에서 깊이를 가상 너비로 변환하는 '가상 너비'라는 새로운 차원을 도입한 '범용 전문가 혼합 (MOUE)'을 제안하며, 이를 통해 기존 MoE 모델 대비 성능을 향상시키고 확장 가능한 새로운 아키텍처를 제시합니다.

Yilong Chen, Naibin Gu, Junyuan Shang + 8 more2026-03-06🤖 cs.AI

ThaiSafetyBench: Assessing Language Model Safety in Thai Cultural Contexts

이 논문은 영어 중심의 안전 평가에서 소외된 태국어와 태국 문화를 반영한 위험을 평가하기 위해 태국어 악성 프롬프트 1,954 개로 구성된 오픈소스 벤치마크 'ThaiSafetyBench'와 관련 분류기, 리더보드를 소개하고, 이를 통해 오픈소스 모델의 안전성 취약점과 문화적 맥락 공격의 높은 성공률을 규명했습니다.

Trapoom Ukarapol, Nut Chukamphaeng, Kunat Pipatanakul + 1 more2026-03-06💬 cs.CL

MUTEX: Leveraging Multilingual Transformers and Conditional Random Fields for Enhanced Urdu Toxic Span Detection

이 논문은 토큰 수준의 주석이 달린 데이터셋을 활용하여 XLM-RoBERTa 와 CRF 를 결합한 MUTEX 모델을 제안함으로써, 기존 문장 단위 분류의 한계를 극복하고 우르두어 독성 스팬 탐지 분야에서 최초의 지도 학습 베이스라인을 확립했다는 점을 강조합니다.

Inayat Arshad, Fajar Saleem, Ijaz Hussain2026-03-06🤖 cs.AI

ARC-TGI: Human-Validated Task Generators with Reasoning Chain Templates for ARC-AGI

이 논문은 과적합과 데이터 누출 문제를 해결하고 인간이 해결 가능한 추론 규칙을 보장하기 위해, 자연어 추론 체인과 부분 평가 코드를 갖춘 461 개의 인간 검증 작업 생성기 (ARC-TGI) 를 개발하여 ARC-AGI 벤치마크의 확장 가능한 데이터 샘플링과 통제된 평가를 가능하게 했음을 소개합니다.

Jens Lehmann, Syeda Khushbakht, Nikoo Salehfard + 4 more2026-03-06🤖 cs.AI

LBM: Hierarchical Large Auto-Bidding Model via Reasoning and Acting

이 논문은 자동 입찰의 복잡성과 기존 방법의 한계를 해결하기 위해 추론과 행동을 계층적으로 분리하고, 언어와 수치 데이터를 융합하는 이중 임베딩 메커니즘과 환각을 줄이는 GQPO 오프라인 강화 미세조정 기법을 도입한 'LBM'을 제안하여 동적 광고 환경에서 뛰어난 일반화 성능과 효율적인 학습을 달성함을 보여줍니다.

Yewen Li, Zhiyi Lyu, Peng Jiang + 4 more2026-03-06🤖 cs.AI