LBM: Hierarchical Large Auto-Bidding Model via Reasoning and Acting

이 논문은 자동 입찰의 복잡성과 기존 방법의 한계를 해결하기 위해 추론과 행동을 계층적으로 분리하고, 언어와 수치 데이터를 융합하는 이중 임베딩 메커니즘과 환각을 줄이는 GQPO 오프라인 강화 미세조정 기법을 도입한 'LBM'을 제안하여 동적 광고 환경에서 뛰어난 일반화 성능과 효율적인 학습을 달성함을 보여줍니다.

Yewen Li, Zhiyi Lyu, Peng Jiang + 4 more2026-03-06🤖 cs.AI

Feature Resemblance: On the Theoretical Understanding of Analogical Reasoning in Transformers

이 논문은 트랜스포머 모델이 유사한 속성을 가진 엔티티를 유사한 표현으로 인코딩하는 Feature Resemblance 메커니즘을 통해 유추 추론이 어떻게 발현되는지 이론적으로 증명하고, 학습 커리큘럼과 데이터 구조가 추론 능력에 미치는 영향을 15 억 파라미터 모델 실험을 통해 검증했습니다.

Ruichen Xu, Wenjing Yan, Ying-Jun Angela Zhang2026-03-06🤖 cs.LG

C2-Faith: Benchmarking LLM Judges for Causal and Coverage Faithfulness in Chain-of-Thought Reasoning

이 논문은 PRM800K 기반의 C2-Faith 벤치마크를 통해 LLM 판정기가 연쇄 추론의 인과성과 포괄성이라는 두 가지 차원에서 얼마나 신뢰할 수 있는지를 평가하고, 작업 구성에 따른 성능 차이와 오류 탐지 및 국소화 간의 간극 등 판정기의 한계와 활용 가이드라인을 제시합니다.

Avni Mittal, Rauno Arike2026-03-06🤖 cs.AI

Oral to Web: Digitizing 'Zero Resource'Languages of Bangladesh

이 논문은 방글라데시의 42 개 소수 민족 언어 (전체 40 개 언어 중 14 개가 위기에 처함) 에 대해 체계적인 필드워크를 통해 수집된 85,792 개의 텍스트 항목과 약 107 시간의 음성 기록을 포함하는 최초의 국가 규모 다국어 클라우드 코퍼스인 'Multilingual Cloud Corpus'를 소개하고, 이를 통해 구어 중심의 '제로 리소스' 언어를 디지털화하여 언어 문서화, 저자원 NLP, 그리고 디지털 보존에 기여하는 방안을 논의합니다.

Mohammad Mamun Or Rashid2026-03-06💬 cs.CL

Knowledge Divergence and the Value of Debate for Scalable Oversight

이 논문은 principal angles 를 기반으로 지식 발산을 기하학적으로 매개변수화하여 AI 안전을 위한 논쟁 (Debate) 과 RLAIF 간의 정형적 관계를 규명하고, 지식 발산의 정도에 따라 논쟁의 가치가 이차적에서 선형적 영역으로 위상 전이를 일으키며 상호보완적 정보를 가진 모델 간에 단일 에이전트로는 달성할 수 없는 결과를 도출할 수 있음을 증명합니다.

Robin Young2026-03-06🤖 cs.LG

Med-V1: Small Language Models for Zero-shot and Scalable Biomedical Evidence Attribution

이 논문은 고비용의 최첨단 대형 언어 모델과 유사한 성능을 내면서도 효율적인 30 억 파라미터 규모의 소형 언어 모델 'Med-V1'을 개발하여 생물의학 증거 귀속 및 검증, 환각 현상 분석, 임상 가이드라인 오류 식별 등 다양한 실용적 응용을 가능하게 했음을 제시합니다.

Qiao Jin, Yin Fang, Lauren He + 12 more2026-03-06🤖 cs.AI

PersianPunc: A Large-Scale Dataset and BERT-Based Approach for Persian Punctuation Restoration

이 논문은 1,700 만 개의 샘플로 구성된 대규모 PersianPunc 데이터셋을 구축하고, ParsBERT 기반의 경량화 모델이 대규모 언어 모델의 과수정 문제와 높은 계산 비용을 해결하면서도 91.33% 의 높은 F1 점수를 달성하여 실시간 Persian 문장 부호 복원에 효과적임을 입증했습니다.

Mohammad Javad Ranjbar Kalahroodi, Heshaam Faili, Azadeh Shakery2026-03-06🤖 cs.AI

A Multilingual Human Annotated Corpus of Original and Easy-to-Read Texts to Support Access to Democratic Participatory Processes

이 논문은 민주적 참여 과정에 대한 접근성을 지원하기 위해 스페인어, 카탈로니아어, 이탈리아어로 구성된 원문과 인간 전문가가 작성한 쉬운 읽기 (E2R) 텍스트를 포함한 다국어 어휘 코퍼스를 소개하며, 특히 카탈로니아어 최초의 주석 코퍼스를 제공한다는 점을 강조합니다.

Stefan Bott, Verena Riegler, Horacio Saggion + 2 more2026-03-06💬 cs.CL

Exploring the potential and limitations of Model Merging for Multi-Domain Adaptation in ASR

이 논문은 11 가지 병합 알고리즘을 평가하고 TSV-M 기반의 새로운 알고리즘인 BoostedTSV-M 을 제안하여, 유럽 포르투갈어 다중 도메인 ASR 에서 전체 미세 조정보다 우수한 성능과 분포 외 일반화 능력을 단일 모델로 달성하는 모델 병합의 잠재력을 입증합니다.

Carlos Carvalho, Francisco Teixeira, Thomas Rolland + 1 more2026-03-06💬 cs.CL

DiSCTT: Consensus-Guided Self-Curriculum for Efficient Test-Time Adaptation in Reasoning

이 논문은 다양한 추론 문제의 난이도와 불확실성을 고려하여 일관된 답변이 높은 샘플에는 지도 미세조정을, 낮은 샘플에는 일관성 정규화를 적용한 강화학습을 동적으로 수행함으로써 추론 성능을 효율적으로 향상시키는 새로운 테스트 시간 적응 프레임워크인 DiSCTT 를 제안합니다.

Mohammad Mahdi Moradi, Sudhir Mudur2026-03-06💬 cs.CL