cs.CL 편의 논문 | Gist.Science

Constructing Synthetic Instruction Datasets for Improving Reasoning in Domain-Specific LLMs: A Case Study in the Japanese Financial Domain

이 논문은 도메인별 전문 용어를 기반으로 고품질의 합성 지시 데이터 (CoT 포함) 를 구축하는 일반적 방법을 제안하고, 이를 일본 금융 도메인에 적용하여 95 억 토큰 규모의 데이터셋을 생성한 결과, 베이스라인 모델 대비 금융 벤치마크 성능이 향상됨을 입증하고 관련 모델과 데이터를 오픈소스로 공개했습니다.

Yuma Okochi, Fabio Milentiansen Sim, Tomoyasu Okada2026-03-03💬 cs.CL

NM-DEKL $^3_\infty$ : A Three-Layer Non-Monotone Evolving Dependent Type Logic

이 논문은 동적 환경에서 진화하는 지식을 형식화하기 위해 계산, 구성적 지식, 명제적 지식의 세 계층 구조를 가진 새로운 종속 타입 시스템인 NM-DEKL $^3_\infty$ 를 제안하고, 그 문법과 의미론을 정의하며 초기 모델 구성을 통해 건전성과 방정식 완전성을 증명하고 $\mu$ -계산에 대한 임베딩 및 비동형 불변 속성의 표현 가능성을 포함하는 엄격한 표현력 포함 관계를 규명합니다.

Peng Chen2026-03-03💬 cs.CL

DARS: Dysarthria-Aware Rhythm-Style Synthesis for ASR Enhancement

이 논문은 정상 및 구음장애 발화 간의 대비적 선호도를 기반으로 리듬 예측기를 최적화하고 병리적 음향 스타일을 시뮬레이션하는 'DARS' 프레임워크를 제안하여, 합성 구음장애 발화 데이터를 활용한 Whisper 기반 자동음성인식 시스템의 단어오류율을 기존 최선 방법 대비 54.22% 상대적으로 감소시켰음을 보여줍니다.

Minghui Wu, Xueling Liu, Jiahuan Fan + 3 more2026-03-03💬 cs.CL

End-to-End Simultaneous Dysarthric Speech Reconstruction with Frame-Level Adaptor and Multiple Wait-k Knowledge Distillation

이 논문은 프레임 레벨 어댑터와 다중 웨이트-k 지식 증류를 통해 지연 시간을 줄이고 ASR 오류에 대한 내성을 강화하며, UASpeech 데이터셋에서 기존 최첨단 모델 대비 54.25% 의 단어 오류율 감소와 4.67 점의 MOS 를 달성한 엔드 - 투 - 엔드 동시 구 dysarthria 음성 재구성 시스템을 제안합니다.

Minghui Wu, Haitao Tang, Jiahuan Fan + 2 more2026-03-03💬 cs.CL

Toward Graph-Tokenizing Large Language Models with Reconstructive Graph Instruction Tuning

이 논문은 기존 그래프 토큰화 LLM 의 텍스트 편향을 해결하기 위해 그래프 정보를 명시적으로 재구성하는 '재구성 그래프 지시 미세조정 (RGLM)' 파이프라인을 제안하고, 이를 통해 그래프와 텍스트 간의 정렬 효과를 이론적으로 증명하고 실험적으로 검증합니다.

Zhongjian Zhang, Xiao Wang, Mengmei Zhang + 2 more2026-03-03💬 cs.CL

SciDER: Scientific Data-centric End-to-end Researcher

SciDER 는 실험에서 수집된 원시 데이터를 자동으로 처리하고 가설을 생성하며 코드를 실행하는 데이터 중심의 종단 간 과학 연구 자동화 시스템으로, 자기 진화 메모리와 비판자 피드백 루프를 통해 기존 모델보다 우수한 성능을 입증했습니다.

Ke Lin, Yilin Lu, Shreyas Bhat + 3 more2026-03-03💬 cs.CL

Quantifying Conversational Reliability of Large Language Models under Multi-Turn Interaction

이 논문은 대규모 언어 모델 (LLM) 이 실제 환경에서 다중 턴 대화를 수행할 때 신뢰성이 현저히 저하된다는 것을 체계적으로 평가하고, 지시 이탈 및 의도 혼란 등 주요 실패 요인을 규명하여 신뢰할 수 있는 배포를 위한 강화된 평가 방법의 필요성을 강조합니다.

Jiyoon Myung2026-03-03💬 cs.CL

LaSER: Internalizing Explicit Reasoning into Latent Space for Dense Retrieval

이 논문은 LLM 의 추론 능력을 활용하면서도 지연 시간을 줄이기 위해 명시적 추론 과정을 잠재 공간에 내재화하는 새로운 자기 증류 프레임워크인 LaSER 를 제안하여, 밀도 기반 검색의 성능과 효율성을 동시에 향상시킵니다.

Jiajie Jin, Yanzhao Zhang, Mingxin Li + 4 more2026-03-03💬 cs.CL

Understanding the Physics of Key-Value Cache Compression for LLMs through Attention Dynamics

이 논문은 KV 캐시 압축을 단순한 저장 공간 최적화가 아닌 어텐션 라우팅의 물리적 관점에서 재해석하여, 90% 압축 시 발생하는 의미적 접근성 붕괴와 모델별 라우팅 역학의 차이가 장기 컨텍스트 확장성의 핵심 한계임을 규명합니다.

Samhruth Ananthanarayanan, Ayan Sengupta, Tanmoy Chakraborty2026-03-03💬 cs.CL

Enhancing Persona Following at Decoding Time via Dynamic Importance Estimation for Role-Playing Agents

이 논문은 역할 수행 에이전트의 상황 의존적 특성을 반영하기 위해 심리학 이론에 기반하여 맥락에 따라 역할 중요도를 동적으로 추정하고 이를 추론 시간의 가중치 보상 안내 디코딩에 통합하는 '역할 동적 디코딩 (PDD)' 프레임워크를 제안하여, 기존 고정된 프롬프트나 비용이 많이 드는 파인튜닝의 한계를 극복하고 더 높은 일관성과 충실도를 달성함을 보여줍니다.

Yuxin Liu, Mingye Zhu, Siyuan Liu + 2 more2026-03-03💬 cs.CL

From Verbatim to Gist: Distilling Pyramidal Multimodal Memory via Semantic Information Bottleneck for Long-Horizon Video Agents

이 논문은 인간의 인지 효율성을 모방하기 위해 퍼지-트레이스 이론에 기반한 MM-Mem 을 제안하여, 멀티모달 비디오 에이전트가 장시간의 비디오를 이해할 때 발생하는 문맥 제한과 기억 한계를 해결하고, 의미 정보 병목 원리를 통해 정밀한 지각 정보를 고차원적 의미 스키마로 점진적으로 압축·추출하는 새로운 메모리 아키텍처를 제시합니다.

Niu Lian, Yuting Wang, Hanshu Yao + 5 more2026-03-03💬 cs.CL

Power Echoes: Investigating Moderation Biases in Online Power-Asymmetric Conflicts

이 논문은 온라인 권력 불균형 갈등 상황에서 인간 중재자가 보이는 권력 편향과 AI 제안이 이에 미치는 영향을 실증적으로 분석하여, 인간과 AI 의 협력적 중재 시스템에 대한 통찰을 제시합니다.

Yaqiong Li, Peng Zhang, Peixu Hou + 7 more2026-03-03💬 cs.CL

ProtRLSearch: A Multi-Round Multimodal Protein Search Agent with Large Language Models Trained via Reinforcement Learning

이 논문은 단백질 서열과 텍스트를 통합한 멀티모달 입력과 다차원 보상 기반 강화학습을 통해 다중 라운드 단백질 검색 에이전트 'ProtRLSearch'를 제안하고, 이를 평가하기 위해 3,000 개의 다중 선택지 질문으로 구성된 벤치마크 'ProtMCQs'를 구축한 연구입니다.

Congying Liu, Taihao Li, Ming Huang + 5 more2026-03-03💬 cs.CL

← 이전 다음 →

cs.CL

Constructing Synthetic Instruction Datasets for Improving Reasoning in Domain-Specific LLMs: A Case Study in the Japanese Financial Domain

NM-DEKL $^3_\infty$ : A Three-Layer Non-Monotone Evolving Dependent Type Logic

DARS: Dysarthria-Aware Rhythm-Style Synthesis for ASR Enhancement

End-to-End Simultaneous Dysarthric Speech Reconstruction with Frame-Level Adaptor and Multiple Wait-k Knowledge Distillation

Toward Graph-Tokenizing Large Language Models with Reconstructive Graph Instruction Tuning

SciDER: Scientific Data-centric End-to-end Researcher

Quantifying Conversational Reliability of Large Language Models under Multi-Turn Interaction

LaSER: Internalizing Explicit Reasoning into Latent Space for Dense Retrieval

Understanding the Physics of Key-Value Cache Compression for LLMs through Attention Dynamics

Enhancing Persona Following at Decoding Time via Dynamic Importance Estimation for Role-Playing Agents

From Verbatim to Gist: Distilling Pyramidal Multimodal Memory via Semantic Information Bottleneck for Long-Horizon Video Agents

Power Echoes: Investigating Moderation Biases in Online Power-Asymmetric Conflicts

ProtRLSearch: A Multi-Round Multimodal Protein Search Agent with Large Language Models Trained via Reinforcement Learning

Anatomy of the Modality Gap: Dissecting the Internal States of End-to-End Speech LLMs

R2GenCSR: Mining Contextual and Residual Information for LLMs-based Radiology Report Generation

CowPilot: A Framework for Autonomous and Human-Agent Collaborative Web Navigation

FinBloom: Knowledge Grounding Large Language Model with Real-time Financial Data

What Makes a Reward Model a Good Teacher? An Optimization Perspective

TWSSenti: A Novel Hybrid Framework for Topic-Wise Sentiment Analysis on Social Media Using Transformer Models

FineScope : SAE-guided Data Selection Enables Domain Specific LLM Pruning and Finetuning

cs.CL

Constructing Synthetic Instruction Datasets for Improving Reasoning in Domain-Specific LLMs: A Case Study in the Japanese Financial Domain

NM-DEKL∞3^3_\infty∞3​: A Three-Layer Non-Monotone Evolving Dependent Type Logic

DARS: Dysarthria-Aware Rhythm-Style Synthesis for ASR Enhancement

End-to-End Simultaneous Dysarthric Speech Reconstruction with Frame-Level Adaptor and Multiple Wait-k Knowledge Distillation

Toward Graph-Tokenizing Large Language Models with Reconstructive Graph Instruction Tuning

SciDER: Scientific Data-centric End-to-end Researcher

Quantifying Conversational Reliability of Large Language Models under Multi-Turn Interaction

LaSER: Internalizing Explicit Reasoning into Latent Space for Dense Retrieval

Understanding the Physics of Key-Value Cache Compression for LLMs through Attention Dynamics

Enhancing Persona Following at Decoding Time via Dynamic Importance Estimation for Role-Playing Agents

From Verbatim to Gist: Distilling Pyramidal Multimodal Memory via Semantic Information Bottleneck for Long-Horizon Video Agents

Power Echoes: Investigating Moderation Biases in Online Power-Asymmetric Conflicts

ProtRLSearch: A Multi-Round Multimodal Protein Search Agent with Large Language Models Trained via Reinforcement Learning

Anatomy of the Modality Gap: Dissecting the Internal States of End-to-End Speech LLMs

R2GenCSR: Mining Contextual and Residual Information for LLMs-based Radiology Report Generation

CowPilot: A Framework for Autonomous and Human-Agent Collaborative Web Navigation

FinBloom: Knowledge Grounding Large Language Model with Real-time Financial Data

What Makes a Reward Model a Good Teacher? An Optimization Perspective

TWSSenti: A Novel Hybrid Framework for Topic-Wise Sentiment Analysis on Social Media Using Transformer Models

FineScope : SAE-guided Data Selection Enables Domain Specific LLM Pruning and Finetuning

NM-DEKL $^3_\infty$ : A Three-Layer Non-Monotone Evolving Dependent Type Logic