cs.CL 편의 논문 | Gist.Science

RexDrug: Reliable Multi-Drug Combination Extraction through Reasoning-Enhanced LLMs

이 논문은 대규모 언어 모델의 추론 능력을 강화하고 다중 에이전트 협업 및 강화 학습을 통해 복잡한 n-항 약물 조합을 정확하게 추출하는 'RexDrug' 프레임워크를 제안하며, 이를 통해 정밀 의학과 약리학 연구에 필요한 대규모 생물의학 문헌 분석의 신뢰성을 높였습니다.

Zhijun Wang, Ling Luo, Dinghao Pan, Huan Zhuang, Lejing Yu, Yuanyuan Sun, Hongfei Lin2026-03-10💬 cs.CL

Is continuous CoT better suited for multi-lingual reasoning?

이 논문은 영어, 중국어, 독일어, 프랑스어, 우르두어 등 5 개 언어를 대상으로 한 실험을 통해, 명시적 추론보다 잠재 공간에서의 연속적 추론 (Continuous CoT) 이 저자원 언어와 제로샷 설정에서 더 강력한 성능을 보이며 추론 과정을 29 배에서 50 배까지 압축하는 효율적인 다국어 추론 해결책임을 입증했습니다.

Ali Hamza Bashir, Behzad Shomali, Markus Frey, Mehdi Ali, Rafet Sifa, David Berghaus2026-03-10🤖 cs.LG

TildeOpen LLM: Leveraging Curriculum Learning to Achieve Equitable Language Representation

이 논문은 데이터 불균형을 해결하기 위해 커리큘럼 학습과 데이터 업샘플링을 결합하여 34 개 유럽 언어, 특히 발트어 및 슬라브어 계열 언어에서 기존 오픈 가중치 모델보다 우수한 성능을 보이며 계산 자원을 효율적으로 활용한 300 억 파라미터 오픈 소스 LLM 인 'TildeOpen'을 소개합니다.

Toms Bergmanis, Martins Kronis, Ingus J\=anis Pretkalninš, D\=avis Nicmanis, Jelizaveta Jelinska, Roberts Rozis, Rinalds V\=iksna, M\=arcis Pinnis2026-03-10💬 cs.CL

Supporting Workflow Reproducibility by Linking Bioinformatics Tools across Papers and Executable Code

이 논문은 과학적 논문 내 도구 언급과 워크플로우 코드 내 도구 호출을 연결하여 생물의학 워크플로우의 재현성을 향상시키기 위해, 명명 개체 인식 (NER) 과 엔티티 링크링 기술을 통합한 자동화 접근법인 'CoPaLink'를 제안하고 그 유효성을 검증합니다.

Clémence Sebe, Olivier Ferret, Aurélie Névéol, Mahdi Esmailoghli, Ulf Leser, Sarah Cohen-Boulakia2026-03-10💬 cs.CL

The Conundrum of Trustworthy Research on Attacking Personally Identifiable Information Removal Techniques

이 논문은 기존 PII 제거 기술에 대한 공격 연구가 데이터 유출과 오염 문제로 인해 과장된 결과를 보일 수 있음을 비판적으로 분석하며, 진정한 사생활 보호가 가능한 데이터 접근의 어려움으로 인해 해당 기술의 신뢰성 있는 평가가 현재 불가능하다고 주장합니다.

Sebastian Ochs, Ivan Habernal2026-03-10💬 cs.CL

DualTurn: Learning Turn-Taking from Dual-Channel Generative Speech Pretraining

이 논문은 두 채널의 대화 오디오를 기반으로 한 생성적 사전 학습을 통해 자연스러운 턴-테이킹을 학습하고 해석 가능한 에이전트 행동을 예측하는 'DualTurn' 모델을 제안하여, 기존 음성 파이프라인의 비자연스러운 턴 전환 문제를 해결하고 성능을 크게 향상시켰음을 보여줍니다.

Shangeth Rajaa2026-03-10💬 cs.CL

Quantifying Cross-Lingual Transfer in Paralinguistic Speech Tasks

이 논문은 말초언어적 음성 작업에서 언어 간 전이 효과를 체계적으로 정량화하기 위해 '교차 언어 전이 행렬 (CLTM)'을 제안하고, HuBERT 기반 인코더를 활용한 실험을 통해 작업과 언어에 따라 체계적이고 언어 의존적인 전이 패턴이 존재함을 규명했습니다.

Pol Buitrago, Oriol Pareras, Federico Costa, Javier Hernando2026-03-10💬 cs.CL

Fibration Policy Optimization

이 논문은 토큰, 궤적, 도메인 등 다양한 수준의 안정성 제어를 통합하기 위해 신뢰 영역 이론과 대수적 구조를 결합한 새로운 정책 최적화 프레임워크인 'Fibration Policy Optimization (FiberPO)'을 제안합니다.

Chang Li, Tshihao Tsu, Yaren Zhang, Chao Xue, Xiaodong He2026-03-10🤖 cs.LG

Sensivity of LLMs' Explanations to the Training Randomness:Context, Class & Task Dependencies

이 논문은 트랜스포머 모델의 설명이 학습 무작위성에 민감하게 반응하는 정도가 문맥, 클래스, 작업에 따라 통계적으로 유의미하게 달라지며, 그 영향력이 작업에서 가장 크고 문맥에서 가장 작음을 규명합니다.

Romain Loncour, Jérémie Bogaert, François-Xavier Standaert2026-03-10💬 cs.CL

Bootstrapping Audiovisual Speech Recognition in Zero-AV-Resource Scenarios with Synthetic Visual Data

이 논문은 실제 오디오와 정지 얼굴 이미지를 동기화하여 합성된 시각 데이터를 생성함으로써, 시각적 자료가 전혀 없는 언어에서도 오디오만 사용하는 모델보다 우수한 성능을 보이는 오디오비주얼 음성 인식 (AVSR) 모델을 구축할 수 있음을 입증했습니다.

Pol Buitrago, Pol Gàlvez, Oriol Pareras, Javier Hernando2026-03-10💬 cs.CL

Not All Queries Need Deep Thought: CoFiCot for Adaptive Coarse-to-fine Stateful Refinement

이 논문은 문제 난이도에 따라 추론 전략을 동적으로 조정하는 'CoFiCot' 프레임워크를 제안하여, 단순한 질의에는 효율적인 집합을 적용하고 복잡한 질의에는 이전 수정 이력을 기반으로 한 상태 의존적 정밀 보정 루프를 통해 LLM 의 추론 능력을 극대화합니다.

Dongxu Zhang, Hongqiang Lin, Yiding Sun, Pengyu Wang, Qirui Wang, Ning Yang, Jihua Zhu2026-03-10💬 cs.CL

NCL-UoR at SemEval-2026 Task 5: Embedding-Based Methods, Fine-Tuning, and LLMs for Word Sense Plausibility Rating

이 논문은 NCL-UoR 팀이 SemEval-2026 Task 5 에 참여하여 임베딩 기반 방법, 파인튜닝, 그리고 구조화된 프롬프트를 활용한 LLM 을 비교한 결과, 모델 규모보다 프롬프트 설계가 더 중요하며 구조화된 프롬프트와 명시적 의사결정 규칙을 적용한 접근법이 가장 우수한 성능을 보였음을 보고합니다.

Tong Wu, Thanet Markchom, Huizhi Liang2026-03-10💬 cs.CL

How Much Do LLMs Hallucinate in Document Q&A Scenarios? A 172-Billion-Token Study Across Temperatures, Context Lengths, and Hardware Platforms

이 논문은 RIKER 평가 방법론을 통해 1720 억 토큰 규모의 대규모 실험을 수행한 결과, 문서 기반 질문응답에서 LLM 의 환각 발생률이 컨텍스트 길이에 따라 급증하며 모델 선택이 가장 중요한 요인이지만, 온도 설정은 정확도와 생성 무한루프 발생률 간에 복잡한 상충 관계를 보인다는 것을 밝혔습니다.

JV Roig2026-03-10💬 cs.CL

← 이전 다음 →

cs.CL

RexDrug: Reliable Multi-Drug Combination Extraction through Reasoning-Enhanced LLMs

Is continuous CoT better suited for multi-lingual reasoning?

TildeOpen LLM: Leveraging Curriculum Learning to Achieve Equitable Language Representation

Supporting Workflow Reproducibility by Linking Bioinformatics Tools across Papers and Executable Code

The Conundrum of Trustworthy Research on Attacking Personally Identifiable Information Removal Techniques

DualTurn: Learning Turn-Taking from Dual-Channel Generative Speech Pretraining

Quantifying Cross-Lingual Transfer in Paralinguistic Speech Tasks

Fibration Policy Optimization

Sensivity of LLMs' Explanations to the Training Randomness:Context, Class & Task Dependencies

Bootstrapping Audiovisual Speech Recognition in Zero-AV-Resource Scenarios with Synthetic Visual Data

Not All Queries Need Deep Thought: CoFiCot for Adaptive Coarse-to-fine Stateful Refinement

NCL-UoR at SemEval-2026 Task 5: Embedding-Based Methods, Fine-Tuning, and LLMs for Word Sense Plausibility Rating

How Much Do LLMs Hallucinate in Document Q&A Scenarios? A 172-Billion-Token Study Across Temperatures, Context Lengths, and Hardware Platforms

AdaCultureSafe: Adaptive Cultural Safety Grounded by Cultural Knowledge in Large Language Models

Evaluating LLM-Based Grant Proposal Review via Structured Perturbations

Using Multimodal and Language-Agnostic Sentence Embeddings for Abstractive Summarization

LAMUS: A Large-Scale Corpus for Legal Argument Mining from U.S. Caselaw using LLMs

Learning Multiple Utterance-Level Attribute Representations with a Unified Speech Encoder

SlowBA: An efficiency backdoor attack towards VLM-based GUI agents

SPD-RAG: Sub-Agent Per Document Retrieval-Augmented Generation