RexDrug: Reliable Multi-Drug Combination Extraction through Reasoning-Enhanced LLMs
이 논문은 대규모 언어 모델의 추론 능력을 강화하고 다중 에이전트 협업 및 강화 학습을 통해 복잡한 n-항 약물 조합을 정확하게 추출하는 'RexDrug' 프레임워크를 제안하며, 이를 통해 정밀 의학과 약리학 연구에 필요한 대규모 생물의학 문헌 분석의 신뢰성을 높였습니다.
1072 편의 논문
이 논문은 대규모 언어 모델의 추론 능력을 강화하고 다중 에이전트 협업 및 강화 학습을 통해 복잡한 n-항 약물 조합을 정확하게 추출하는 'RexDrug' 프레임워크를 제안하며, 이를 통해 정밀 의학과 약리학 연구에 필요한 대규모 생물의학 문헌 분석의 신뢰성을 높였습니다.
이 논문은 영어, 중국어, 독일어, 프랑스어, 우르두어 등 5 개 언어를 대상으로 한 실험을 통해, 명시적 추론보다 잠재 공간에서의 연속적 추론 (Continuous CoT) 이 저자원 언어와 제로샷 설정에서 더 강력한 성능을 보이며 추론 과정을 29 배에서 50 배까지 압축하는 효율적인 다국어 추론 해결책임을 입증했습니다.
이 논문은 데이터 불균형을 해결하기 위해 커리큘럼 학습과 데이터 업샘플링을 결합하여 34 개 유럽 언어, 특히 발트어 및 슬라브어 계열 언어에서 기존 오픈 가중치 모델보다 우수한 성능을 보이며 계산 자원을 효율적으로 활용한 300 억 파라미터 오픈 소스 LLM 인 'TildeOpen'을 소개합니다.
이 논문은 과학적 논문 내 도구 언급과 워크플로우 코드 내 도구 호출을 연결하여 생물의학 워크플로우의 재현성을 향상시키기 위해, 명명 개체 인식 (NER) 과 엔티티 링크링 기술을 통합한 자동화 접근법인 'CoPaLink'를 제안하고 그 유효성을 검증합니다.
이 논문은 기존 PII 제거 기술에 대한 공격 연구가 데이터 유출과 오염 문제로 인해 과장된 결과를 보일 수 있음을 비판적으로 분석하며, 진정한 사생활 보호가 가능한 데이터 접근의 어려움으로 인해 해당 기술의 신뢰성 있는 평가가 현재 불가능하다고 주장합니다.
이 논문은 두 채널의 대화 오디오를 기반으로 한 생성적 사전 학습을 통해 자연스러운 턴-테이킹을 학습하고 해석 가능한 에이전트 행동을 예측하는 'DualTurn' 모델을 제안하여, 기존 음성 파이프라인의 비자연스러운 턴 전환 문제를 해결하고 성능을 크게 향상시켰음을 보여줍니다.
이 논문은 말초언어적 음성 작업에서 언어 간 전이 효과를 체계적으로 정량화하기 위해 '교차 언어 전이 행렬 (CLTM)'을 제안하고, HuBERT 기반 인코더를 활용한 실험을 통해 작업과 언어에 따라 체계적이고 언어 의존적인 전이 패턴이 존재함을 규명했습니다.
이 논문은 토큰, 궤적, 도메인 등 다양한 수준의 안정성 제어를 통합하기 위해 신뢰 영역 이론과 대수적 구조를 결합한 새로운 정책 최적화 프레임워크인 'Fibration Policy Optimization (FiberPO)'을 제안합니다.
이 논문은 트랜스포머 모델의 설명이 학습 무작위성에 민감하게 반응하는 정도가 문맥, 클래스, 작업에 따라 통계적으로 유의미하게 달라지며, 그 영향력이 작업에서 가장 크고 문맥에서 가장 작음을 규명합니다.
이 논문은 실제 오디오와 정지 얼굴 이미지를 동기화하여 합성된 시각 데이터를 생성함으로써, 시각적 자료가 전혀 없는 언어에서도 오디오만 사용하는 모델보다 우수한 성능을 보이는 오디오비주얼 음성 인식 (AVSR) 모델을 구축할 수 있음을 입증했습니다.
이 논문은 문제 난이도에 따라 추론 전략을 동적으로 조정하는 'CoFiCot' 프레임워크를 제안하여, 단순한 질의에는 효율적인 집합을 적용하고 복잡한 질의에는 이전 수정 이력을 기반으로 한 상태 의존적 정밀 보정 루프를 통해 LLM 의 추론 능력을 극대화합니다.
이 논문은 NCL-UoR 팀이 SemEval-2026 Task 5 에 참여하여 임베딩 기반 방법, 파인튜닝, 그리고 구조화된 프롬프트를 활용한 LLM 을 비교한 결과, 모델 규모보다 프롬프트 설계가 더 중요하며 구조화된 프롬프트와 명시적 의사결정 규칙을 적용한 접근법이 가장 우수한 성능을 보였음을 보고합니다.
이 논문은 RIKER 평가 방법론을 통해 1720 억 토큰 규모의 대규모 실험을 수행한 결과, 문서 기반 질문응답에서 LLM 의 환각 발생률이 컨텍스트 길이에 따라 급증하며 모델 선택이 가장 중요한 요인이지만, 온도 설정은 정확도와 생성 무한루프 발생률 간에 복잡한 상충 관계를 보인다는 것을 밝혔습니다.
이 논문은 문화적 안전성과 지식을 분리된 요소가 아닌 통합된 관점에서 접근하기 위해 정교하게 검증된 대규모 데이터셋 'AdaCultureSafe'를 구축하고, 기존 대형 언어 모델에서 두 요소 간 상관관계가 부재함을 규명한 후, 지식을 응답 생성 과정에 통합하는 새로운 방법을 제안하여 문화적 안전성을 획기적으로 향상시키는 연구입니다.
이 논문은 EPSRC 제안서를 대상으로 구조적 변형을 통해 LLM 기반 심사 방식을 평가한 결과, 섹션 단위 분석이 가장 효과적이었으나 현재 LLM 은 명확성 결함을 놓치고 순응성 확인에 치우쳐 고위험 평가에서는 보조적 역할만 수행할 수 있음을 밝혔습니다.
이 논문은 다중 모달 및 언어 중립적 문장 임베딩과 개체명 주입 메커니즘을 결합한 'SBARThez'라는 새로운 프레임워크를 제안하여, 특히 저자원 언어와 다국어 환경에서 사실적 일관성을 높이고 더 간결한 추상적 요약을 생성하는 것을 목표로 합니다.
이 논문은 LLM 기반 자동 주석과 인간 검증 프로세스를 결합하여 미국 연방 대법원 및 텍사스 형사 상고 판례에서 구축된 대규모 법률 논증 마이닝 코퍼스 LAMUS 를 소개하고, 체인 오브 씽킹 프롬프팅이 모델 성능을 크게 향상시킨다는 것을 입증합니다.
이 논문은 단일 음성 기반 모델을 통해 의미 및 화자 표현 등 다양한 발화 수준 속성 표현을 동시에 학습할 수 있는 통합 후학습 프레임워크를 제안하고, 이를 다국어 음성 검색 및 화자 인식 작업에서 효과적으로 검증했습니다.
이 논문은 VLM 기반 GUI 에이전트의 응답 효율성을 저해하는 새로운 백도어 공격 'SlowBA'를 제안하며, 특정 트리거 패턴 하에서 과도한 추론 체인을 유도하여 응답 지연을 발생시키는 메커니즘과 이를 위한 강화학습 기반의 이단계 주입 전략을 소개합니다.
이 논문은 방대한 문서 코퍼스를 대상으로 복잡한 질문에 답할 때 표준 RAG 의 증거 부족과 장문맥 LLM 의 추론 한계를 해결하기 위해, 각 문서를 전용 에이전트가 처리하고 조정자가 이를 통합하는 계층적 다중 에이전트 프레임워크인 SPD-RAG 를 제안하며, LOONG 벤치마크에서 기존 방법보다 높은 정확도와 비용 효율성을 입증했습니다.