cs.AI 편의 논문 | Gist.Science

Benchmarking LLMs for Pairwise Causal Discovery in Biomedical and Multi-Domain Contexts

이 논문은 13 개의 오픈소스 대규모 언어 모델 (LLM) 을 12 개의 다양한 데이터셋으로 평가하여, 현재 모델들이 명시적이고 단순한 인과 관계는 식별할 수 있으나 암시적이거나 복잡한 인과 관계 추출에서는 심각한 성능 저하를 보임을 밝히고, 이를 위한 통합 평가 프레임워크와 리소스를 공개했습니다.

Sydney Anuyah, Sneha Shajee-Mohan, Ankit-Singh Chauhan + 1 more2026-03-13💬 cs.CL

WideSeek-R1: Exploring Width Scaling for Broad Information Seeking via Multi-Agent Reinforcement Learning

이 논문은 수직적 확장 (깊이) 에 집중해 온 기존 LLM 접근법의 한계를 넘어, 다중 에이전트 강화학습을 통해 병렬 실행과 확장 가능한 오케스트레이션을 가능하게 하는 'WideSeek-R1'을 제안하여, 4B 파라미터 모델이 671B 단일 에이전트 모델과 comparable 한 성능을 내며 폭넓은 정보 검색 과제를 효과적으로 해결함을 보여줍니다.

Zelai Xu, Zhexuan Xu, Ruize Zhang, Chunyang Zhu, Shi Yu, Weilin Liu, Quanlu Zhang, Wenbo Ding, Chao Yu, Yu Wang2026-03-13🤖 cs.AI

Evolving Beyond Snapshots: Harmonizing Structure and Sequence via Entity State Tuning for Temporal Knowledge Graph Forecasting

이 논문은 기존 방법의 장기 의존성 손실 문제를 해결하기 위해, 구조적 의존성과 시간적 진화를 조화시키며 엔티티 상태를 지속적으로 업데이트하는 '엔티티 상태 튜닝 (EST)' 프레임워크를 제안하고, 이를 통해 다양한 백본 모델에서 최첨단 성능을 달성함을 보여줍니다.

Siyuan Li, Yunjia Wu, Yiyong Xiao, Pingyang Huang, Peize Li, Ruitong Liu, Yan Wen, Te Sun, Fangyi Pei2026-03-13💬 cs.CL

Consistency of Large Reasoning Models Under Multi-Turn Attacks

이 논문은 추론 능력이 복잡한 작업에서 최첨단 성능을 내지만, 다중 턱 공격 하에서는 여전히 취약하며 기존 방어 기법이 실패하는 등 추론 모델의 내구성을 재평가하고 새로운 방어 전략의 필요성을 강조합니다.

Yubo Li, Ramayya Krishnan, Rema Padman2026-03-13💬 cs.CL

ResearchGym: Evaluating Language Model Agents on Real-World AI Research

이 논문은 ICML, ICLR, ACL 의 기존 연구들을 재구성하여 에이전트가 실험을 설계하고 수행하며 기존 인간 베이스라인을 능가할 수 있는지 평가하는 'ResearchGym' 벤치마크를 소개하며, 최신 AI 에이전트가 뛰어난 잠재력을 보임에도 불구하고 신뢰성 부족과 장기적 작업 수행 실패 등 심각한 한계를 드러냈음을 보여줍니다.

Aniketh Garikaparthi, Manasi Patwardhan, Arman Cohan2026-03-13🤖 cs.AI

Limited Reasoning Space: The cage of long-horizon reasoning in LLMs

이 논문은 과도한 계산 자원이 추론 성능을 저하시킬 수 있는 '제한된 추론 공간' 가설을 제시하고, 이를 해결하기 위해 예측 제어 프레임워크인 'Halo' 를 통해 동적 계획 제어를 가능하게 하는 방법을 제안합니다.

Zhenyu Li, Guanlin Wu, Cheems Wang, Yongqiang Zhao2026-03-13🤖 cs.AI

Controllable Exploration in Hybrid-Policy RLVR for Multi-Modal Reasoning

이 논문은 다중 모달 대형 언어 모델의 강화 학습에서 엔트로피 붕괴와 정책 저하를 방지하고 탐색과 활용의 균형을 유지하기 위해 전문가 지식과 희소성 기반 가중치를 결합한 'CalibRL'이라는 제어 가능한 탐색 하이브리드 정책 RLVR 프레임워크를 제안합니다.

Zhuoxu Huang, Mengxi Jia, Hao Sun, Xuelong Li, Jungong Han2026-03-13🤖 cs.LG

ECHOSAT: Estimating Canopy Height Over Space And Time

이 논문은 다중 센서 위성 데이터와 자기지도 학습 기반의 성장 손실 함수를 활용하여 전 세계적 규모로 시계열 일관성을 갖춘 10m 해상도의 수관 높이 지도 'ECHOSAT'를 개발함으로써, 기존 정적 지도의 한계를 극복하고 탄소 모니터링 및 교란 평가에 기여하는 것을 목표로 합니다.

Jan Pauls, Karsten Schrödter, Sven Ligensa, Martin Schwartz, Berkant Turan, Max Zimmer, Sassan Saatchi, Sebastian Pokutta, Philippe Ciais, Fabian Gieseke2026-03-13🤖 cs.LG

Evaluating Zero-Shot and One-Shot Adaptation of Small Language Models in Leader-Follower Interaction

이 논문은 리소스 제약이 있는 로봇을 위한 리더 - 팔로워 상호작용에서 제로샷 미세조정된 소형 언어 모델 (SLM) 이 프롬프트 엔지니어링이나 원샷 모드보다 높은 정확도와 낮은 지연 시간으로 역할 분류에 효과적임을 입증하고 대화 복잡성과 분류 신뢰성 간의 균형을 강조합니다.

Rafael R. Baptista, André de Lima Salgado, Ricardo V. Godoy, Marcelo Becker, Thiago Boaventura, Gustavo J. G. Lahr2026-03-13⚡ eess

FlashOptim: Optimizers for Memory-Efficient Training

FlashOptim 은 마스터 가중치 분할의 양자화 오차 한계를 정밀하게 분석하고 8 비트 옵티마이저 상태에 컴팬딩 함수를 적용하여 파라미터당 메모리 사용량을 50% 이상 줄이면서도 모델 품질과 API 호환성을 유지하는 효율적인 학습 최적화 기법을 제안합니다.

Jose Javier Gonzalez Ortiz, Abhay Gupta, Christopher Rinard, Davis Blalock2026-03-13🤖 cs.LG

ProtoDCS: Towards Robust and Efficient Open-Set Test-Time Adaptation for Vision-Language Models

이 논문은 분포 변화 하에서 오픈셋 테스트 시간 적응을 위해 기존 방법의 취약점을 해결하고, 확률적 가우시안 혼합 모델 기반의 이중 확인 분리 메커니즘과 증거 기반 적응 전략을 통해 비전 - 언어 모델의 강건성과 효율성을 획기적으로 개선한 'ProtoDCS' 프레임워크를 제안합니다.

Wei Luo, Yangfan Ou, Jin Deng, Zeshuai Deng, Xiquan Yan, Zhiquan Wen, Mingkui Tan2026-03-13🤖 cs.AI

Expectation and Acoustic Neural Network Representations Enhance Music Identification from Brain Activity

이 논문은 음악 청취 시 뇌 활동에서 추출된 음향적 정보와 기대 관련 정보를 별도의 교사 표적으로 활용하는 사전 학습된 신경망 표현을 결합함으로써, 기존 베이스라인을 능가하는 EEG 기반 음악 식별 성능을 달성했음을 보여줍니다.

Shogo Noguchi, Taketo Akama, Tai Nakamura, Shun Minamikawa, Natalia Polouliakh2026-03-13🧬 q-bio

OpenSanctions Pairs: Large-Scale Entity Matching with LLMs

이 논문은 국제 제재 데이터에서 파생된 대규모 엔티티 매칭 벤치마크인 'OpenSanctions Pairs'를 공개하고, 기존 규칙 기반 시스템보다 우수한 성능을 보이는 LLM 기반 매칭의 효과와 한계를 실증적으로 분석하여 향후 엔티티 해결 작업의 초점을 매칭 자체보다는 블로킹 및 클러스터링 등 파이프라인 다른 단계로 전환할 것을 제안합니다.

Chandler Smith, Magnus Sesodia, Friedrich Lindenberg, Christian Schroeder de Witt2026-03-13💬 cs.CL

Structure-Aware Epistemic Uncertainty Quantification for Neural Operator PDE Surrogates

이 논문은 신경 연산자 (Neural Operator) 의 예측 불확실성을 효율적이고 공간적으로 정밀하게 추정하기 위해, 네트워크의 모듈 구조 (리프팅 - 전파 - 복원) 를 활용하여 리프팅 모듈에만 확률적 노이즈를 주입하는 구조 인식형 인식적 불확실성 정량화 기법을 제안하고, 이를 통해 기존 방법보다 더 신뢰할 수 있는 커버리지와 잔차-불확실성 정렬을 달성함을 보여줍니다.

Haoze Song, Zhihao Li, Mengyi Deng, Xin Li, Duyi Pan, Zhilu Lai, Wei Wang2026-03-13🤖 cs.LG

A Survey on Quantitative Modeling of Trust in Online Social Networks

이 논문은 심리학 이론을 바탕으로 온라인 소셜 네트워크의 신뢰 형성 요인을 분석하고, 알고리즘 기반에 따른 최신 신뢰 모델을 체계적으로 분류·검토하며, 구현을 위한 데이터셋과 기법 등을 포함한 실용적 가이드북을 제시함으로써 신뢰 모델링 연구의 종합적 개요와 향후 과제를 다룹니다.

Wenting Song, K. Suzanne Barber2026-03-13🤖 cs.AI

Hybrid Quantum-Classical Encoding for Accurate Residue-Level pKa Prediction

이 논문은 가우시안 커널 기반의 양자 영감 특징 매핑과 고전적 구조 특징을 결합한 하이브리드 양자 - 고전 딥러닝 프레임워크를 제안하여, 기존 모델보다 우수한 일반화 성능과 실험적 전이성을 보이는 잔기 수준 pKa 예측 방법을 제시합니다.

Van Le, Tan Le2026-03-13🔬 physics

Exploring Collatz Dynamics with Human-LLM Collaboration

이 논문은 인간과 대형 언어 모델 (LLM) 의 협업을 통해 콜라츠 추측의 궤적에서 관찰된 모듈러 난수화와 갭 - 버스트 분해 구조를 분석하고, 이를 기반으로 수렴성을 예측하는 조건부 프레임워크를 제시합니다.

Edward Y. Chang2026-03-13🔢 math

Summarize Before You Speak with ARACH: A Training-Free Inference-Time Plug-In for Enhancing LLMs via Global Attention Reallocation

이 논문은 모델의 가중치를 업데이트하지 않고도 어텐션 싱크 현상을 완화하고 전역 어텐션을 재분배하여 대규모 언어 모델의 성능을 향상시키는 훈련 없는 추론 시 플러그인인 ARACH 를 제안합니다.

Jingtao Wang, Yucong Wang, Jun Ding, Rui Cai, Xun Wang2026-03-13💬 cs.CL

From Phase Prediction to Phase Design: A ReAct Agent Framework for High-Entropy Alloy Discovery

본 논문은 4,753 건의 실험 데이터를 기반으로 학습된 XGBoost 대리 모델을 활용하여 ReAct 에이전트 프레임워크가 고엔트로피 합금의 위상 예측을 넘어, 기존 문헌 기반의 단순 회상에서 벗어나 화학적 다양성을 갖춘 새로운 합금 조성의 역설계를 자동화하고 검증하는 새로운 패러다임을 제시함을 보여줍니다.

Iman Peivaste, Salim Belouettar2026-03-13🔬 cond-mat.mtrl-sci

OA-NBV: Occlusion-Aware Next-Best-View Planning for Human-Centered Active Perception on Mobile Robots

이 논문은 이동 로봇이 장애물로 가려진 인체를 더 잘 관측하기 위해 가시성, 크기, 완전성을 고려한 가려짐 인식 차기 최적 시점 (OA-NBV) 계획 파이프라인을 제안하며, 시뮬레이션 및 실세계 실험에서 기존 방법 대비 관측 성공률과 품질을 크게 향상시킨다는 것을 입증합니다.

Boxun Hu, Chang Chang, Jiawei Ge, Man Namgung, Xiaomin Lin, Axel Krieger, Tinoosh Mohsenin2026-03-13🤖 cs.AI

← 이전 다음 →