cs.LG 편의 논문 | Gist.Science

Towards Autonomous Mathematics Research

이 논문은 자연어 기반의 반복적 생성·검증·수정 과정을 통해 수학 연구 전 과정을 자율적으로 수행하는 에이전트 'Aletheia'를 소개하고, 이를 통해 무인 자동 생성 논문, 인간-AI 협업 증명, 그리고 오픈 문제 해결 등 AI 와 수학 연구의 새로운 지평을 열었음을 보여줍니다.

Tony Feng, Trieu H. Trinh, Garrett Bingham, Dawsen Hwang, Yuri Chervonyi, Junehyuk Jung, Joonkyung Lee, Carlo Pagano, Sang-hyun Kim, Federico Pasqualotto, Sergei Gukov, Jonathan N. Lee, Junsu Kim, Kaiying Hou, Golnaz Ghiasi, Yi Tay, YaGuang Li, Chenkai Kuang, Yuan Liu, Hanzhao Lin, Evan Zheran Liu, Nigamaa Nayakanti, Xiaomeng Yang, Heng-Tze Cheng, Demis Hassabis, Koray Kavukcuoglu, Quoc V. Le, Thang Luong2026-03-09🤖 cs.AI

Stochastic Parroting in Temporal Attention -- Regulating the Diagonal Sink

이 논문은 시공간 모델의 시간적 어텐션 메커니즘에서 발생하는 대각선 싱크 현상을 이론적으로 규명하고, 이를 완화하기 위한 정규화 방법의 유효성을 실험적으로 입증합니다.

Victoria Hankemeier, Malte Schilling2026-03-09🤖 cs.LG

SWE-MiniSandbox: Container-Free Reinforcement Learning for Building Software Engineering Agents

이 논문은 컨테이너 기반의 무거운 인프라 의존성을 제거하고 커널 수준의 격리 메커니즘을 활용하여 디스크 사용량과 환경 준비 시간을 획기적으로 줄이면서도 RL 기반 소프트웨어 엔지니어링 에이전트 훈련의 확장성을 실현한 'SWE-MiniSandbox'를 제안합니다.

Danlong Yuan, Wei Wu, Zhengren Wang, Xueliang Zhao, Huishuai Zhang, Dongyan Zhao2026-03-09🤖 cs.AI

MiDAS: A Multimodal Data Acquisition System and Dataset for Robot-Assisted Minimally Invasive Surgery

이 논문은 독점 로봇 인터페이스 없이도 시간 동기화된 다중 모달 데이터를 수집할 수 있는 오픈소스 시스템 'MiDAS'와 이를 통해 구축된 로봇 보조 최소 침습 수술용 데이터셋을 소개하며, 비침습적 센서 기반의 동작 인식 성능이 독점 텔레메트리와 유사함을 입증했습니다.

Keshara Weerasinghe (MD), Seyed Hamid Reza Roodabeh (MD), Andrew Hawkins (MD), Zhaomeng Zhang, Zachary Schrader, Homa Alemzadeh2026-03-09🤖 cs.LG

An Adaptive Model Selection Framework for Demand Forecasting under Horizon-Induced Degradation to Support Business Strategy and Operations

이 논문은 수요 간헐성, 높은 변동성 및 다양한 예측 시점에 따른 모델 성능 변화를 해결하기 위해, 수요 구조 분류와 예측 시계열에 따른 오류 지표 보정을 통합한 'AHSIV'라는 적응형 모델 선택 프레임워크를 제안하고 Walmart, M3, M4, M5 데이터셋을 통해 그 유효성을 입증합니다.

Adolfo González, Víctor Parada2026-03-09🤖 cs.AI

GaiaFlow: Semantic-Guided Diffusion Tuning for Carbon-Frugal Search

이 논문은 검색 정확도와 환경 보존 사이의 균형을 최적화하기 위해 시맨틱 유도 확산 튜닝, 랭게빈 동역학, 적응형 조기 종료 프로토콜 등을 결합하여 탄소 효율적인 검색을 가능하게 하는 'GaiaFlow' 프레임워크를 제안합니다.

Rong Fu, Jia Yee Tan, Chunlei Meng, Shuo Yin, Xiaowen Ma, Wangyu Wu, Muge Qi, Guangzhen Yao, Zhaolu Kang, Zeli Su, Simon Fong2026-03-09🤖 cs.LG

MolCrystalFlow: Molecular Crystal Structure Prediction via Flow Matching

이 논문은 분자 내 복잡성과 분자 간 패킹을 분리하여 처리하고 리만 다양체 상의 기하학적 대칭성을 고려한 흐름 매칭 기반 생성 모델인 'MolCrystalFlow'를 제안함으로써, 분자 결정 구조 예측의 난제를 해결하고 데이터 기반의 발견을 가능하게 합니다.

Cheng Zeng, Harry W. Sullivan, Thomas Egg, Maya M. Martirossyan, Philipp Höllmer, Jirui Jin, Richard G. Hennig, Adrian Roitberg, Stefano Martiniani, Ellad B. Tadmor, Mingjie Liu2026-03-09🔬 cond-mat.mtrl-sci

The Limits of Long-Context Reasoning in Automated Bug Fixing

이 논문은 현재 대규모 언어 모델이 긴 문맥을 직접적으로 추론하여 버그를 수정하는 데는 한계가 있으며, 에이전트 워크플로우의 성공은 긴 문맥 처리 능력보다는 작업을 짧은 문맥 단계로 분해하는 데서 비롯된다는 점을 SWE-bench Verified 실험을 통해 규명했습니다.

Ravi Raju, Mengmeng Ji, Shubhangi Upasani, Bo Li, Urmish Thakker2026-03-09🤖 cs.LG

FLoRG: Federated Fine-tuning with Low-rank Gram Matrices and Procrustes Alignment

이 논문은 로우랭크 어댑테이션 (LoRA) 의 집계 오류와 분해 드리프트 문제를 해결하고 통신 오버헤드를 획기적으로 줄이기 위해 단일 저랭크 행렬의 그람 행렬을 집계하고 프로크루스테스 정렬을 도입한 연방 미세 조정 프레임워크인 FLoRG 를 제안하며, 이를 통해 기존 최첨단 방법들보다 높은 성능과 효율성을 입증합니다.

Chuiyang Meng, Ming Tang, Vincent W. S. Wong2026-03-09🤖 cs.AI

Conditionally Site-Independent Neural Evolution of Antibody Sequences

이 논문은 항체의 진화적 역동성과 복잡한 에피스타시스를 포착하여 제로샷 변이 효과 예측 성능을 향상시키고, 특정 항원에 대한 결합 친화도 최적화를 가능하게 하는 딥러닝 기반 연속 시간 마르코프 체인 모델인 CoSiNE 를 제안합니다.

Stephen Zhewen Lu, Aakarsh Vermani, Kohei Sanno, Jiarui Lu, Frederick A Matsen, Milind Jagota, Yun S. Song2026-03-09🤖 cs.LG

What Topological and Geometric Structure Do Biological Foundation Models Learn? Evidence from 141 Hypotheses

이 논문은 AI 기반 대규모 가설 검증을 통해 생물학적 기초 모델이 학습한 표현 공간이 단순한 훈련 인공물이 아닌, 면역 조직에서 특히 두드러지는 유의미한 위상 및 기하학적 구조를 공유한다는 것을 141 개의 가설을 통해 입증했습니다.

Ihor Kendiukhov2026-03-09🤖 cs.LG

Exploratory Memory-Augmented LLM Agent via Hybrid On- and Off-Policy Optimization

이 논문은 강화 학습 기반 LLM 에이전트의 탐험 병목 현상을 해결하기 위해 메모리를 활용한 탐험과 온/오프 정책 최적화를 결합한 'EMPO $^2$ ' 프레임워크를 제안하며, 이를 통해 새로운 환경에서의 적응력과 성능을 크게 향상시켰음을 보여줍니다.

Zeyuan Liu, Jeonghye Kim, Xufang Luo, Dongsheng Li, Yuqing Yang2026-03-09🤖 cs.AI

Modality Collapse as Mismatched Decoding: Information-Theoretic Limits of Multimodal LLMs

이 논문은 정보이론적 관점에서 멀티모달 LLM 의 모달리티 붕괴 현상을 텍스트 정렬된 디코더의 불일치 해독 문제로 설명하며, 모델의 아키텍처가 아닌 학습 목표 (스코어링 규칙) 가 접근 가능한 정보의 한계를 결정한다는 것을 입증합니다.

Jayadev Billa2026-03-09🤖 cs.AI

Coverage-Aware Web Crawling for Domain-Specific Supplier Discovery via a Web--Knowledge--Web Pipeline

이 논문은 소규모 및 중견기업 (SME) 의 공급망 포괄성을 높이기 위해 웹 크롤링, 도메인 특화 지식 그래프 구축, 그리고 생태학적 종 풍부도 추정 기법을 활용한 커버리지 추정을 결합한 '웹→지식→웹 (W→K→W)' 파이프라인을 제안하고, 반도체 장비 제조 분야에서 기존 방법보다 높은 정밀도와 효율성을 입증했습니다.

Yijiashun Qi, Yijiazhen Qi, Tanmay Wagh2026-03-09🤖 cs.LG

Weight Updates as Activation Shifts: A Principled Framework for Steering

이 논문은 활성화 공간 개입과 가중치 업데이트 간의 1 차 동등성을 규명하여 '포스트-블록' 개입을 이론적으로 뒷받침하고, 가중치와 활성화 업데이트를 동시에 학습하는 '공동 적응 (joint adaptation)' 방식을 제안함으로써 전체 파라미터 미세조정과 견줄 만한 성능을 극소수의 파라미터로 달성하는 새로운 효율적 모델 적응 패러다임을 제시합니다.

Dyah Adila, John Cooper, Alexander Yun, Avi Trost, Frederic Sala2026-03-09🤖 cs.LG

Reparameterized Tensor Ring Functional Decomposition for Multi-Dimensional Data Recovery

이 논문은 임의의 그리드 데이터를 위한 텐서 링 함수 분해를 제안하고, 주파수 분석을 통해 고주파 모델링 능력을 제한하는 요인을 규명한 후, 잠재 텐서와 고정 기저의 구조적 결합을 통해 학습 동역학을 개선한 재매개변수화 기법을 도입하여 이미지 및 점군 복원 작업에서 기존 방법보다 우수한 성능을 달성함을 보여줍니다.

Yangyang Xu, Junbo Ke, You-Wei Wen, Chao Wang2026-03-09🤖 cs.AI

LMU-Based Sequential Learning and Posterior Ensemble Fusion for Cross-Domain Infant Cry Classification

이 논문은 제한된 주석과 강한 도메인 편차로 인한 어려움을 해결하기 위해 MFCC, STFT, 피치 특징을 융합한 다중 분기 CNN 과 효율적인 Legendre 메모리 단위 (LMU) 를 활용하고, 엔트로피 기반 가중치를 적용한 보정된 사후 확률 앙상블 융합 기법을 통해 도메인 간 일반화 성능을 향상시킨 영아 울음소리 분류 프레임워크를 제안합니다.

Niloofar Jazaeri, Hilmi R. Dajani, Marco Janeczek, Martin Bouchard2026-03-09🤖 cs.LG

Whisper-RIR-Mega: A Paired Clean-Reverberant Speech Benchmark for ASR Robustness to Room Acoustics

이 논문은 실제 방 임펄스 응답을 사용하여 청결한 음성과 반향 음성을 쌍으로 구성한 'Whisper-RIR-Mega' 벤치마크 데이터셋을 소개하고, 다양한 크기의 Whisper 모델이 반향 환경에서 성능이 저하됨을 실험적으로 입증하여 ASR의 방 음향 강건성 평가를 지원한다고 요약할 수 있습니다.

Mandip Goswami2026-03-09🤖 cs.AI

Rigidity-Aware Geometric Pretraining for Protein Design and Conformational Ensembles

이 논문은 단백질 설계 및 컨포메이션 앙상블의 한계를 극복하기 위해, 43 만 개 이상의 구조 데이터와 분자동역학 궤적을 기반으로 강성 (rigidity) 을 인식한 자기지도 학습 프레임워크인 RigidSSL 을 제안하여 설계 가능성과 생성 다양성을 획기적으로 향상시킨 연구입니다.

Zhanghan Ni, Yanjing Li, Zeju Qiu, Bernhard Schölkopf, Hongyu Guo, Weiyang Liu, Shengchao Liu2026-03-09🤖 cs.AI

mlx-vis: GPU-Accelerated Dimensionality Reduction and Visualization on Apple Silicon

mlx-vis 는 Apple Silicon 의 MLX 프레임워크를 활용하여 GPU 가속 차원 축소 및 k-최근접 이웃 그래프 알고리즘을 구현하고, Matplotlib 없이 Metal GPU 에서 직접 애니메이션 렌더링까지 수행하는 Python 라이브러리입니다.

Han Xiao2026-03-09🤖 cs.LG

← 이전 다음 →