Towards Autonomous Mathematics Research
이 논문은 자연어 기반의 반복적 생성·검증·수정 과정을 통해 수학 연구 전 과정을 자율적으로 수행하는 에이전트 'Aletheia'를 소개하고, 이를 통해 무인 자동 생성 논문, 인간-AI 협업 증명, 그리고 오픈 문제 해결 등 AI 와 수학 연구의 새로운 지평을 열었음을 보여줍니다.
9248 편의 논문
이 논문은 자연어 기반의 반복적 생성·검증·수정 과정을 통해 수학 연구 전 과정을 자율적으로 수행하는 에이전트 'Aletheia'를 소개하고, 이를 통해 무인 자동 생성 논문, 인간-AI 협업 증명, 그리고 오픈 문제 해결 등 AI 와 수학 연구의 새로운 지평을 열었음을 보여줍니다.
이 논문은 시공간 모델의 시간적 어텐션 메커니즘에서 발생하는 대각선 싱크 현상을 이론적으로 규명하고, 이를 완화하기 위한 정규화 방법의 유효성을 실험적으로 입증합니다.
이 논문은 컨테이너 기반의 무거운 인프라 의존성을 제거하고 커널 수준의 격리 메커니즘을 활용하여 디스크 사용량과 환경 준비 시간을 획기적으로 줄이면서도 RL 기반 소프트웨어 엔지니어링 에이전트 훈련의 확장성을 실현한 'SWE-MiniSandbox'를 제안합니다.
이 논문은 독점 로봇 인터페이스 없이도 시간 동기화된 다중 모달 데이터를 수집할 수 있는 오픈소스 시스템 'MiDAS'와 이를 통해 구축된 로봇 보조 최소 침습 수술용 데이터셋을 소개하며, 비침습적 센서 기반의 동작 인식 성능이 독점 텔레메트리와 유사함을 입증했습니다.
이 논문은 수요 간헐성, 높은 변동성 및 다양한 예측 시점에 따른 모델 성능 변화를 해결하기 위해, 수요 구조 분류와 예측 시계열에 따른 오류 지표 보정을 통합한 'AHSIV'라는 적응형 모델 선택 프레임워크를 제안하고 Walmart, M3, M4, M5 데이터셋을 통해 그 유효성을 입증합니다.
이 논문은 검색 정확도와 환경 보존 사이의 균형을 최적화하기 위해 시맨틱 유도 확산 튜닝, 랭게빈 동역학, 적응형 조기 종료 프로토콜 등을 결합하여 탄소 효율적인 검색을 가능하게 하는 'GaiaFlow' 프레임워크를 제안합니다.
이 논문은 분자 내 복잡성과 분자 간 패킹을 분리하여 처리하고 리만 다양체 상의 기하학적 대칭성을 고려한 흐름 매칭 기반 생성 모델인 'MolCrystalFlow'를 제안함으로써, 분자 결정 구조 예측의 난제를 해결하고 데이터 기반의 발견을 가능하게 합니다.
이 논문은 현재 대규모 언어 모델이 긴 문맥을 직접적으로 추론하여 버그를 수정하는 데는 한계가 있으며, 에이전트 워크플로우의 성공은 긴 문맥 처리 능력보다는 작업을 짧은 문맥 단계로 분해하는 데서 비롯된다는 점을 SWE-bench Verified 실험을 통해 규명했습니다.
이 논문은 로우랭크 어댑테이션 (LoRA) 의 집계 오류와 분해 드리프트 문제를 해결하고 통신 오버헤드를 획기적으로 줄이기 위해 단일 저랭크 행렬의 그람 행렬을 집계하고 프로크루스테스 정렬을 도입한 연방 미세 조정 프레임워크인 FLoRG 를 제안하며, 이를 통해 기존 최첨단 방법들보다 높은 성능과 효율성을 입증합니다.
이 논문은 항체의 진화적 역동성과 복잡한 에피스타시스를 포착하여 제로샷 변이 효과 예측 성능을 향상시키고, 특정 항원에 대한 결합 친화도 최적화를 가능하게 하는 딥러닝 기반 연속 시간 마르코프 체인 모델인 CoSiNE 를 제안합니다.
이 논문은 AI 기반 대규모 가설 검증을 통해 생물학적 기초 모델이 학습한 표현 공간이 단순한 훈련 인공물이 아닌, 면역 조직에서 특히 두드러지는 유의미한 위상 및 기하학적 구조를 공유한다는 것을 141 개의 가설을 통해 입증했습니다.
이 논문은 강화 학습 기반 LLM 에이전트의 탐험 병목 현상을 해결하기 위해 메모리를 활용한 탐험과 온/오프 정책 최적화를 결합한 'EMPO' 프레임워크를 제안하며, 이를 통해 새로운 환경에서의 적응력과 성능을 크게 향상시켰음을 보여줍니다.
이 논문은 정보이론적 관점에서 멀티모달 LLM 의 모달리티 붕괴 현상을 텍스트 정렬된 디코더의 불일치 해독 문제로 설명하며, 모델의 아키텍처가 아닌 학습 목표 (스코어링 규칙) 가 접근 가능한 정보의 한계를 결정한다는 것을 입증합니다.
이 논문은 소규모 및 중견기업 (SME) 의 공급망 포괄성을 높이기 위해 웹 크롤링, 도메인 특화 지식 그래프 구축, 그리고 생태학적 종 풍부도 추정 기법을 활용한 커버리지 추정을 결합한 '웹→지식→웹 (W→K→W)' 파이프라인을 제안하고, 반도체 장비 제조 분야에서 기존 방법보다 높은 정밀도와 효율성을 입증했습니다.
이 논문은 활성화 공간 개입과 가중치 업데이트 간의 1 차 동등성을 규명하여 '포스트-블록' 개입을 이론적으로 뒷받침하고, 가중치와 활성화 업데이트를 동시에 학습하는 '공동 적응 (joint adaptation)' 방식을 제안함으로써 전체 파라미터 미세조정과 견줄 만한 성능을 극소수의 파라미터로 달성하는 새로운 효율적 모델 적응 패러다임을 제시합니다.
이 논문은 임의의 그리드 데이터를 위한 텐서 링 함수 분해를 제안하고, 주파수 분석을 통해 고주파 모델링 능력을 제한하는 요인을 규명한 후, 잠재 텐서와 고정 기저의 구조적 결합을 통해 학습 동역학을 개선한 재매개변수화 기법을 도입하여 이미지 및 점군 복원 작업에서 기존 방법보다 우수한 성능을 달성함을 보여줍니다.
이 논문은 제한된 주석과 강한 도메인 편차로 인한 어려움을 해결하기 위해 MFCC, STFT, 피치 특징을 융합한 다중 분기 CNN 과 효율적인 Legendre 메모리 단위 (LMU) 를 활용하고, 엔트로피 기반 가중치를 적용한 보정된 사후 확률 앙상블 융합 기법을 통해 도메인 간 일반화 성능을 향상시킨 영아 울음소리 분류 프레임워크를 제안합니다.
이 논문은 실제 방 임펄스 응답을 사용하여 청결한 음성과 반향 음성을 쌍으로 구성한 'Whisper-RIR-Mega' 벤치마크 데이터셋을 소개하고, 다양한 크기의 Whisper 모델이 반향 환경에서 성능이 저하됨을 실험적으로 입증하여 ASR의 방 음향 강건성 평가를 지원한다고 요약할 수 있습니다.
이 논문은 단백질 설계 및 컨포메이션 앙상블의 한계를 극복하기 위해, 43 만 개 이상의 구조 데이터와 분자동역학 궤적을 기반으로 강성 (rigidity) 을 인식한 자기지도 학습 프레임워크인 RigidSSL 을 제안하여 설계 가능성과 생성 다양성을 획기적으로 향상시킨 연구입니다.
mlx-vis 는 Apple Silicon 의 MLX 프레임워크를 활용하여 GPU 가속 차원 축소 및 k-최근접 이웃 그래프 알고리즘을 구현하고, Matplotlib 없이 Metal GPU 에서 직접 애니메이션 렌더링까지 수행하는 Python 라이브러리입니다.