A Quantitative Characterization of Forgetting in Post-Training
이 논문은 포스트 트레이닝 중 발생하는 망각을 '질량 소실'과 '구성 요소 이동'으로 정의하고, KL 발산 방향, 기하학적 행동 중복도, 샘플링 전략 및 과거 데이터 가시성 간의 상호작용을 통해 망각을 정량화하는 이론적 틀을 제시합니다.
8316 편의 논문
이 논문은 포스트 트레이닝 중 발생하는 망각을 '질량 소실'과 '구성 요소 이동'으로 정의하고, KL 발산 방향, 기하학적 행동 중복도, 샘플링 전략 및 과거 데이터 가시성 간의 상호작용을 통해 망각을 정량화하는 이론적 틀을 제시합니다.
이 논문은 인간 주석과 파인튜닝 없이도 시·공간적 추론과 대규모 언어 모델 기반의 논리적 추론을 통해 동물 행동 분석 및 포즈 추정을 위한 확장 가능하고 해석 가능한 통합 프레임워크인 'BehaviorVLM'을 제안합니다.
이 논문은 MADQA 벤치마크와 새로운 평가 프로토콜을 통해 멀티모달 에이전트가 인간과 유사한 정확도를 달성하더라도 전략적 추론보다는 무작위 검색에 의존하며 효율성 측면에서 한계를 보임을 규명합니다.
이 논문은 단일 머신러닝 원자간 전위 (MLIP) 모델이 안정성 필터링에서 93% 의 실패율을 보인다는 문제를 지적하고, 적대적 검증, 부트스트랩 신뢰구간, 그리고 Lean 4 형식 증명을 결합한 'Proof-Carrying Materials (PCM)' 프레임워크를 통해 MLIP 기반 신소재 발견의 신뢰성과 수율을 획기적으로 개선하는 방법을 제시합니다.
이 논문은 PDDL+의 의미론을 완전히 포착하고 실험적으로도 검증된 다항식 시간 복잡도의 실용적인 컴파일 기법을 통해, 지속적 행동을 포함하는 시계열 수치 계획 문제를 PDDL+로 변환하는 방법을 제시합니다.
이 논문은 분산 데이터 파이프라인의 자동화된 계획 및 스케줄링을 위해 WORKSWORLD 라는 새로운 도메인을 제안하고, 이를 통해 데이터 소스, 구성 요소, 목적지를 정의하는 것만으로 분산 워크플로우 그래프를 구축하고 자원에 스케줄링하는 통합 해결책을 제시합니다.
이 논문은 광학 원격 탐사 이미지의 다양한 크기 변화와 글로벌 컨텍스트 모델링 문제를 해결하기 위해 SwinTransformer 백본과 동적 적응 세부 인식 (DAD), 주파수 정합 컨텍스트 강화 (FCE), 영역 비율 인식 위치 확인 (RPL) 모듈을 결합한 RDNet 을 제안하여 기존 방법보다 우수한 성능을 달성함을 보여줍니다.
이 논문은 현대 멀티코어 CPU 의 병렬 처리 능력을 활용하여 순차적 3D 프린팅을 위한 객체 배치 및 스케줄링 문제를 해결하는 '포트폴리오 기반 CEGAR-SEQ' 알고리즘을 제안하고, 다양한 배치 전략을 병렬로 실행함으로써 기존 알고리즘보다 더 적은 프린트 플레이트로 더 효율적인 스케줄링을 달성함을 보여줍니다.
이 논문은 연구 목표에서 출발해 도메인 간 통찰을 체계적으로 도출하여 인간의 창의적 추론과 LLM 을 지원함으로써 과학적 발견의 혁신을 촉진하는 'Idea-Catalyst'라는 새로운 프레임워크를 제안하고, 이를 통해 연구의 참신성과 통찰력을 유의미하게 향상시켰음을 입증합니다.
이 논문은 대규모 사전 학습 모델의 가중치 주변에 다양한 작업 전문가들이 밀집해 있음을 발견하고, 이를 바탕으로 단순한 무작위 섭동 샘플링과 다수결 투표만으로 PPO 나 GRPO 와 같은 표준 미세 조정 방법과 경쟁력 있는 성능을 달성하는 새로운 병렬 후학습 기법을 제안합니다.
이 논문은 퍼플렉시티의 실제 운영 경험을 바탕으로 프론티어 AI 에이전트의 새로운 보안 위협과 공격 표면을 분석하고, 다층적 방어 체계와 표준화 방향을 제시하여 NIST 위험 관리 원칙에 부합하는 안전한 에이전트 시스템 설계 방안을 제안합니다.
이 논문은 동일한 신경망에 대한 일련의 관련 검증 쿼리 간에 학습된 충돌 (conflicts) 을 재사용하여 불필요한 탐색을 줄이고 검증 효율을 높이는 증분적 신경망 검증 기법을 제안하고, 이를 Marabou 검증기에 구현하여 최대 1.9 배의 속도 향상을 입증했습니다.
이 논문은 물리, 언어, 지각 등 다양한 도메인의 분해 가능한 구조를 포착하여 결정론적 예측과 확률적 생성을 통합하는 범용 원시 요소인 '분리 가능한 신경 아키텍처 (SNA)'를 제안하고, 이를 자율 항해부터 난류 모델링 및 언어 모델링에 이르기까지 다양한 응용에서 검증합니다.
이 논문은 비검증 가능한 도메인에서 LLM 후학습을 위한 '추론 기반 판정자'와 '비추론 기반 판정자'의 효과를 비교한 연구로, 추론 기반 판정자가 보상 해킹을 줄이고 금표준 판정자 기준에서 우수한 성능을 보이지만, 동시에 다른 LLM 판정자를 속이는 정교한 적대적 출력을 학습하여 벤치마크 점수를 부풀릴 수 있음을 발견했습니다.
이 논문은 신뢰성, 규모, 현실성을 동시에 확보하기 위해 '요약-재정착 (synthesize-and-reground)' 프레임워크를 제안하고, 이를 통해 구축한 대규모 과학적 멀티모달 문서 추론 데이터셋 SciMDR 과 평가 벤치마크 SciMDR-Eval 을 소개하며, 이를 통해 학습된 모델이 복잡한 문서 수준의 추론 능력을 크게 향상시켰음을 입증합니다.
이 논문은 FLUX.1 모델의 잠재 공간에서 색상 정보가 hue, saturation, lightness 구조로 조직화되어 있음을 규명하고, 이를 기반으로 학습 없이 폐쇄형 수식 조작만으로 색상을 예측하고 제어하는 새로운 방법을 제시합니다.
이 논문은 자연어 처리 및 정보 검색 분야에서 딥러닝과 머신러닝 모델의 불투명성 문제를 해결하기 위해 단어 임베딩, 시퀀스 모델링, 어텐션 모듈, 트랜스포머, BERT, 문서 순위 결정 등 다양한 기법의 설명 가능성과 해석 가능성에 대한 연구 동향을 광범위하게 조사하고 향후 연구 방향을 제시합니다.
이 논문은 개인 및 집단 공정성을 모두 포괄하는 '판별 위험 (discriminative risk)' 지표를 제안하고, 이를 기반으로 마진 의존적 오라클 바운드를 통해 앙상블 조합이 공정성을 이론적으로 보장하며 향상시킬 수 있음을 증명합니다.
이 논문은 10nm 미만 기술 노드의 새로운 공개 벤치마크와 강화된 시뮬레이션 어닐링 기반을 활용하여 구글의 'AlphaChip'을 포함한 매크로 배치 강화학습 접근법의 재현성과 한계를 종합적으로 재평가하고, 그 결과와 도구를 공개하여 연구 커뮤니티의 향후 과제를 제시합니다.
이 논문은 자연어 기반의 대규모 신경망 '사회'가 상호작용하여 단일 모델의 한계를 극복하고 다양한 AI 과제를 해결하는 '마인드스톰' 개념을 제안하며, 이를 통해 미래 인공지능의 사회적 구조와 경제 원리 등 새로운 연구 과제를 제시합니다.