Certified and accurate computation of function space norms of deep neural networks
이 논문은 구간 산술, 적응적 세분화 및 수치 적분을 결합하여 신경망 구조를 직접 활용함으로써 함수 공간 노름 (Lebesgue 및 Sobolev 노름) 과 PINN 잔차에 대한 검증 가능하고 정확한 계산을 위한 프레임워크를 제시합니다.
9523 편의 논문
이 논문은 구간 산술, 적응적 세분화 및 수치 적분을 결합하여 신경망 구조를 직접 활용함으로써 함수 공간 노름 (Lebesgue 및 Sobolev 노름) 과 PINN 잔차에 대한 검증 가능하고 정확한 계산을 위한 프레임워크를 제시합니다.
이 논문은 양자 상관성 유사도 지표 (QCLI) 와 고전적 상관 복잡도 지표 (CCI) 로 구성된 상관 - 복잡성 맵을 제안하여 실제 데이터가 IQP 양자 생성 모델과 구조적으로 정렬되었는지 진단하고, 이를 통해 난류 데이터에 대해 고전적 모델보다 적은 자원으로 경쟁력 있는 분포 정렬을 달성하는 양자 생성 유틸리티 실현 가능성을 입증했습니다.
이 논문은 양자 한계 감쇠기에서 가우시안 역확산 과정을 수행할 때 고정된 확산을 가진 역방향 드리프트가 완전 양성 (CP) 을 위반할 수 있음을 보이며, 이를 보정하기 위해서는 추가적인 확산이 필수적으로 주입되어야 함을 증명합니다.
이 논문은 사전 학습 단계에서 기존 선형 계층에 비선형 저랭크 분기를 영구적으로 추가하여 최소한의 오버헤드로 학습 효율성과 속도를 획기적으로 개선하는 새로운 아키텍처 'NOBLE'을 제안합니다.
이 논문은 재학습 없이 소수의 예시만으로 대규모 언어 모델의 행동을 효과적으로 제어할 수 있도록, 인-컨텍스트 학습 동역학을 근사하는 새로운 프레임워크인 COLD-Steer 를 제안합니다.
이 논문은 설명 논리 기반 개념 학습에서 반복적인 인스턴스 검색으로 인한 런타임 병목 현상을 해결하기 위해, 의미론적 캐싱 기법을 도입하여 심볼릭 및 신경-심볼릭 추론기 모두에서 개념 학습 속도를 한 자릿수 이상 향상시켰음을 보여줍니다.
이 논문은 멀티모달 확산 모델에서 여러 모달리티를 동시에 공격하면 시너지 효과가 있을 것이라는 통념을 반박하며, 백도어 공격이 실제로는 특정 모달리티에 의존하는 '백도어 모달리티 붕괴' 현상이 발생하고 교차 모달리티 상호작용은 미미하거나 오히려 부정적임을 규명했습니다.
이 논문은 22 개 병원 9,215 명의 태아 초음파 이미지 45,139 장으로 학습된 인공지능 시스템이 구순구개열의 산전 진단 정확도를 93% 이상의 민감도와 95% 이상의 특이도로 달성하여 숙련된 전문의 수준에 도달하고 초급 전문의의 진단 능력을 향상시키며, 희귀 질환에 대한 임상 교육까지 동시에 개선할 수 있음을 보여줍니다.
이 논문은 트랜스포머 모델을 활용하여 나노 클러스터의 원자적 전이 경로를 기존 시뮬레이션보다 훨씬 낮은 계산 비용으로 예측하고, 물리적 타당성을 검증하며 다양한 미세 상태를 생성하는 방법을 제시합니다.
이 논문은 화학 산업의 복잡한 계층적 수요 예측 모델에 대해 시계열 데이터와 외부 변수의 중요성, 예측 불확실성, 그리고 학습 데이터 변경에 따른 영향 등을 설명할 수 있는 새로운 해석 가능성 방법을 제안하고, 이를 통해 실제 산업 환경에서의 의사결정 신뢰도와 활용도를 높이는 것을 목표로 합니다.
이 논문은 희소 오토인코더를 활용하여 신경망의 입력-출력 변환 과정을 숨겨진 뉴런의 인과적 기여도로 분해하는 CODEC 방법론을 제안하며, 이를 통해 기존 활성화 분석으로는 파악하기 어려운 계층적 비선형 계산의 메커니즘과 제어 가능성을 규명했습니다.
이 논문은 심층 강화학습 에이전트의 단기 보상 과적착 문제를 해결하기 위해 심층 정책의 표현력을 유지하면서 기호적 구조를 주입하는 '하이브리드 계층적 강화학습 (H²RL)'이라는 새로운 두 단계 프레임워크를 제안하고, 이를 통해 장기적 의사결정 능력을 크게 향상시킨다는 점을 보여줍니다.
이 논문은 대규모 데이터와 모델 스케일링 하에서 물리 기반 편향을 대체하여 장거리 상호작용을 정확하게 포착하고 실험 관측치를 재현하는 새로운 어텐션 기반 기계학습 원자 간 힘 모델인 AllScAIP 를 제안합니다.
SCOPE 는 기존 3D 세그멘테이션 방법의 플러그 앤 플레이 백그라운드 기반 프로토타입 보강 프레임워크로, 새로운 클래스가 등장할 때 백그라운드 영역의 유사한 프로토타입을 활용하여 소량의 주석 데이터만으로도 catastrophic forgetting 을 줄이고 분산된 3D 세그멘테이션 성능을 크게 향상시킵니다.
이 논문은 자율주행의 복잡한 의사결정 및 안전성 향상을 위해 대규모 언어 모델 (LLM) 의 추론 능력을 공간적으로 일관된 비조 (Bird's-Eye View) 표현으로 증류하는 BEVLM 프레임워크를 제안하며, 이를 통해 교차 뷰 추론 정확도를 46% 그리고 안전 위기 상황에서의 종단간 주행 성능을 29% 각각 개선함을 보여줍니다.
이 논문은 3 차원 이상의 다차원 패널 데이터에 대한 선형 회귀 모형을 연구하여, Bai(2009) 의 요인 모형 추정과 가중치 내변환을 결합한 Neyman-orthogonal 추정법을 제시하고, 이를 통해 일관성과 모수적 수렴 속도를 확보하며 맥주 수요 탄력성을 추정하는 방법을 제안합니다.
이 논문은 결합된 선형 제약 조건이 있는 비볼록-강한 오목 및 비볼록-오목 미니맥스 문제를 해결하기 위해 두 가지 제로차 순환 알고리즘 (ZO-PDAPG 및 ZO-RMPDPG) 을 제안하고, 결정론적 및 확률적 환경에서의 반복 복잡도 보장을 통해 기존 제로차 알고리즘보다 우수한 성능을 입증합니다.
이 논문은 데이터 협업 (DC) 의 정렬 문제를 오라토너멀 (Orthonormal) 기저 선택을 통해 고전적인 직교 프로크루스테스 문제로 환원하고, 이를 통해 정확도와 안정성을 유지하면서 정렬 복잡도를 획기적으로 낮추는 'ODC'라는 새로운 방법을 제안합니다.
이 논문은 다중 태스크 부분집합 선택 문제를 기준 분포의 국소적 분포 강건성 관점에서 접근하여, 상대 엔트로피 정규화를 통해 성능과 강건성 간의 균형을 효율적으로 달성하는 새로운 최적화 기법을 제안하고 위성 센서 선택 및 이미지 요약 과제에서 그 유효성을 입증합니다.
이 논문은 LKH 알고리즘의 전문가 궤적에서 특권 정보를 증류하고 지도 학습을 통해 이를 일반화하는 새로운 학습 방식을 제안하여, 비홀로노믹 차량의 DTSPN 문제를 기존 LKH 대비 약 50 배 빠르게 해결하고 다른 방법들보다 뛰어난 성능을 보인다고 설명합니다.