Sharpness-Aware Machine Unlearning
이 논문은 Sharpness-aware minimization(SAM) 의 특성을 분석하여 머신 언러닝 성능을 향상시키고, 이를 기반으로 리텐 신호 학습과 포ゲット 신호 제거를 동시에 최적화하는 'Sharp MinMax'라는 새로운 알고리즘을 제안하여 다양한 언러닝 방법론의 성능을 개선함을 보여줍니다.
6733 편의 논문
이 논문은 Sharpness-aware minimization(SAM) 의 특성을 분석하여 머신 언러닝 성능을 향상시키고, 이를 기반으로 리텐 신호 학습과 포ゲット 신호 제거를 동시에 최적화하는 'Sharp MinMax'라는 새로운 알고리즘을 제안하여 다양한 언러닝 방법론의 성능을 개선함을 보여줍니다.
이 논문은 콜모고로프 - 아르놀드 표현 정리를 기반으로 한 새로운 생성 모델인 KAEM 을 제안하여, 단순한 잠재 사전 분포의 효율성과 복잡한 반복적 샘플러의 표현력 사이의 균형을 맞추면서도 빠른 추론과 해석 가능성을 동시에 달성하는 방법을 제시합니다.
이 논문은 밀집된 작물 이미지에서 수동 주석을 최소화하면서도 형태와 질감에 초점을 맞춘 GLMask 를 도입하여 인스턴스 분할 성능을 획기적으로 향상시키는 반-자기지도 학습 접근법을 제안합니다.
이 논문은 DPO(직접 선호도 최적화) 과정 중 모델의 학습 상태 변화에 따라 배치 단위로 샘플을 동적으로 선택하는 'SamS' 알고리즘을 제안하여, 핵심 알고리즘을 수정하지 않고도 추가적인 계산 비용 없이 LLM 의 정렬 성능을 크게 향상시키는 새로운 방향을 제시합니다.
이 논문은 특정 작업별 학습이나 인간 - 로봇 쌍 데이터 없이도 단일 인간 데모만으로도 로봇이 복잡한 조작 과제를 성공적으로 수행할 수 있도록, 운동학적 리타게팅과 사전 훈련된 확산 정책을 결합한 'DemoDiffusion' 방법을 제안합니다.
이 논문은 인간의 시각 발달 과정을 모방한 '발달 시각 식단 (DVD)'을 통해 AI 가 질감보다 형태에 기반한 견고하고 인간과 유사한 시각 능력을 획득할 수 있음을 보여줍니다.
이 논문은 노이즈가 있는 데이터로 물리 정보 신경망 (PINN) 을 학습할 때, 학습 오차가 노이즈 분산 이하로 떨어지려면 네트워크 크기가 특정 임계값을 넘어야 하며 단순히 데이터 양만 늘리는 것은 효과가 없음을 이론적 하한과 실험을 통해 규명했습니다.
이 논문은 대규모 언어 모델을 활용한 테이블 파인튜닝 전략과 삼중항 표현을 통해 실제 오류 분포를 충실히 반영하는 'TableEG' 프레임워크를 제안하여, 기존 합성 오류 생성의 한계를 극복하고 데이터 정제 기술의 실용적인 벤치마킹을 가능하게 합니다.
이 논문은 센서 고장이나 개인정보 보호로 인한 불완전한 멀티모달 데이터의 감정 인식 성능 저하 문제를 해결하기 위해, 모달리티 조합별 특성을 고려한 저랭크 적응 기법 (MCLA) 과 표현 공간의 분리 가능성을 기반으로 동적 파라미터 미세 조정을 수행하는 (DPFT) 새로운 프레임워크인 MCULoRA 를 제안하여 기존 방법보다 뛰어난 성능을 입증했습니다.
이 논문은 MLLM 검증기에서 발생하는 '동의 편향 (agreement bias)'을 해결하기 위해 사전 지식을 생성한 후 이를 기반으로 추론하는 '자기 기반 검증 (SGV)' 방법을 제안함으로써, 에이전트의 실패 감지 정확도와 태스크 완료율을 기존 최첨단 성능보다 크게 향상시켰다고 설명합니다.
이 논문은 생물학 및 생명과학 분야에서 유체 매칭 (Flow Matching) 의 기초와 변형, 그리고 생물학적 서열 모델링, 분자 생성 및 설계, 펩타이드 및 단백질 생성에 대한 응용을 체계적으로 검토하고 향후 방향을 제시하는 최초의 포괄적인 조사 연구입니다.
이 논문은 약한 모델이 생성한 성공 및 실패 트레젝토리를 계층적 '트레젝토리 트리'로 구성하고 몬테카를로 트리 탐색 (MCTS) 을 결합하여 복잡한 의사결정 환경에서 약한 모델의 감독 하에 강력한 모델의 최적 정책을 유도하는 새로운 약-강 일반화 (W2SG) 프레임워크를 제안합니다.
이 논문은 악의적인 감사 대상자가 공정한 것처럼 보이면서도 대표성을 갖춘 샘플을 조작하여 EU AI Act 와 같은 규제 하의 공평성 검사를 우회할 수 있음을 수학적으로 증명하고, 이를 탐지하기 위한 통계적 검증 방법과 대응 전략을 제시합니다.
이 논문은 정적 벤치마크의 한계를 극복하고 의료용 대형 언어 모델의 신뢰성을 확보하기 위해, 견고성·개인정보·편향·환각 등 4 가지 안전 축을 실시간으로 스트레스 테스트하는 동적·자동화·체계적 (DAS) 레드팀 프레임워크를 제안하고, 이를 통해 기존 벤치마크 점수와 실제 동적 안정성 간에 심각한 격차가 있음을 입증했습니다.
이 논문은 Gaussian Process 커널 조합과 구조적 인과 모델을 결합하여 현실적인 인과적 특성을 가진 합성 시계열 데이터를 생성함으로써, 실제 대규모 데이터에 의존하지 않고도 효율적으로 시계열 기초 모델을 사전 학습할 수 있는 'CauKer' 알고리즘을 제안합니다.
이 논문은 그래프 불변량을 예측하여 구조적 일반화 능력을 갖춘 그래프 기초 모델을 학습한 후, 이를 위치 인코딩으로 활용하여 도메인 간 일반화 성능을 극대화하는 'GraphProp'을 제안하고, 특히 노드 속성이 없는 그래프에서 기존 방법보다 우수한 성능을 입증합니다.
이 논문은 순환 신경망의 게이트 메커니즘이 상태 공간의 시간 척도와 매개변수 공간의 역학을 결합하여 고정된 학습률에서도 방향과 지연에 의존하는 유효 학습률을 생성하고, 이를 통해 최적화 과정을 데이터 기반의 전처리기로 작용하게 하여 훈련 안정성을 확보한다는 것을 보여줍니다.
이 논문은 임의의 샘플링률과 가변 길이의 신호를 처리할 수 있는 새로운 파운데이션 모델 'ECHO'를 제안하여 기계 신호 이상 탐지 및 고장 분류 분야에서 최첨단 성능을 입증했습니다.
이 논문은 다중 에이전트 간의 국소 내쉬 균형 상호작용 데이터를 기반으로 혼합 정수 선형 프로그래밍을 통해 제약 조건을 학습하고, 이를 통해 안전하고 견고한 운동 계획을 수립하는 역동적 게임 기반 알고리즘을 제안합니다.
이 논문은 조건부 잠재 확산 모델 (CbLDM) 을 제안하여 원자 쌍 분포 함수 (PDF) 로부터 단금속 나노입자의 나노구조를 물리적으로 타당하게 복원하는 새로운 접근법을 제시합니다.