What We Don't C: Manifold Disentanglement for Structured Discovery
이 논문은 조건부 안내 변수에 포함된 정보를 명시적으로 제거하여 잠재 흐름 정합 (latent flow matching) 을 기반으로 의미 있는 잔차 표현을 생성하고, 이를 통해 학습된 표현에서 포착되지 않은 변인들을 효과적으로 발견하고 제어할 수 있는 'What We Don't C'라는 새로운 접근법을 제시합니다.
3857 편의 논문
이 논문은 조건부 안내 변수에 포함된 정보를 명시적으로 제거하여 잠재 흐름 정합 (latent flow matching) 을 기반으로 의미 있는 잔차 표현을 생성하고, 이를 통해 학습된 표현에서 포착되지 않은 변인들을 효과적으로 발견하고 제어할 수 있는 'What We Don't C'라는 새로운 접근법을 제시합니다.
본 논문은 주파수 공간의 진폭과 픽셀 공간의 값을 모두 대상으로 그라디언트 기반의 민감도 맵을 활용하여 적응형 증강을 수행하는 D-GAP 을 제안함으로써, 도메인 간 편향을 줄이고 실세계 및 벤치마크 데이터셋에서 아웃오브도메인 강인성을 크게 향상시킵니다.
이 논문은 자동차 원격 측정 데이터의 느린 드리프트와 빠른 스파이크 동역학을 분리하여 처리하는 듀얼 경로 라우팅 메커니즘을 도입한 STREAM-VAE 를 제안함으로써, 기존 재구성 기반 방법들의 한계를 극복하고 다양한 작동 모드에서 안정적인 이상 탐지 성능을 달성했습니다.
이 논문은 산재된 원격탐사 기초 모델 (RSFM) 정보를 체계화한 데이터베이스 'RS-FMD'를 구축하고, 이를 기반으로 제약 조건을 고려하여 자연어 질의에 맞춰 최적의 모델을 자동 선정하고 그 이유를 설명하는 에이전트 'REMSA'를 제안하며, 전문가 검증 벤치마크를 통해 기존 방법보다 우수한 성능을 입증했습니다.
이 논문은 불완전하고 민감한 의료 데이터를 기반으로 대규모 언어 모델의 특정 지식을 정밀하게 삭제하면서도 핵심 의료 역량은 유지하기 위해 기하학적 제약과 개념 인식 토큰 개입을 통합한 계층적 이중 전략 언러닝 프레임워크를 제안하고, 이를 통해 높은 망각률과 지식 보존률을 달성함과 동시에 파라미터 수정을 최소화하여 규제 준수 및 윤리적 기준을 충족함을 보여줍니다.
이 논문은 실제 상업적 타당성을 평가하기 위해 SEC filings 및 AIS 손상 보고서와 같은 산업 표준 데이터를 Isaac Sim 시뮬레이션과 결합한 최초의 물리 기반 경제 내비게이션 벤치마크인 'CostNav'를 제안하며, 기존 내비게이션 방법론들이 모두 경제적 손실을 초래한다는 점을 규명했습니다.
이 논문은 인도 수학 올림피아드 문제를 기반으로 인간 검증이 이루어진 312 개의 Lean 4 정리 세트를 포함한 IndiMathBench 벤치마크를 소개하며, 이를 통해 대형 언어 모델의 자동 형식화 및 정리 증명 능력의 한계를 평가하고 있습니다.
이 논문은 로봇 계획 및 편집과 같은 제어 가능한 비디오 생성 모델의 환각 현상을 해결하기 위해, 잠재 공간에서 학습된 밀도 불확실성 정량화 방법인 C3 를 제안하여 생성된 비디오의 신뢰할 수 없는 영역을 픽셀 단위로 정확히 식별하고 보정하는 기술을 소개합니다.
이 논문은 분자 언어 모델, 강화 학습, 몬테카를로 트리 탐색을 통합한 'Trio' 프레임워크를 제안하여, 기존 생성 모델의 한계를 극복하고 결합 친화도, 약물 유사성, 합성 접근성을 모두 향상시키면서도 분자 다양성을 4 배 이상 확장하는 폐쇄 루프형 표적 분자 설계 패러다임을 제시합니다.
이 논문은 다양한 환경에서 최대 리스크를 최소화하는 원칙 (MaxRM) 을 기반으로 한 랜덤 포레스트 변형 알고리즘을 제안하고, 효율적인 계산 방법과 통계적 일관성을 증명하며 MSE, 보상, 후회 (regret) 등 세 가지 리스크 지표에 적용 가능한 것을 보여줍니다.
이 논문은 고비용의 외부 교사 모델에 의존하지 않고 RL 훈련 중 생성된 체크포인트를 병합하여 '무료' 교사 모델로 활용함으로써, 멀티모달 에이전트 훈련의 효율성과 성능을 동시에 극대화하는 GTR-Turbo 방법을 제안합니다.
이 논문은 이질적인 배터리 데이터의 부족과 다양성이라는 과제를 해결하고, 13 개의 데이터셋으로 사전 학습된 '사전 학습 배터리 트랜스포머 (PBT)'라는 최초의 기초 모델을 통해 다양한 배터리 화학 조성과 조건에서 기존 최첨단 방법보다 평균 21.8% 높은 정밀도로 수명을 예측하는 범용 시스템을 제시합니다.
이 논문은 TLS 3D 포인트 클라우드를 기반으로 YOLOv8 모델을 활용해 7 종의 유럽 수종을 96% 의 정확도로 분류하고, Finer-CAM 을 적용한 설명 가능한 AI 기법을 통해 모델이 수종 식별 시 주로 수관이나 줄기 등 어떤 구조적 특징에 의존하는지 해석 가능하게 분석한 연구입니다.
이 논문은 '베이즈 풍동'이라는 통제된 환경을 통해 트랜스포머가 주어진 컨텍스트에서 베이즈 추론을 수행하며, 이는 잔류 스트림, 피드포워드 네트워크, 어텐션 메커니즘이 각각 믿음의 기반, 사후 확률 업데이트, 콘텐츠 기반 라우팅을 담당하는 기하학적 구조로 구현됨을 입증합니다.
이 논문은 교차 엔트로피 손실 함수를 통한 그래디언트 학습이 어텐션 점수와 값 벡터의 공진화적 특화를 유도하여 베이지안 매니폴드를 조각내며, 이것이 컨텍스트 내 확률적 추론을 가능하게 하는 기하학적 구조를 형성한다는 메커니즘을 분석합니다.
본 논문은 Pythia, Llama-3 등 다양한 대규모 언어 모델에서도 소규모 모델에서 관찰된 베이지안 추론의 기하학적 특징 (예측 엔트로피와 상관된 주성분 축) 이 유지되며, 이를 통한 불확실성 추정이 이루어짐을 확인하고 해당 기하학적 구조가 불확실성의privileged한 읽기 도구임을 입증했습니다.
이 논문은 검색 증강 LLM 의 과도한 검색 문제를 다각도로 분석하고, 효율성-정확도 균형을 측정하는 새로운 지표인 'Tokens Per Correctness(TPC)'를 제안하며, 이를 완화하기 위한 방법과 관련 데이터셋인 OverSearchQA 를 공개합니다.
이 논문은 기업용 LLM 환경에서 데이터 유출을 방지하기 위해 부서 간 격리를 보장하는 안전한 멀티테넌트 아키텍처 (SMTA) 와 사용 후 즉시 소멸되는 'Burn-After-Use'메커니즘을 제안하고, 다양한 공격 시나리오와 실패 조건에 대한 실험을 통해 그 유효성을 입증했습니다.
이 논문은 모델 컨텍스트 프로토콜 (MCP) 환경에서 도구 호출 체인을 악용하여 기존 단일 회선 공격의 한계를 넘어, 은밀하게 토큰 소모와 비용을 극대화하는 새로운 형태의 DoS 공격 기법을 제안하고 그 위험성을 입증합니다.
이 논문은 다크 소울 3 의 실시간 전투 환경을 대상으로 방향성 스킬 그래프와 계층적 커리큘럼을 통해 5 가지 재사용 가능한 스킬을 학습하고, 환경 변화 시 일부 스킬만 선택적으로 적응시켜 효율적으로 성능을 회복하는 지속 학습 에이전트 프레임워크를 제안합니다.