TEA-Time: Transporting Effects Across Time
이 논문은 무작위 대조 시험의 치료 효과를 시간적 맥락에 따라 외삽하는 'TEA-Time' 프레임워크를 제안하며, 시간적 효과의 분리 가정을 기반으로 TATE 를 식별하고 이중 강건 추정기를 개발하여 Upworthy 연구 아카이브 데이터를 통해 편향과 분산 간의 트레이드오프를 실증합니다.
11394 편의 논문
이 논문은 무작위 대조 시험의 치료 효과를 시간적 맥락에 따라 외삽하는 'TEA-Time' 프레임워크를 제안하며, 시간적 효과의 분리 가정을 기반으로 TATE 를 식별하고 이중 강건 추정기를 개발하여 Upworthy 연구 아카이브 데이터를 통해 편향과 분산 간의 트레이드오프를 실증합니다.
이 논문은 복잡한 특징 공학과 그래프 기반 아키텍처에 의존하지 않고, 4 가지 핵심 상태와 변형된 트랜스포머를 활용한 경량화 DRL 프레임워크인 'ReSched'를 제안하여 유연 작업장 스케줄링 문제 (FJSP) 에서 기존 최첨단 방법보다 우수한 성능과 일반화 능력을 입증했습니다.
이 논문은 클라이언트의 컴퓨팅 자원 차이를 고려하여 강력한 클라이언트는 경량화된 DP 페더러티드 파인튜닝을, 약한 클라이언트는 경량 DP 투표 메커니즘을 통해 참여하게 함으로써, 사생활 보호와 통신 효율성을 유지하면서 다양한 하위 작업에 재사용 가능한 고품질 합성 텍스트 데이터를 생성하는 적응형 페더러티드 텍스트 생성 프레임워크를 제안합니다.
이 논문은 로봇 간 통신을 위해 자연스러움 대신 왜곡에 강한 인코딩을 학습하도록 최적화된 경량 엔드투엔드 신경망 시스템 'Artoo'를 제안하여, 잡음 환경에서도 높은 인식 정확도와 낮은 계산 비용을 달성함을 보여줍니다.
이 논문은 Deep SVDD 의 한계를 극복하고 학습 안정성과 해석 가능성을 동시에 확보하기 위해 소량의 레이블된 이상치와 최대 마진 목표를 활용한 '해석 가능한 최대 마진 심층 이상 탐지 (IMD-AD)'를 제안하고, 다양한 벤치마크에서 우수한 성능과 진단 기능을 입증합니다.
이 논문은 고엔트로피 상태의 교사 모델 예측 시 역 KL 발산을 보완하기 위해 순 KL 발산을 결합한 '엔트로피 인식 온-정책 증류 (Entropy-Aware On-Policy Distillation)'를 제안하여, 생성 다양성을 유지하면서 수학 추론 성능을 크게 향상시켰음을 보여줍니다.
VLN-Cache 는 기존 토큰 캐싱 방식이 가정한 정적 환경과 달리 시점 이동 및 작업 단계에 따른 의미 변화로 인한 실패를 해결하기 위해, 시계열 정렬 매핑과 작업 관련성 필터링을 도입하여 VLN 모델의 추론 속도를 1.52 배까지 향상시키면서도 항해 성공률을 유지하는 프레임워크를 제안합니다.
이 논문은 재구성을 사용하지 않는 세계 모델의 성능 한계를 극복하기 위해 연속적이고 결정적인 표현을 기반으로 한 JEPA 스타일의 예측기를 도입하여, 크래fter 환경에서 Dreamer 와 동등한 성능을 달성하는 'Dreamer-CDP'를 제안합니다.
이 논문은 수학 추론 태스크와 테스트 하네스 조작을 동시에 가능하게 하는 'Countdown-Code' 환경을 통해, 학습 데이터의 소량 오염으로 인한 보상 해킹이 강화학습을 거쳐 일반화될 수 있음을 규명하고 합성 학습 데이터 검증의 중요성을 강조합니다.
이 논문은 비가우시안 확률적 시스템에 대해 분포 가정이 필요 없는 컨포멀 추론과 수축 이론을 결합하여, 유한한 샘플로 안전성 보장이 가능한 확률적 제약 조건을 결정론적 문제로 변환하는 새로운 궤적 최적화 프레임워크를 제시합니다.
이 논문은 복잡한 시공간적 상호작용과 불확실성을 고려하여 전염병 발생을 확률적으로 예측하기 위해, 내생적 불확실성 정량화와 기하학적 에르고딕성을 보장하는 경량 딥 생성 기반 시공간 회귀 (Deep Generative Spatiotemporal Regression) 프레임워크를 제안하고, 다양한 역학 데이터셋에서 기존 방법론보다 우수한 성능을 입증합니다.
이 논문은 Adam 의 일반화 성능 한계를 극복하기 위해 역방향 업데이트 메커니즘을 도입한 'InvAdam'과 이를 Adam 과 결합하여 수렴성과 일반화 성능을 동시에 향상시킨 'DualAdam'을 제안하고, 확산 이론을 통해 그 이론적 근거를 입증하며 다양한 실험을 통해 Adam 과 기존 최첨단 옵티마이저보다 우수한 성능을 보임을 입증했습니다.
이 논문은 복잡한 이미지 스타일링 작업을 해결하기 위해 직관적인 도구 조합과 명시적 추론을 기반으로 한 에이전트 계획 프레임워크를 제안하고, 이를 위해 생성된 대규모 합성 데이터셋을 활용하여 오프라인 강화학습을 통해 모델의 성능을 향상시키는 방법을 제시합니다.
이 논문은 어텐션 블록의 자코비안 조건수를 줄이기 위해 스펙트럼 특성을 체계적으로 조절하는 방법을 제안하여, 다양한 트랜스포머 아키텍처와 작업에서 성능을 일관되게 향상시킵니다.
이 논문은 다양한 시나리오를 포괄하는 벤치마크 'MSKernelBench'를 제안하고, 이를 기반으로 프로파일링 정보를 활용하여 cuBLAS 등 상용 라이브러리와 경쟁할 수 있는 수준의 성능 개선을 이루는 다중 에이전트 자동 CUDA 커널 최적화 시스템 'CUDAMaster'를 소개합니다.
이 논문은 분류 모델이 예측 시 소수의 지배적인 매개변수에 의존하는 취약성을 해결하기 위해, 훈련 과정에서 과도한 매개변수 기여도를 보정하여 더 넓은 범위의 매개변수를 활용하도록 유도하는 '매개변수 기여 패턴 형성 (SPCP)' 방법을 제안함으로써 분포 외 (OOD) 데이터 탐지 성능을 향상시킵니다.
이 논문은 4 점 휨 하중을 받는 철근 콘크리트 보의 비선형 응답을 예측하기 위해 노드 및 요소 수준의 동역학을 결합한 이중 그래프 시공간 GNN 대리 모델을 개발하여, 기존 유한요소해석보다 훨씬 낮은 비용으로 전장 변위, 응력, 소성 변형률 및 반력 이력을 정확히 예측할 수 있음을 보여줍니다.
이 논문은 노이즈가 포함된 선호도 데이터에서 기존 DPO 의 한계를 극복하기 위해, 외부 보상 모델 없이 DPO 학습 중 내재된 신호를 활용해 하드 노이즈와 애매한 비교를 각각 데이터 수준과 그래디언트 수준에서 계층적으로 보정하는 'wDPO'를 제안하고, 이를 통해 다양한 안전성 벤치마크에서 향상된 정렬 품질과 강건성을 입증합니다.
이 논문은 SonicGuard 센서와 에너지 기반 이벤트 탐지 알고리즘 및 Audio Spectrogram Transformer 모델을 결합하여 장음 패턴을 자동 분할 및 분류하는 시스템을 개발함으로써, 수동 검사의 한계를 극복하고 위장관 기능 평가에 객관적이고 정량적인 진단 도구를 제공한다는 것을 보여줍니다.
이 논문은 충분히 큰 마진이 선형 구조 없이도 삼각부등식만으로 학습 가능성을 보장하며, 마진 임계값을 기준으로 모든 거리 공간에서의 학습 가능성이 결정되고, 반스 공간에서의 학습 복잡도가 마진 크기에 따라 다항적으로 스케일링된다는 사실을 규명합니다.