A Consensus-Driven Multi-LLM Pipeline for Missing-Person Investigations
이 논문은 72 시간이라는 골든타임을 활용하여 실종 아동 수색을 지원하기 위해, 여러 특화 LLM 과 합의 엔진을 조율하고 QLoRA 미세조정 기법을 적용한 '가디언' 시스템의 설계와 검증을 제시합니다.
5016 편의 논문
이 논문은 72 시간이라는 골든타임을 활용하여 실종 아동 수색을 지원하기 위해, 여러 특화 LLM 과 합의 엔진을 조율하고 QLoRA 미세조정 기법을 적용한 '가디언' 시스템의 설계와 검증을 제시합니다.
이 논문은 차원의 저주로 인해 기존 동적 계획법의 적용에 한계가 있는 고차원 경제 모델에 대해 강화 학습이 제공하는 유연한 대안과 그 이론적 기반, 실용적 예시, 그리고 현재 직면한 한계점을 종합적으로 검토합니다.
이 논문은 혼합 전문가 (MoE) 모델이 훈련 시 효율적이지만 추론 시 '이중 페널티'로 인해 대역폭 병목 현상이 발생하여 긴 컨텍스트 환경에서 밀집형 모델보다 성능이 저하될 수 있음을 'qs 부등식'을 통해 규명하고, MoE 를 훈련 최적화 기법으로 간주하고 추론 효율성을 위해 밀집형 모델로 증류하는 방안을 제안합니다.
이 논문은 쌍곡 다양체 상의 열 커널 확산을 통해 지식 그래프의 연속적인 해상도 조절을 가능하게 하고, 스펙트럼 갭을 기반으로 자동으로 의미적 추상화 수준을 탐지하는 '의미적 상세도 (SLoD)' 프레임워크를 제안합니다.
이 논문은 IoT 데이터 스트림의 개념 변화와 시간적 의존성을 처리하기 위해 비틀스키의 사회문화적 학습 이론에 기반한 자율적 상호 지원 학습 패러다임인 'MAcPNN'을 제안하고, 이를 통해 기존 연동 학습 방식보다 효율적으로 성능을 향상시키는 방법을 제시합니다.
이 논문은 불확실한 교란 분포를 가진 마르코프 결정 과정 (MDP) 에 대해 경험적 분포 기반의 모호성 집합을 정의하고, 약수렴과 거리 함수 수렴을 연결하여 유한 표본에서의 높은 확률 성능 보장, 수렴 속도, 및 표본 복잡도 한계를 증명하는 데이터 기반 강건 MDP 프레임워크를 제시합니다.
이 논문은 복잡한 의료 시나리오에서 다수결 투표의 한계를 극복하고 Med-RPM 을 활용한 세분화된 전문가 기반 보상 신호로 강화 학습을 유도함으로써, 의료 AI 의 추론 신뢰성과 확장성을 획기적으로 개선하는 MAPLE 프레임워크를 제안합니다.
이 논문은 생성 모델을 통계적 추론의 관점에서 재해석하여 유동 매칭 (Flow Matching) 을 기반으로 결측치 대체, 반사실 분석, 생존 분석 등 구조화된 고차원 문제에서 추론의 유효성을 보장하는 새로운 통계적 프레임워크를 제시합니다.
이 논문은 사전 훈련된 오토리거시티브 정규화 흐름 (AR-NF) 모델의 준결정적 결합 (coupling) 을 증류하여 독립 결합이나 최적 수송 결합보다 우수한 성능을 내면서도 교사 모델 자체를 개선하는 새로운 '정규화 흐름 매칭 (NFM)' 방법을 제안합니다.
이 논문은 완전 연결 네트워크에 국한되거나 근사적인 기존 방법의 한계를 극복하기 위해, 합성곱 신경망 (CNN) 의 기하학적 구조를 정확히 반영하는 폐쇄형 평탄도 측정치를 제안하고 이를 통해 CNN 모델의 일반화 성능을 정밀하게 평가하고 아키텍처 설계에 활용할 수 있음을 입증합니다.
이 논문은 개념 변화 (concept drift) 발생 후 재학습에 필요한 충분한 데이터 크기를 결정하기 위해, 동적 시스템의 상태 의존성을 활용한 단일 패스 가중 국소 회귀 기반의 데이터 전용 테스트 'CALIPER'를 제안하고 다양한 도메인에서 그 유효성을 입증합니다.
이 논문은 중앙 집중식 처리의 한계를 극복하기 위해 하드웨어와 물리 법칙을 공동으로 안내하는 분산 과학 머신러닝 프레임워크 'EPIC'을 제안하여, 경량 인코딩과 물리 인식 디코딩을 통해 통신 지연과 에너지 소모를 획기적으로 줄이면서도 물리적 정밀도를 유지하거나 향상시킨다는 점을 보여줍니다.
이 논문은 LLM 기반 계획과 강화학습을 양방향으로 결합하여 실행 피드백을 통해 기술 명세를 반복적으로 정제하는 'SCALAR' 프레임워크를 제안하며, Craftax 환경에서 기존 최선 방법론 대비 1.9 배 향상된 성능을 입증했습니다.
이 논문은 ARM TrustZone 의 비효율적인 리소스 격리 문제를 해결하기 위해 유연한 메모리 및 NPU 격리 메커니즘을 도입하여 모바일 기기에서 LLM 추론 속도와 보안을 동시에 극대화하는 'FlexServe' 시스템을 제안합니다.
본 논문은 원격 환자 모니터링 데이터를 실시간으로 분석하여 개별 임상진료자보다 높은 민감도로 응급 상황을 식별하고, 확장 가능한 비용 효율적인 임상 분류를 가능하게 하는 자율 AI 에이전트 'Sentinel'의 개발과 유효성을 입증했습니다.
이 논문은 시뮬레이션 오차를 의사결정 영향도에 따라 재가중하는 적대적 보정 메커니즘과 시뮬레이션 불확실성 하에서 정책 학습을 안정화하는 그룹 상대적 교란 전략을 통해, 공급망 등 임무 중대 분야에서 견고한 시뮬레이션-의사결정 학습 프레임워크인 Sim2Act 를 제안합니다.
이 논문은 로봇 학습의 성능을 높이기 위해 검증 데이터의 손실 감소에 기여하는 정도를 기반으로 각 시연 데이터의 품질을 정량화하고, 영향 함수 (influence functions) 를 활용해 고품질 데이터를 체계적으로 선별하는 'Quality over Quantity (QoQ)' 방법을 제안합니다.
본 논문은 제한된 데이터와 다양한 운영 조건 하에서 위성 전자기기의 온궤도 신뢰성 예측 정확도를 향상시키기 위해, Wiener 과정 기반의 고장 모델과 공간적 상관관계를 통합한 적응형 능동 학습 프레임워크를 제안합니다.
이 논문은 개념 변화 (Concept Drift) 를 재발생과 신규 발생으로 재정의하고, 각각에 맞춰 역사적 패턴을 활용하거나 안정적인 일반 전문가로 전환하는 'DynaME'라는 새로운 하이브리드 프레임워크를 제안하여 온라인 시계열 예측 성능을 크게 향상시킵니다.
이 논문은 고정된 샘플링 하이퍼파라미터 대신 강화학습을 통해 추론 시 계산 자원에 따라 동적으로 샘플링 전략을 선택하는 경량 디코딩 어댑터를 제안하여, 수학 및 코딩 벤치마크에서 고정된 예산 대비 정확도를 크게 향상시킨다는 점을 설명합니다.