FBFL: A Field-Based Coordination Approach for Data Heterogeneity in Federated Learning
이 논문은 데이터 이질성 (non-IID) 과 중앙 집중식 아키텍처의 한계를 해결하기 위해 매크로프로그래밍과 필드 조정을 활용한 새로운 분산 계층적 접근법인 FBFL 을 제안하고, 비동일 분포 환경에서 기존 최첨단 방법들보다 우수한 성능과 장애 내성을 입증합니다.
10052 편의 논문
이 논문은 데이터 이질성 (non-IID) 과 중앙 집중식 아키텍처의 한계를 해결하기 위해 매크로프로그래밍과 필드 조정을 활용한 새로운 분산 계층적 접근법인 FBFL 을 제안하고, 비동일 분포 환경에서 기존 최첨단 방법들보다 우수한 성능과 장애 내성을 입증합니다.
이 논문은 클리핑, 헤비볼 모멘텀, 오차 피드백을 결합한 새로운 알고리즘인 Clip21-SGD2M 을 제안하여, 데이터 이질성이 심한 비볼록 분산 최적화 문제에서도 최적의 수렴 속도와 강력한 차분 프라이버시 보장을 동시에 달성함을 증명합니다.
이 논문은 제어로서의 추론 (Control as Inference) 프레임워크를 기반으로 생성적 의사결정 모델을 제어자, 모델러, 최적화자, 평가자라는 네 가지 기능적 역할로 분류하는 체계적인 분류법을 제시하고, 이를 embodied AI, 자율주행, 과학 AI 등 고위험 도메인에서의 적용 사례와 한계를 분석하여 일반적 물리 지능 (Generalist Physical Intelligence) 의 발전 방향을 제시합니다.
이 논문은 기존 방법의 한계를 극복하고 현재 사이클의 센서 데이터만으로 기계의 잔여 수명을 예측하기 위해 양방향 적대 신경망과 공변량 인코딩을 결합한 BACE-RUL 모델을 제안하며, 터보팬 엔진 및 리튬이온 배터리 등 다양한 실제 데이터셋을 통해 기존 최첨단 방법보다 우수한 성능을 입증합니다.
이 논문은 지도 안전 미세 조정이 표면적인 텍스트 패턴과 안전 응답 간의 허위 상관관계를 강화하여 '안전 환상'을 초래한다는 문제를 지적하고, 유해한 지식을 직접 제거하는 머신 언러닝을 통해 공격 성공률을 60.27% 줄이고 불필요한 거절은 84.20% 이상 감소시키는 효과적인 대안을 제시합니다.
이 논문은 기존 벤치마크의 데이터 오염과 확장성 한계를 극복하기 위해 의미 보존 변이를 활용한 새로운 평가 프레임워크를 제안하고, 대규모 실험을 통해 현재 대형 언어 모델의 결함 국소화 능력이 실제 의미론적 추론보다는 문법적 단서에 과도하게 의존하고 있음을 규명했습니다.
이 논문은 다양한 시간 척도에서 정보를 처리할 수 있도록 서로 다른 샘플링 속도를 가진 여러 Mamba 블록을 통합한 새로운 아키텍처인 ms-Mamba 를 제안하며, 다양한 벤치마크에서 기존 최첨단 모델보다 우수한 성능과 효율성을 입증합니다.
이 논문은 초기 기상 상태와 기후학적 평균을 통합하고 불확실성 증강 트랜스포머를 활용하여 기존 수치 모델 및 데이터 기반 모델보다 우수한 성능을 보이는 전 지구적 아계절~계절 (S2S) 기상 예측 모델 'TianQuan-S2S'를 제안합니다.
이 논문은 청정 참조 데이터 없이도 노이즈가 많은 acquisitions 에서 탁월한 재구성 품질을 제공하는 자기지도 학습 기반의 딥러닝 고스트 이미징 재구성 방법인 'Noise2Ghost'를 제안하며, 이를 통해 저조도 X 선 형광 이미징 등 다양한 첨단 응용 분야에서 신호 대 잡음비 문제를 해결할 수 있음을 보여줍니다.
이 논문은 실제 그래프의 민감도 특성을 활용하여 제안 - 테스트 - 공개 (PTR) 프레임워크를 기반으로 사생활 보호를 보장하면서도 기존 방법 대비 180 배 빠른 실행 속도와 높은 정확도로 네트워크 주성분 및 밀집 서브그래프를 추정하는 확장 가능한 차분 프라이버시 알고리즘을 제안합니다.
이 논문은 변분 추론의 관점에서 로그-호모토피 입자 흐름을 재해석하여, 피셔-라오 그래디언트 흐름을 기반으로 가우시안 및 가우시안 혼합물 근사 입자 흐름을 유도하고 선형 가우시안 가정 하에서 기존 다움-황 입자 흐름과 일치함을 보이며 다양한 차원의 추정 문제에 대한 유효성을 입증합니다.
이 논문은 정교한 공간적 상호작용과 장기적인 시간적 일관성을 동시에 해결하기 위해 계층적 유한 스칼라 양자화 (HFSQ) 와 블록 단위 국소 컨텍스트 (BLC) 전략을 도입한 확산 기반 반응형 댄스 생성 프레임워크인 ReactDance 를 제안합니다.
이 논문은 클라우드 컴퓨팅의 가상 머신 스케줄링 문제를 해결하기 위해 대규모 언어 모델 (LLM) 을 활용한 계층적 에이전트 프레임워크 'MiCo'를 제안하며, 이를 통해 기존 방법들의 한계를 극복하고 대규모 시나리오에서 96.9% 의 높은 경쟁 비율을 달성함을 입증합니다.
이 논문은 Simpson 의 역설이나 선택 편향과 같은 통계적 함정을 식별하고 해결하는 능력을 평가하기 위해 'CausalPitfalls'라는 새로운 벤치마크를 제안하고, 이를 통해 현재 대규모 언어 모델 (LLM) 이 인과 추론에서 심각한 한계를 보임을 입증합니다.
이 논문은 문법 제약과 자기지도식 비축약성 신호를 활용하여 셸 입력 - 출력 데이터를 생성하고 실행 행동을 모델링하는 새로운 환경인 ShIOEnv 를 제안하며, 이를 통해 기존 실행 기반 접근법보다 향상된 정확도를 달성하는 210 만 개의 데이터셋을 공개했습니다.
이 논문은 강화 학습 미세 조정 (RFT) 을 통해 비주얼 언어 모델 (VLM) 이 텍스트와 중간 시각적 추론 단계를 교차하며 차트 및 표와 같은 구조화된 시각적 질문 답변을 수행할 때 '이미지로 사고'하는 능력을 학습하도록 하는 최초의 프레임워크인 VTool-R1 을 제안합니다.
이 논문은 특정 집중 및 마진 조건 하에서 단순한 힌지 손실 최소화 변형을 통해 상수 수준의 악성 노이즈가 존재하는 상황에서도 -희소 반공간을 개의 샘플로 효율적으로 학습하는 새로운 알고리즘과 그 분석을 제시합니다.
이 논문은 기존 방법들의 한계를 극복하고 잠재 가중치 없이 부울 도메인에서 직접 미세 조정이 가능한 멀티 커널 부울 파라미터를 기반으로 한 새로운 프레임워크를 제안하여 대규모 언어 모델의 복잡성을 획기적으로 줄이면서도 성능을 향상시켰음을 보여줍니다.
이 논문은 이산적 토큰 대신 연속적 토큰을 활용한 연쇄 사고 (CoT2) 를 통해 병렬 추론을 가능하게 하고, 새로운 감독 전략과 샘플링 기법을 통해 논리적 추론 성능과 효율성을 획기적으로 개선하는 이론적 근거와 알고리즘을 제시합니다.
이 논문은 웹 검색 결과가 모순되거나 노이즈가 많을 때 사실 기반 추론 능력을 평가하기 위한 새로운 벤치마크인 SealQA 를 소개하고, 최신 최첨단 언어 모델들조차 이 환경에서 심각한 성능 저하와 계산량 증가에 따른 개선 한계를 보임을 규명합니다.