Improving through Interaction: Searching Behavioral Representation Spaces with CMA-ES-IG
이 논문은 로봇이 인간의 선호도를 학습할 때 단순한 학습 효율성뿐만 아니라 사용자의 경험까지 고려하여, CMA-ES-IG 알고리즘을 통해 더 효과적이고 사용자 친화적인 행동 표현 공간을 탐색하는 방법을 제안하고 실험을 통해 검증합니다.
5185 편의 논문
이 논문은 로봇이 인간의 선호도를 학습할 때 단순한 학습 효율성뿐만 아니라 사용자의 경험까지 고려하여, CMA-ES-IG 알고리즘을 통해 더 효과적이고 사용자 친화적인 행동 표현 공간을 탐색하는 방법을 제안하고 실험을 통해 검증합니다.
고비용과 지연 시간, 개인정보 보호 문제를 해결하기 위해 제안된 'Meissa'는 40K 개의 정제된 궤적 데이터를 기반으로 학습된 4B 파라미터 규모의 경량 멀티모달 의료 에이전트 모델로, 오프라인 환경에서도 선진 모델에 버금가는 성능을 발휘하며 복잡한 의료 의사결정을 지원합니다.
이 논문은 AI 와의 상호작용을 단순한 성능 평가가 아닌 사용자의 주관적 체험으로 이해하기 위해 현상학적 접근을 제안하고, 이를 위한 방법론적 도구와 디자인 개념을 제시합니다.
본 논문은 다중 에이전트 LLM 게임의 불안정성과 성능 저하를 해결하기 위해, 자기대결을 통해 구조화된 통찰력을 기억하고 불확실성을 고려한 탐색을 결합한 'MEMO' 프레임워크를 제안하여 다양한 텍스트 기반 게임에서 승률을 크게 향상시키고 결과의 변동성을 줄이는 효과를 입증했습니다.
이 논문은 LLM 의 컨텍스트 창을 메모리 계층 구조로 재해석하고, Pichay 라는 수요 기반 페이징 시스템을 통해 생산 환경에서 컨텍스트 소비를 최대 93% 까지 줄이는 동시에 상태 유지 문제를 해결하는 방법을 제시합니다.
이 논문은 양자 소프트웨어의 비결정적 특성으로 인한 '플래키 테스트'를 탐지하고 근본 원인을 분석하기 위해 대규모 언어 모델 (LLM) 을 활용한 자동화 파이프라인을 제안하며, 이를 통해 기존 데이터셋을 54% 확장하고 플래키 테스트 분류 및 원인 규명에서 높은 정확도를 입증했습니다.
이 논문은 성공 편향된 인간 시연 대신 자율적 로봇 놀이 (self-play) 를 통해 물리적으로 일관된 고충실도 비디오 세계 모델을 학습하는 'PlayWorld'를 제안하며, 이를 통해 접촉이 많은 상호작용 예측 정확도를 높이고 실제 환경에서의 정책 성공률을 65% 까지 향상시킨다고 설명합니다.
이 논문은 상태 공간 모델링과 약한 신호 어텐션 융합을 통해 하이퍼스펙트럼 이미지 내 약한 신호의 붕괴 문제를 해결하고, 기존 최첨단 방법들보다 RMSE 와 SAD 를 각각 최대 55% 와 63% 까지 감소시킨 새로운 심층 분해 프레임워크인 WS-Net 을 제안합니다.
이 논문은 언어 모델 에이전트의 행동적 평가와 실제 정체성 조직화를 구분하기 위해 스택 이론의 시간적 간극을 활용하여 지속성 점수와 정체성 모폴스페이스를 제안함으로써, 안정된 자아처럼 말하는 것과 실제로 조직화되어 있는 것을 분리하는 보수적인 정체성 평가 도구를 제시합니다.
이 논문은 프롬프트, 코드, 모델 구성 등 다양한 요소를 안정적이고 재현 가능한 방식으로 다중 라운드에 걸쳐 최적화할 수 있도록 설계된 통합 엔지니어링 프로토콜인 'EPOCH'을 제안합니다.
본 논문은 원격 환자 모니터링 데이터를 실시간으로 분석하여 개별 임상진료자보다 높은 민감도로 응급 상황을 식별하고, 확장 가능한 비용 효율적인 임상 분류를 가능하게 하는 자율 AI 에이전트 'Sentinel'의 개발과 유효성을 입증했습니다.
이 논문은 시뮬레이션 오차를 의사결정 영향도에 따라 재가중하는 적대적 보정 메커니즘과 시뮬레이션 불확실성 하에서 정책 학습을 안정화하는 그룹 상대적 교란 전략을 통해, 공급망 등 임무 중대 분야에서 견고한 시뮬레이션-의사결정 학습 프레임워크인 Sim2Act 를 제안합니다.
이 논문은 텍스트 작성을 주된 상호작용으로 하여 영상 제작의 진입 장벽을 낮추고 시각적 스토리텔링을 혁신하는 새로운 생성형 비디오 저작 인터페이스 'Doki'를 제안하고, 다양한 전문성을 가진 사용자를 대상으로 한 배포 연구를 통해 그 유효성을 입증합니다.
이 논문은 고정된 밀도 깊이와 의미론적 패치 특징을 3D 가우시안 원시 객체로 변환하는 가우시안 공간 토크나이저 (GST) 와 3D 깊이 인식 체인 오브 씽킹 (DA-CoT) 추론을 도입하여 LIBERO 와 SimplerEnv 환경에서 기존 VLA 모델보다 뛰어난 정밀도와 성능을 달성한 GST-VLA 를 제안합니다.
이 논문은 2007 년부터 2024 년까지의 데이터에 기반하여, Qwen3 모델로 미세 조정된 LLM 을 활용해 뉴스 감성을 추출하고 이를 기존 표형 데이터와 결합한 LSTM 모델이 시장 변동성이 높은 기간에 알루미늄 가격 예측 및 투자 수익률 (샤프 지수 1.04) 을 기존 모델보다 크게 향상시킨다는 것을 입증했습니다.
이 논문은 자동주행을 위한 잠재적 세계 모델에 대한 통합 분류법과 평가 체계를 제시하고, 구조적 동형성 및 장기적 안정성 등 다섯 가지 핵심 메커니즘을 분석하여 검증 가능하고 자원 효율적인 의사결정 시스템으로의 발전 방향을 제시합니다.
이 논문은 피부암 진단을 지원하기 위해 참조 이미지와 텍스트 설명을 결합한 복합 질의에 대해 전역 및 지역적 특징을 정렬하는 트랜스포머 기반 프레임워크를 제안하고, Derm7pt 데이터셋에서 기존 최첨단 방법보다 우수한 성능을 입증했습니다.
이 논문은 대규모 언어 모델 (LLM) 을 구조화된 의미 교사로서 활용하여 사전 학습된 후 제거함으로써, 적은 데이터로 높은 성능을 내면서도 임상 환경에 배포 가능한 경량 의료 비전 트랜스포머 (ViT) 인 'VIVID-Med'프레임워크를 제안합니다.
이 논문은 기능적 건물 내의 높은 유사성으로 인한 기존 언어 기반 내비게이션의 한계를 극복하기 위해, 사전 지도를 활용한 의미적 사전 지도 생성, 계층적 사고 체인 프롬프트, 그리고 다중 모델 협업 메커니즘을 도입한 'PM-Nav'를 제안하고 시뮬레이션 및 실세계 환경에서 기존 방법 대비 획기적인 성능 향상을 입증합니다.
이 논문은 다관절 손의 복잡한 제어를 위한 비전 - 언어 - 행동 (VLA) 모델의 사후 훈련을 위해 인간 개입을 통합한 최초의 프레임워크인 'DexHiL'을 제안하며, 실시간 교정 및 데이터 샘플링 전략을 통해 기존 오프라인 미세 조정 대비 평균 25% 높은 성공률을 달성함을 보여줍니다.