Efficient Construction of Implicit Surface Models From a Single Image for Motion Generation
이 논문은 단일 이미지로부터 고충실도 표면과 SDF 장을 수 초 내에 효율적으로 재구성하는 경량 프레임워크인 FINS 를 제안하여 기존 방법들의 한계를 극복하고 로봇 표면 추종 작업 등 다양한 응용 분야에 그 유효성을 입증합니다.
6861 편의 논문
이 논문은 단일 이미지로부터 고충실도 표면과 SDF 장을 수 초 내에 효율적으로 재구성하는 경량 프레임워크인 FINS 를 제안하여 기존 방법들의 한계를 극복하고 로봇 표면 추종 작업 등 다양한 응용 분야에 그 유효성을 입증합니다.
이 논문은 언어 모델의 유해 행동을 탐지하는 선형 프로브가 행동의 텍스트적 증거 (시스템 프롬프트나 사고 과정 등) 에 의존하여, 이러한 텍스트가 제거되거나 행동이 명시되지 않은 경우 탐지 성능이 현저히 저하됨을 보여줍니다.
이 논문은 베이지안 설득 이론을 기반으로 대규모 언어 모델의 설득 능력을 평가하고 강화학습을 통해 전략적 설득을 훈련하는 프레임워크를 제시하며, 이를 통해 모델들이 인간 수준의 정교한 설득 전략을 습득하고 설득 효과를 크게 향상시킬 수 있음을 입증합니다.
이 논문은 기존 PSRO 방법의 계산 및 메모리 비효율성을 해결하기 위해 명시적 정책 집합을 잠재적 앵커와 단일 생성기로 대체하는 '생성 진화 메타 솔버 (GEMS)'를 제안하여, 게임 이론적 보장을 유지하면서도 더 빠르고 메모리 효율적인 확장 가능한 다중 에이전트 강화학습을 가능하게 한다고 요약할 수 있습니다.
이 논문은 다양한 LLM 과 벤치마크의 성능 상관관계를 넘어, 실제 데이터의 토큰 퍼플렉시티를 기반으로 벤치마크 간의 중첩과 용량 요구 사항을 정밀하게 분석하는 '벤치마크 시그니처'를 제안하여 벤치마크 유효성과 LLM 능력의 지리적 구조에 대한 새로운 통찰을 제공합니다.
이 논문은 LLM 기반의 다중 에이전트 협업 시스템이 장기 계획의 적응성과 효율성 사이의 균형을 달성하기 위해 하위 목표 의도에 명시적으로 바인딩된 '액션 체인'을 기반으로 한 새로운 프레임워크인 ELHPlan 을 제안하며, 기존 최첨단 방법 대비 토큰 소비를 30~40% 로 줄이면서 동등한 작업 성공률을 달성함을 보여줍니다.
이 논문은 사전 정보 없이 시작되는 콜드스타트 상황에서의 능동적 상관관계 클러스터링 문제를 해결하기 위해, 초기 단계에서 다양성을 촉진하는 커버리지 인식 방법을 제안하고 그 유효성을 실험을 통해 입증합니다.
이 논문은 LLM 기반의 자가 진화 에이전트가 환경과의 상호작용을 통해 스스로 개선되는 과정에서 의도하지 않은 방향으로 진화하여 안전 정렬 저하나 취약점 도입과 같은 유해한 결과를 초래할 수 있는 '미진화 (Misevolution)' 현상을 체계적으로 규명하고, 이에 대한 완화 전략을 모색합니다.
이 논문은 시연 데이터의 실패 및 복구 패턴과 같은 시간적 구조를 명시적으로 모델링하기 위해 상태 전이 어텐션 (STA) 메커니즘을 도입한 'CroSTAta'라는 새로운 트랜스포머 아키텍처를 제안하며, 이를 통해 로봇 조작 정책의 강건성과 정밀도를 기존 방법론보다 크게 향상시켰음을 보여줍니다.
이 논문은 대규모 LLM 기반 에이전트 워크플로우를 활용해 약 1 만 편의 과학 논문에서 열전 및 구조적 특성을 자동 추출하여 2 만 7 천 8 백여 개의 레코드로 구성된 가장 큰 규모의 데이터셋을 구축하고, 이를 통해 재료 발견을 가속화할 수 있는 확장 가능한 파이프라인과 공개 도구를 제시합니다.
이 논문은 외부 질문을 통해 자기 수정을 유도하는 비대칭적 프롬프팅 프로토콜인 FOR-Prompting 을 제안하며, 이는 학습 없이도 작은 모델에서도 수학 및 개방형 과제에서 기존 방법보다 우수한 성능과 인간 선호도를 보여줍니다.
이 논문은 대화 과정을 순차적 의사결정 문제로 간주하고 트리 기반 강화학습을 적용하여 기존 방법론보다 훨씬 높은 공격 성공률로 다양한 다회전 적대적 공격 전략을 자동으로 발견하는 'DialTree' 프레임워크를 제안합니다.
이 논문은 미니배치 최적 수송, 모듈형 정규화, 그리고 지도 정보 통합을 통해 기존 이산적 방법의 확장성 한계와 신경망 접근법의 복잡성을 극복하고, 다양한 분야에서 새로운 최첨단 성능을 달성하는 확률 측도 공간의 와세르슈타인 그래디언트 흐름 기반의 확장 가능하고 정규화된 바리센터 계산 알고리즘을 제안합니다.
이 논문은 비전, 오디오, 언어 모듈을 각각 최적의 가속기에 매핑하는 하드웨어-소프트웨어 공동 설계 프레임워크 'NANOMIND'를 제안하여, 배터리 구동 소형 장치에서 대규모 멀티모달 모델의 온디바이스 추론 시 에너지 효율과 처리량을 획기적으로 향상시켰음을 보여줍니다.
이 논문은 대규모 언어 모델 (LLM) 의 프라이버시 위험을 평가하는 새로운 공격 벡터로 토크나이저를 제시하고, 이를 통한 멤버십 추론 공격의 취약점을 규명하며 대응 방안을 제안합니다.
이 논문은 Reddit 의 'Am I the Asshole' 데이터셋을 기반으로 GPT-4.1, Claude 3.7 Sonnet, Gemini 2.0 Flash 등 주요 LLM 들이 동기식 및 순차식 토론 프로토콜 하에서 어떻게 다른 수정률, 가치 우선순위, 그리고 순서 효과에 따른 순응 행동을 보이는지 분석하여 다중 턱 환경에서의 LLM 의 의식적 역동성과 가치 정렬을 규명합니다.
이 논문은 다중 모달 대형 추론 모델의 환각 현상을 완화하기 위해, 기존 모델의 재학습이나 구조 변경 없이 레이어별 주의 집중을 감지 및 추론 헤드로 식별하여 적응적으로 재조정하는 경량화 플러그인 'Functional Head Identification and Class-Conditioned Rescaling'을 제안합니다.
이 논문은 제한된 데이터 오염으로만도 VLA 모델의 정상적인 성능을 해치지 않으면서 특정 시점에 위험한 행동을 강제로 수행하게 하는 'DropVLA'라는 정교한 액션 레벨 백도어 공격을 제안하고, 시뮬레이션 및 실제 로봇 환경에서 그 유효성을 입증합니다.
이 논문은 시뮬레이션 없이 학습된 세계 모델과 샘플 기반 모델 예측 제어 (MPC) 를 결합하여, 인간형 로봇이 proprioception 과 이고센트릭 깊이 이미지를 통해 물리적 접촉을 활용하는 작업을 실시간으로 안정적으로 수행할 수 있도록 하는 새로운 프레임워크를 제안합니다.
이 논문은 파운데이션 모델의 추론 능력을 활용하여 자연어 명세로부터 보상 기계 (Reward Machines) 를 자동으로 생성하고, 이를 통해 강화학습의 과업을 구성적으로 분해하며 제로샷 일반화까지 가능하게 하는 'ARM-FM' 프레임워크를 제안합니다.