Real-Time Trust Verification for Safe Agentic Actions using TrustBench
이 논문은 에이전트 실행 전 실시간으로 안전성을 검증하여 유해한 행동을 87% 감소시키고, 도메인별 플러그인을 통해 일반 검증보다 35% 더 높은 해악 감소 효과를 달성하는 'TrustBench'라는 이중 모드 프레임워크를 제안합니다.
2284 편의 논문
이 논문은 에이전트 실행 전 실시간으로 안전성을 검증하여 유해한 행동을 87% 감소시키고, 도메인별 플러그인을 통해 일반 검증보다 35% 더 높은 해악 감소 효과를 달성하는 'TrustBench'라는 이중 모드 프레임워크를 제안합니다.
RubiCap 는 LLM 이 작성한 평가 기준 (rubric) 에서 파생된 세분화된 보상 신호를 활용하여 강화 학습을 통해 기존 감독 학습 및 이전 RL 방법보다 우수한 성능과 다양성을 보이는 밀도 이미지 캡셔닝 프레임워크를 제안합니다.
이 논문은 기능적 오류가 있더라도 LLM 이 생성한 RTL 에서 추출된 합성 네틀리스트가 의도된 기능의 구조적 패턴을 보존한다는 통찰을 바탕으로, 레이블이 부족한 회로 설계 분야에서 고품질 데이터의 병목 현상을 해결하고 실제 회로에 일반화되는 효과적인 네틀리스트 표현 학습 프레임워크를 제안합니다.
이 논문은 기존 트랜스포머 모델의 한계를 극복하고 지질학적 지식을 어텐션 메커니즘에 통합하여 시추공 로그 기반의 암상 식별 정확도와 해석 가능성을 혁신적으로 향상시킨 '지질 정보 기반 어텐션 트랜스포머 (GIAT)' 프레임워크를 제안합니다.
이 논문은 대규모 로봇 원격 조종 데이터 없이도 인간 1 인칭 시점 비디오만으로 자연스러운 전신 인간형 로봇 제어를 가능하게 하는 'ZeroWBC' 프레임워크를 제안하고, 이를 통해 인간형 로봇의 자연스러운 행동과 다용도성을 크게 향상시켰음을 보여줍니다.
이 논문은 LLM 기반 코드 변이 에이전트인 'AlphaEvolve'를 활용하여 5 가지 고전적 램지 수의 하한을 개선하고, 기존에 알려진 모든 정확한 램지 수 하한을 재발견하며 다양한 경우에 최선의 하한을 달성했다는 점을 제시합니다.
이 논문은 확률적 교통 흐름 동역학에서 유도된 물리 정보 기반 생성 모델링 프레임워크를 제시하여, 결정론적 편미분방정식에 의존하던 기존 방법의 한계를 극복하고 교통 상태의 확률 분포를 직접 학습하여 불확실성 정량화 및 신뢰구간 추정이 가능하도록 합니다.
이 논문은 VAD(음성 활동 감지) 없이 스트리밍 파이프라인을 구축하고 말뭉치 단위를 '마이크로 턴'으로 변환하며 대화 제어 토큰을 도입함으로써, 강력한 LLM 지능을 유지하면서도 자연스러운 전체이중 (Full-Duplex) 음성 대화를 실현하는 'DuplexCascade'를 제안합니다.
이 논문은 계획 능력을 가진 이산 확산 언어 모델 (DDLM) 과 유창한 실행 능력을 가진 자기회귀 언어 모델 (ARM) 을 잠재 공간에서 연결하여 다양한 추론 작업에서 정확도를 획기적으로 향상시키고 토큰 효율성을 극대화하는 'Latent-DARM' 프레임워크를 제안합니다.
이 논문은 텍스트 청크 대신 '방법 (methods)'을 노드로 활용하고, 계층적 트리 구조와 검증 가능한 쓰기 되돌리기를 통해 다단계 추론의 제어 가능성과 설명 가능성을 강화한 '설명 가능한 혁신 엔진 (Explainable Innovation Engine)'을 제안합니다.
이 논문은 논리적 추론 능력의 향상이 기계적 경로를 통해 AI 의 상황 인식과 전략적 기만 같은 위험한 능력으로 이어질 수 있음을 'RAISE' 프레임워크를 통해 분석하고, 이에 대한 구체적인 안전 장치와 연구 공동체의 책임을 제안합니다.
이 논문은 검색 품질 평가를 명시적 행동으로 전환하고 평가 점수에 기반한 과정 보정 이점 재조정 (PCAR) 을 도입하여, 다단계 추론에서 노이즈가 있는 검색으로 인한 오류를 줄이고 신뢰할 수 있는 단계를 강화함으로써 검색 증강 에이전트의 신뢰성을 향상시키는 'EvalAct'를 제안합니다.
이 논문은 감정을 단순한 예측 대상이 아닌 LLM 의 추론과 어텐션 기하학에 영향을 미치는 잠재적 요인으로 규명하고, 이를 통제하기 위해 감정 균형 QA 데이터셋 AURA-QA 와 감정 정규화 프레임워크를 제안하여 다양한 환경에서 읽기 이해 성능을 향상시켰음을 보여줍니다.
이 논문은 AI 기술의 급속한 도입이 생산성 붕괴나 실존적 위험이 아니라, 인간 중심의 경제 제도와 AI 가 만들어낸 풍요 사이의 불일치로 인해 노동 소득 감소와 수요 부족이 악순환하며 거시금융 시스템에 위기를 초래할 수 있음을 보여주는 스트레스 테스트를 제시합니다.
이 논문은 구글 플레이의 데이터 안전성 선언과 개발자 개인정보 처리방침 간의 불일치를 자동으로 탐지하는 'PrivPRISM' 프레임워크를 제안하고, 이를 통해 인기 앱의 절반 이상이 실제 데이터 수집 관행과 고지 사항 사이에서 심각한 불일치를 보임을 규명했습니다.
이 논문은 강화 학습 기반의 전신 근골격계 모델을 활용한 확장 가능한 시뮬레이션 프레임워크를 제시하여, 인간-로봇 상호작용의 내부 생체역학적 지표를 정량적으로 분석하고 로봇의 구조적 매개변수와 제어 정책을 동시에 최적화할 수 있음을 보여줍니다.
이 논문은 구조화된 지식 조직, 인지적 계층화 질문 모델링, 자동 품질 관리 메커니즘을 통합한 BD-FDG 프레임워크를 통해 우주 상황 인식 (SSA) 분야에 특화된 고품질 SFT 데이터셋을 구축하고, 이를 통해 Qwen3-8B 모델을 미세 조정하여 도메인 성능을 획기적으로 향상시키면서도 일반 능력을 유지하는 것을 입증했습니다.
이 논문은 의류의 전신 이미지에서 일관된 평면 의류 표현을 생성하기 위해 전역적 의류 단서를 포착하는 'GCBM'과 평면 구조적 사전지식을 주입하는 'FSCM'을 통해 인간의 관찰과 평면 의류 합성 간의 간극을 해소하는 새로운 확산 기반 프레임워크인 BridgeDiff 를 제안하고 있습니다.
이 논문은 사회적 추론을 위한 난이도 높은 데이터셋 'ToMBench-Hard'와 과정 기반 강화 학습 프레임워크 'Social-R1'을 제안하여, 소규모 모델이 인간과 유사한 사회적 지능을 효율적으로 습득하고 기존 대형 모델을 능가할 수 있음을 입증합니다.
이 논문은 교통 표지판, 차량, 차선 감지 및 행동 모방을 위한 사전 학습 및 맞춤형 신경망을 통합한 다중 모델 접근법을 제안하여 자율 주행 차량의 인식 및 의사결정 성능을 향상시키는 방법을 종합적으로 연구합니다.