Hybrid Quantum-Classical Encoding for Accurate Residue-Level pKa Prediction
이 논문은 가우시안 커널 기반의 양자 영감 특징 매핑과 고전적 구조 특징을 결합한 하이브리드 양자 - 고전 딥러닝 프레임워크를 제안하여, 기존 모델보다 우수한 일반화 성능과 실험적 전이성을 보이는 잔기 수준 pKa 예측 방법을 제시합니다.
3727 편의 논문
이 논문은 가우시안 커널 기반의 양자 영감 특징 매핑과 고전적 구조 특징을 결합한 하이브리드 양자 - 고전 딥러닝 프레임워크를 제안하여, 기존 모델보다 우수한 일반화 성능과 실험적 전이성을 보이는 잔기 수준 pKa 예측 방법을 제시합니다.
이 논문은 인간과 대형 언어 모델 (LLM) 의 협업을 통해 콜라츠 추측의 궤적에서 관찰된 모듈러 난수화와 갭 - 버스트 분해 구조를 분석하고, 이를 기반으로 수렴성을 예측하는 조건부 프레임워크를 제시합니다.
이 논문은 모델의 가중치를 업데이트하지 않고도 어텐션 싱크 현상을 완화하고 전역 어텐션을 재분배하여 대규모 언어 모델의 성능을 향상시키는 훈련 없는 추론 시 플러그인인 ARACH 를 제안합니다.
본 논문은 4,753 건의 실험 데이터를 기반으로 학습된 XGBoost 대리 모델을 활용하여 ReAct 에이전트 프레임워크가 고엔트로피 합금의 위상 예측을 넘어, 기존 문헌 기반의 단순 회상에서 벗어나 화학적 다양성을 갖춘 새로운 합금 조성의 역설계를 자동화하고 검증하는 새로운 패러다임을 제시함을 보여줍니다.
이 논문은 이동 로봇이 장애물로 가려진 인체를 더 잘 관측하기 위해 가시성, 크기, 완전성을 고려한 가려짐 인식 차기 최적 시점 (OA-NBV) 계획 파이프라인을 제안하며, 시뮬레이션 및 실세계 실험에서 기존 방법 대비 관측 성공률과 품질을 크게 향상시킨다는 것을 입증합니다.
이 논문은 회로 구성 요소와 공간 그리드를 단일 관계 표현으로 통합하는 이질적 그래프 기반의 'VeriHGN' 프레임워크를 제안하여, 기존 방법들보다 회로 혼잡도 예측의 정확도와 상관관계를 크게 향상시켰음을 보여줍니다.
이 논문은 실행 가능한 도구 실행을 먼저 수행하고 이를 역으로 추론하여 작업을 생성하는 'DIVE' 프레임워크를 제안함으로써, 데이터 양 증가보다 다양성 확장이 도구 사용 LLM 의 일반화 성능을 획기적으로 향상시킨다는 것을 입증했습니다.
이 논문은 코드 리뷰 에이전트의 실제 활용성을 평가하기 위해 CR-Bench 데이터셋과 CR-Evaluator 평가 파이프라인을 제안하고, 단순한 해결률 지표의 한계를 지적하며 문제 해결과 불필요한 발견 간의 숨겨진 트레이드오프를 규명합니다.
이 논문은 LLM 을 활용한 소프트웨어 설계의 품질을 향상시키기 위해 사용자 목표를 단계별 엔지니어링 절차와 자기 질문 (QoT) 체인으로 변환하는 새로운 프레임워크를 제안하고, 다양한 백엔드 도메인에서 모델 크기와 작업 복잡도에 따른 품질 개선 효과를 검증합니다.
이 논문은 대규모 언어 모델과 비 AI 시스템 구성 요소를 결합한 AI 에이전트의 보안 문제를 다루기 위해 설계 공간, 공격 지형, 방어 메커니즘을 체계적으로 분석하고 최초의 보안 위험 및 방어 전략 프레임워크를 제시하는 종합적인 조사 연구입니다.
본 논문은 자율주행 시스템의 핵심 병목 현상인 추론 능력의 부재를 해결하기 위해 인지 계층 구조를 제안하고, 대규모 언어 모델 기반의 통합 프레임워크를 체계적으로 분석하며, 지연 시간과 안전성 간의 긴장 관계를 해소할 수 있는 신경-기호적 아키텍처 등 향후 연구 방향을 제시합니다.
이 논문은 가역적 그래프 직렬화와 BPE 를 결합하여 그래프 구조를 시퀀스로 변환하는 토크나이저를 제안함으로써, 구조적 수정 없이도 BERT 와 같은 트랜스포머를 그래프 벤치마크에 적용해 기존 그래프 신경망 및 전용 트랜스포머보다 우수한 성능을 달성했습니다.
이 논문은 LeRobot 프레임워크를 기반으로 데이터 파이프라인 재구조화, 모델 최적화 (FlashAttention, FP8 등), 그리고 고성능 인프라 구축을 통해 그라 00T-N1.5 모델의 학습 속도를 40 배 가속화한 천 개 GPU 규모의 대규모 분산 학습 플랫폼과 종단 간 평가 시스템을 제시합니다.
이 논문은 강화학습의 학습 안정성과 제어 효율성을 향상시키기 위해 절대적 행동 대신 잔차 행동을 기반으로 한 새로운 'ResWM' 프레임워크를 제안하고, DeepMind 제어 스위트 실험을 통해 기존 모델보다 우수한 성능을 입증했습니다.
이 논문은 희소 혼합 전문가 (MoE) 모델의 라우팅 메커니즘이 단순한 부하 분산이 아닌 작업 유형에 따라 구조화된 특징을 보이며, 이를 '라우팅 서명'을 통해 정량화하고 작업 분류에 활용할 수 있음을 입증했습니다.
이 논문은 LLM 다중 에이전트 시스템의 토폴로지 기밀성을 침해하는 새로운 공격 프레임워크인 'WebWeaver'를 제안하며, 단일 에이전트의 컨텍스트만 활용하여 기존 방법보다 훨씬 은밀하고 정확하게 전체 토폴로지를 추론하는 방식을 제시합니다.
이 논문은 예측 결과의 공정성뿐만 아니라 모델의 추론 과정이 보호 그룹 간에 일관되게 유지되도록 하는 '그룹 반사실 통합 기울기 (GCIG)'라는 정규화 프레임워크를 제안하여, 설명의 불일치를 줄이고 절차적 공정성을 확보하는 새로운 접근법을 제시합니다.
이 논문은 비디오 비전 트랜스포머 모델에서 '성공 대 실패'라는 결과 신호가 어텐션 헤드가 증거를 수집하고 MLP 블록이 개념을 구성하는 분산된 인과 회로를 통해 점진적으로 증폭되는 메커니즘을 규명함으로써, 단순 분류 작업만 수행하는 모델 내부에도 신뢰할 수 있는 AI 를 구축하기 위해 파악해야 할 숨겨진 지식이 존재함을 보여줍니다.
이 논문은 지식 증류 시 학생 모델이 이미 숙달했거나 도달 불가능한 문제에서 발생하는 계산 낭비를 이론적으로 규명하고, 학생 모델의 역량 한계 부근의 문제에 집중하도록 설계된 'PACED' 프레임워크를 제안하여 다양한 증류 시나리오에서 성능을 획기적으로 향상시킨다는 내용입니다.
이 논문은 가중치 공간이 아닌 표현 공간에서 저랭크 선형 부분 공간을 활용한 명시적 개입을 통해 기존 방법론의 한계를 극복하고, 지속적인 학습에서 안정성과 가소성을 동시에 확보하는 새로운 패러다임인 'CoRe'를 제안합니다.