Unifying Logical and Physical Layout Representations via Heterogeneous Graphs for Circuit Congestion Prediction
이 논문은 회로 구성 요소와 공간 그리드를 단일 관계 표현으로 통합하는 이질적 그래프 기반의 'VeriHGN' 프레임워크를 제안하여, 기존 방법들보다 회로 혼잡도 예측의 정확도와 상관관계를 크게 향상시켰음을 보여줍니다.
11537 편의 논문
이 논문은 회로 구성 요소와 공간 그리드를 단일 관계 표현으로 통합하는 이질적 그래프 기반의 'VeriHGN' 프레임워크를 제안하여, 기존 방법들보다 회로 혼잡도 예측의 정확도와 상관관계를 크게 향상시켰음을 보여줍니다.
이 논문은 실행 가능한 도구 실행을 먼저 수행하고 이를 역으로 추론하여 작업을 생성하는 'DIVE' 프레임워크를 제안함으로써, 데이터 양 증가보다 다양성 확장이 도구 사용 LLM 의 일반화 성능을 획기적으로 향상시킨다는 것을 입증했습니다.
이 논문은 코드 리뷰 에이전트의 실제 활용성을 평가하기 위해 CR-Bench 데이터셋과 CR-Evaluator 평가 파이프라인을 제안하고, 단순한 해결률 지표의 한계를 지적하며 문제 해결과 불필요한 발견 간의 숨겨진 트레이드오프를 규명합니다.
이 논문은 LLM 을 활용한 소프트웨어 설계의 품질을 향상시키기 위해 사용자 목표를 단계별 엔지니어링 절차와 자기 질문 (QoT) 체인으로 변환하는 새로운 프레임워크를 제안하고, 다양한 백엔드 도메인에서 모델 크기와 작업 복잡도에 따른 품질 개선 효과를 검증합니다.
이 논문은 대규모 언어 모델과 비 AI 시스템 구성 요소를 결합한 AI 에이전트의 보안 문제를 다루기 위해 설계 공간, 공격 지형, 방어 메커니즘을 체계적으로 분석하고 최초의 보안 위험 및 방어 전략 프레임워크를 제시하는 종합적인 조사 연구입니다.
본 논문은 자율주행 시스템의 핵심 병목 현상인 추론 능력의 부재를 해결하기 위해 인지 계층 구조를 제안하고, 대규모 언어 모델 기반의 통합 프레임워크를 체계적으로 분석하며, 지연 시간과 안전성 간의 긴장 관계를 해소할 수 있는 신경-기호적 아키텍처 등 향후 연구 방향을 제시합니다.
이 논문은 가역적 그래프 직렬화와 BPE 를 결합하여 그래프 구조를 시퀀스로 변환하는 토크나이저를 제안함으로써, 구조적 수정 없이도 BERT 와 같은 트랜스포머를 그래프 벤치마크에 적용해 기존 그래프 신경망 및 전용 트랜스포머보다 우수한 성능을 달성했습니다.
이 논문은 LeRobot 프레임워크를 기반으로 데이터 파이프라인 재구조화, 모델 최적화 (FlashAttention, FP8 등), 그리고 고성능 인프라 구축을 통해 그라 00T-N1.5 모델의 학습 속도를 40 배 가속화한 천 개 GPU 규모의 대규모 분산 학습 플랫폼과 종단 간 평가 시스템을 제시합니다.
이 논문은 강화학습의 학습 안정성과 제어 효율성을 향상시키기 위해 절대적 행동 대신 잔차 행동을 기반으로 한 새로운 'ResWM' 프레임워크를 제안하고, DeepMind 제어 스위트 실험을 통해 기존 모델보다 우수한 성능을 입증했습니다.
이 논문은 희소 혼합 전문가 (MoE) 모델의 라우팅 메커니즘이 단순한 부하 분산이 아닌 작업 유형에 따라 구조화된 특징을 보이며, 이를 '라우팅 서명'을 통해 정량화하고 작업 분류에 활용할 수 있음을 입증했습니다.
이 논문은 LLM 다중 에이전트 시스템의 토폴로지 기밀성을 침해하는 새로운 공격 프레임워크인 'WebWeaver'를 제안하며, 단일 에이전트의 컨텍스트만 활용하여 기존 방법보다 훨씬 은밀하고 정확하게 전체 토폴로지를 추론하는 방식을 제시합니다.
이 논문은 예측 결과의 공정성뿐만 아니라 모델의 추론 과정이 보호 그룹 간에 일관되게 유지되도록 하는 '그룹 반사실 통합 기울기 (GCIG)'라는 정규화 프레임워크를 제안하여, 설명의 불일치를 줄이고 절차적 공정성을 확보하는 새로운 접근법을 제시합니다.
이 논문은 비디오 비전 트랜스포머 모델에서 '성공 대 실패'라는 결과 신호가 어텐션 헤드가 증거를 수집하고 MLP 블록이 개념을 구성하는 분산된 인과 회로를 통해 점진적으로 증폭되는 메커니즘을 규명함으로써, 단순 분류 작업만 수행하는 모델 내부에도 신뢰할 수 있는 AI 를 구축하기 위해 파악해야 할 숨겨진 지식이 존재함을 보여줍니다.
이 논문은 지식 증류 시 학생 모델이 이미 숙달했거나 도달 불가능한 문제에서 발생하는 계산 낭비를 이론적으로 규명하고, 학생 모델의 역량 한계 부근의 문제에 집중하도록 설계된 'PACED' 프레임워크를 제안하여 다양한 증류 시나리오에서 성능을 획기적으로 향상시킨다는 내용입니다.
이 논문은 가중치 공간이 아닌 표현 공간에서 저랭크 선형 부분 공간을 활용한 명시적 개입을 통해 기존 방법론의 한계를 극복하고, 지속적인 학습에서 안정성과 가소성을 동시에 확보하는 새로운 패러다임인 'CoRe'를 제안합니다.
이 논문은 비선형적인 멀티 어댑터 구조를 도입하여 기존 메모리 의존성과 낮은 학습 효율성을 해결하고, CLIP 기반 제로샷 능력을 극대화하는 효율적인 점진적 학습 프레임워크 'SimE'를 제안합니다.
이 논문은 2024 년 8 월부터 2026 년 2 월까지 출시된 7 가지 최첨단 AI 모델을 기업 네트워크 및 산업 제어 시스템 사이버 공격 시나리오에서 평가한 결과, 추론 시 계산량 증가와 모델 세대 발전에 따라 다단계 공격 수행 능력이 비약적으로 향상되었음을 보여줍니다.
이 논문은 지식 그래프 기반의 다단계 질문 응답 (QA) 에서 삼중항 (triple) 변환 시 발생하는 맥락 손실 문제를 해결하기 위해, 엔터티 중심 요약과 통합 인덱싱 기법 (MDER) 과 질의 분해 및 추론 메커니즘 (DR) 을 결합한 새로운 RAG 프레임워크를 제안하고, 이를 통해 기존 베이스라인 대비 최대 66% 의 성능 향상을 입증했습니다.
이 논문은 대규모 언어 모델이 이전 출력을 기반으로 반복적으로 텍스트를 생성하는 '마르코프 생성 사슬' 과정을 분석하여, 온도 파라미터와 초기 입력에 따라 문장 다양성이 증가하거나 감소할 수 있음을 규명하고 다중 에이전트 시스템에 대한 시사점을 제시합니다.
이 논문은 기존 방법들의 의미적 편향과 지식 망각 문제를 해결하고 특정 편집의 정밀한 취소가 가능한 최초의 'SoLA'라는 의미 기반 라우팅을 활용한 LoRA 프레임워크를 제안하여, 영구적인 모델 편집을 효과적으로 구현하는 방법을 제시합니다.