Maximizing Asynchronicity in Event-based Neural Networks
이 논문은 이벤트 카메라의 비동기적 특성을 언어 모델링 기법에 빗대어 고안된 EVA 프레임워크를 통해 기존 동기화 방식보다 표현력과 일반화 성능을 극대화하고, 인식 및 검출 태스크에서 새로운 성능 기준을 제시했습니다.
9153 편의 논문
이 논문은 이벤트 카메라의 비동기적 특성을 언어 모델링 기법에 빗대어 고안된 EVA 프레임워크를 통해 기존 동기화 방식보다 표현력과 일반화 성능을 극대화하고, 인식 및 검출 태스크에서 새로운 성능 기준을 제시했습니다.
이 논문은 ESG 및 지속 가능성 분야에 특화된 대규모 언어 모델 (LLM) 의 능력을 평가하고 향상시키기 위해, 전문가 검증을 거친 1,136 개의 질문과 231 개의 핵심 문서로 구성된 'ESGenius'라는 최초의 종합 벤치마크를 소개하고, 이를 통해 RAG(검색 증강 생성) 방식이 특히 소형 모델의 성능을 크게 향상시킨다는 것을 입증했습니다.
이 논문은 언어 모델의 특정 잠재적 특징이나 행동을 유도하는 입력을 생성하는 '맥락 수정' 접근법을 제안하고, 이를 평가하는 벤치마크 'ContextBench'를 소개하며, LLM 보조와 확산 모델 인페인팅을 결합한 진화적 프롬프트 최적화 (EPO) 변형이 유창성과 유도 효과를 동시에 달성하는 최첨단 성능을 보인다고 주장합니다.
이 논문은 파인튜닝 없이 고정된 LLM 의 시스템 프롬프트를 사용자 입력에 맞춰 적응적으로 조정하는 'Sysformer'를 제안하여, 유해한 입력에 대한 거절률을 최대 80% 향상시키고 안전한 입력에 대한 준수율을 최대 90% 높이며 다양한 재킹킹 공격에 대한 모델의 견고성을 극대화한다고 요약할 수 있습니다.
이 논문은 비전 트랜스포머의 그리드 기반 토큰화 한계를 극복하고, 오라클 가이드 탐색을 통해 이미지의 연속적인 서브픽셀 위치에 토큰을 배치하는 SPoT 기법을 제안하여 추론 시 필요한 토큰 수를 획기적으로 줄이면서도 정확도를 향상시키는 새로운 패러다임을 제시합니다.
이 논문은 TCR-pMHC 결합을 해석하기 위해 기존 XAI 방법의 한계를 극복하는 새로운 사후 해석 기법인 QCAI 를 제안하고, 실험적으로 확인된 274 개 TCR-pMHC 구조로 구성된 TCR-XAI 벤치마크를 통해 해석 가능성과 예측 정확도 측면에서 최첨단 성능을 입증했습니다.
이 논문은 자율주행의 다중모달 융합 인식을 위해 차량 내 네트워크를 통해 시계열 동기화를 교란하는 '데자뷰 (DejaVu)' 공격을 제안하며, 이는 객체 감지 및 추적 성능을 극도로 저하시켜 충돌이나 유령 제동과 같은 심각한 안전 사고를 유발할 수 있음을 실증합니다.
이 논문은 자율주행 에이전트가 규칙 기반 시나리오의 한계를 극복하고 일상부터 위기 상황까지 다양한 교통 행동을 학습할 수 있도록, 학생 - 교사 프레임워크와 적응형 다중 에이전트 강화학습을 통해 자동 커리큘럼을 생성하는 새로운 방법을 제안합니다.
이 논문은 적응형 감쇠와 학습 가능한 주파수 변조를 도입하여 시간 의존 편미분 방정식의 해 연산자를 효율적으로 학습하는 새로운 '상태 공간 신경 연산자 (SS-NO)' 아키텍처를 제안하고, 다양한 PDE 벤치마크에서 기존 방법보다 적은 파라미터로 최첨단 성능을 달성함을 보여줍니다.
이 논문은 -노름의 모reau 포락선을 기반으로 한 다변량 잠재 함수를 도입하여 기존 Fields of Experts 방법을 일반화함으로써, 딥러닝 기반 정규화자와 유사한 성능을 유지하면서도 더 적은 데이터와 파라미터로 빠른 수렴 보장을 제공하는 새로운 이미지 재구성 프레임워크를 제안합니다.
이 논문은 과지정된 2 성분 혼합 선형 회귀 모델에서 EM 알고리즘의 거동을 이론적으로 분석하여, 초기 혼합 가중치의 균형 여부에 따라 회귀 파라미터의 수렴 속도 (선형 대 하선형) 와 유한 표본에서의 통계적 정확도 ( 대 ) 가 어떻게 달라지는지 규명했습니다.
이 논문은 기존 유클리드 공간의 한계를 극복하고 비선형 구조를 효과적으로 포착하기 위해 VICReg 목적 함수를 재생 커널 힐베르트 공간 (RKHS) 으로 확장한 'Kernel VICReg'를 제안하고, 다양한 데이터셋에서 기존 방법보다 우수한 성능을 입증합니다.
이 논문은 이기적인 다중 작업 환경에서 그래디언트 충돌을 완화하기 위해 전문가 혼합 (MoE) 아키텍처를 도입하고 학습 과정 중 동적 파라미터 확장 (DPS) 전략을 적용하여, 단일 모델로도 전문 단일 작업 에이전트와 경쟁력 있는 성능을 달성하면서도 환경 상호작용을 71.5% 로 줄인 'ScaleZero'를 제안합니다.
이 논문은 심층 앙상블 신경망을 활용하여 연속 측정 데이터로부터 양자 매개변수를 추정할 때 불확실성을 정량화하고, 드리프트를 감지하며, 기존 베이지안 추론보다 빠른 추론 속도를 달성할 수 있음을 보여줍니다.
이 논문은 해킹 공격에 대한 LLM 의 안전성을 강화하기 위해 답변 생성 전 사고 과정을 통해 위험성을 평가하는 'Answer-Then-Check' 방식을 제안하고, 이를 위해 구축된 8 만 건의 ReSA 데이터셋을 통해 안전성과 일반 성능을 동시에 개선하는 결과를 입증했습니다.
이 논문은 물리 정보 신경 연산자 (PINO) 를 통해 차량별 물리 매개변수를 추정하고 근접 정책 최적화 (PPO) 를 활용한 강화학습으로 충전 계획과 경로를 동시에 최적화하여, 기존 에너지 인식 A* 알고리즘 대비 20 배 이상의 추론 속도와 우수한 일반화 성능을 보이는 전기차 네비게이션 에이전트 'VEGA'를 제안합니다.
이 논문은 구면 텐서 표현의 복잡성을 극복하고 스칼라 및 텐서 관측량을 통합적으로 처리할 수 있는 새로운 '텐서 원자 클러스터 전개 (TACE)' 모델을 제안하여 분자 및 재료 시스템의 다양한 물성 예측에서 뛰어난 정확성과 확장성을 입증했습니다.
이 논문은 연방 지속 학습에서 프롬프트 간 클래스별 지식 일관성 부족으로 인한 공간적 및 시간적 망각 문제를 해결하기 위해, 국소 클래스 분포 보상과 클래스 인식 프롬프트 집계 기법을 도입한 C²Prompt 를 제안하여 최첨단 성능을 달성함을 보여줍니다.
이 논문은 아그레시브 U-Net 과 CNN 을 결합한 이중 네트워크 아키텍처를 통해 미시 구조적 기하학과 수축 프로파일을 기반으로 콘크리트의 시간 의존적 전장 손상 진화와 기계적 특성을 효율적으로 예측하여 혼합 설계 최적화를 가능하게 하는 새로운 딥러닝 접근법을 제시합니다.
이 논문은 인간의 운동 계층 구조와 시간적 역학을 모두 보존하는 잠재 표현을 학습하기 위해 쌍곡 다양체 상의 가우스 프로세스 동역학 모델을 확장하고, 이를 손 잡기 계층 구조를 기반으로 한 물리적으로 일관된 새로운 운동 생성을 가능하게 하는 3 가지 메커니즘을 제안합니다.