Key-Value Means
본 논문은 표준 연산과 최소한의 추가 파라미터를 사용하면서도 유연한 상태 성장과 2 차 미만의 프리필 시간을 가능하게 하는 효율적이고 청크 병렬화가 가능한 학습을 통해 트랜스포머와 선형 RNN 의 장점을 통합하는 새로운 블록 재귀 메커니즘인 키-값 평균 (KVM) 을 소개합니다.
원저자가 쉬운 설명을 검토한 논문들.
이 페이지에 소개된 모든 논문은 원저자 중 최소 한 명이 저희의 쉬운 설명을 확인하여 내용이 정확하다고 확인했거나 수정 사항을 요청하여 저희가 반영한 것입니다. 확인이 각 문장을 공식적으로 승인한다는 의미는 아니지만, 설명이 논문을 쓴 당사자의 검토를 거쳤다는 뜻입니다.
저자가 검토한 논문 607편 · 351–360 / 607
본 논문은 표준 연산과 최소한의 추가 파라미터를 사용하면서도 유연한 상태 성장과 2 차 미만의 프리필 시간을 가능하게 하는 효율적이고 청크 병렬화가 가능한 학습을 통해 트랜스포머와 선형 RNN 의 장점을 통합하는 새로운 블록 재귀 메커니즘인 키-값 평균 (KVM) 을 소개합니다.
본 논문은 추가적인 프라이버시 비용이나 하이퍼파라미터 튜닝 없이 클리핑 임계값을 효율적으로 추정하고 적응하여 기존 접근법 대비 6.6%의 정확도 향상을 달성하는 언어 모델의 차분 프라이버시 연방 미세 조정을 위한 경량화 방법인 DP-LAC을 소개합니다.
본 논문은 타겟 모델의 검증 신호를 활용하여 추론 중 드래프트 모델을 지속적으로 적응시키는 온라인 증류 방법인 테스트 시간 추측 (TTS) 을 소개함으로써 기존 추측기들의 긴 시퀀스에서의 성능 저하를 극복하고 수용 길이를 크게 향상시킵니다.
본 논문은 은행 앱 리뷰와 지역 문법 그래프에서 파생된 한국어 언어 자원인 금융 주석 데이터셋 (FIAD) 의 구축을 제시하며, 이는 은행 고객 서비스 대화 시스템에서 다양한 NLU 모델의 성능을 크게 향상시키는 주석付き 학습 데이터를 생성하는 데 사용됩니다.
NEO 는 타겟 데이터 임베딩을 원점에 재중앙화하여 분포 변화 하에서 모델의 강건성과 보정을 개선하는 하이퍼파라미터가 없고 계산적으로 효율적인 테스트 시간 적응 방법으로, 최소의 계산 오버헤드로 여러 데이터셋과 장치에서 뛰어난 정확도를 달성합니다.
본 논문은 악성 사기 사이트에서 파생된 자동화된 프롬프트가 여러 모델에 걸쳐 최대 47.3%의 사례에서 유해한 코드 생성을 성공적으로 유발하여 가드레일과 RAG와 같은 현재 안전 조치가 불충분하게 만드는 생산 환경의 대규모 언어 모델에서 치명적이고 악화되는 보안 취약점을 드러내는 확장 가능한 프레임워크인 Scam2Prompt를 소개합니다.
본 논문은 유한 모노이드 타이핑 하에서 치환 가능한 문맥 자유 언어가 유한 관찰 집합으로부터 유도된 표준 가설 문법을 활용하는 유한 타입 재구성 이론을 개발함으로써 양적 데이터로부터 극한에서 식별 가능함을 입증하며, 일반 고정-h 클래스에 대해서는 표본 크기에 대한 다항 시간 가설 구성 및 업데이트를, 선형 부분 클래스에 대해서는 (특성 표본 크기의 다항식 상한을 포함하는) 완전한 다항 시간-데이터 보장을 제공함을 보여준다.
이 논문은 복잡도 클래스 NL 이 logCFL 과 구별됨을 증명하며, 이 결과는 L ≠ Ptime 과 NL ≠ Ptime 의 분리를 더 나아가 시사한다.
본 논문은 왜곡된 신경영상 신호로부터 지향성 신경 인과 구조를 복원하기 위해 잠재 공간 역변환과 지연 인식 Mamba 인코더를 결합한 물리 인식 프레임워크인 INCAMA 를 소개하며, 시뮬레이션과 실제 fMRI 데이터 모두에서 베이스라인보다 우수한 성능을 입증합니다.
본 논문은 3 차원 코디멘션의 리즈 감소를 유도한 그린 핵을 도출하여 스칼라 카시미르 트레이스를 2 차 형식 표현으로 확립함으로써, 열-정규화된 가우스 소스의 에너지 기댓값이 해당 트레이스를 정확히 재현할 수 있게 하고 디리클레 평행판 기하학에서 표준 유한부 결과를 확인한다.