On the Geometric Structure of Layer Updates in Deep Language Models
이 논문은 딥러닝 언어 모델의 계층 간 업데이트가 주된 토큰 단위 성분과 기하학적으로 구별되는 잔차 성분으로 분해될 수 있으며, 이 잔차 부분이 기능적으로 중요한 계산을 담당하고 있음을 제안합니다.
원저자가 쉬운 설명을 검토한 논문들.
이 페이지에 소개된 모든 논문은 원저자 중 최소 한 명이 저희의 쉬운 설명을 확인하여 내용이 정확하다고 확인했거나 수정 사항을 요청하여 저희가 반영한 것입니다. 확인이 각 문장을 공식적으로 승인한다는 의미는 아니지만, 설명이 논문을 쓴 당사자의 검토를 거쳤다는 뜻입니다.
저자가 검토한 논문 279편 · 81–90 / 279
이 논문은 딥러닝 언어 모델의 계층 간 업데이트가 주된 토큰 단위 성분과 기하학적으로 구별되는 잔차 성분으로 분해될 수 있으며, 이 잔차 부분이 기능적으로 중요한 계산을 담당하고 있음을 제안합니다.
이 논문은 가이아, MWISP, LAMOST 데이터를 결합하여 'Snake-III'라는 뱀 모양의 항성 구조와 분자 구름의 공진화를 규명함으로써, 구름 밀도와 초기 피드백이 항성 형성의 순서를 조절하며 이러한 구조가 계층적 항성 형성의 필라멘트 유산임을 입증했습니다.
이 논문은 항성 고유운동 속도와 위치 잔차 간의 교차상관을 분석하여 고대 별자리 목록의 제작 연대를 추정하는 'SESCC' 방법을 제안하고, 이를 알마게스트에 적용한 결과 고대 히파르코스의 원본에 기반했을 가능성이 높으며 프톨레마이오스 시대에 작성되었을 가능성은 낮다는 결론을 도출했습니다.
이 논문은 대칭성 꼬임 분배함수를 텐서 재규격화 군 (TRG) 으로 계산하여 2 차원 Ising 모델, 3 차원 비선형 시그마 모델, 그리고 2 차원 모델의 BKT 전이를 포함한 자발적 대칭성 깨짐 현상과 임계 현상을 효율적으로 탐지하고 임계점 및 임계 지수를 정밀하게 규명함을 보여줍니다.
이 논문은 자율 의사결정 시스템의 핵심인 '월드 모델'이 가진 안전성, 보안, 인지적 위험을 체계적으로 분석하고, 이를 항공기 조종 소프트웨어나 의료 기기와同등한 안전 필수 인프라로 취급해야 함을 주장하며 공격자 능력 분류, 통합 위협 모델, 그리고 기술적·거버넌스적 완화 방안을 제시합니다.
이 논문은 양자 이론이 세계를 기술하는 것이 아니라 관측 결과에 대한 실용적 조언을 제공하며, 측정 결과와 양자 상태가 모두 평가 맥락에 상대적인 '관점적 사실'임을 주장함으로써 측정 문제와 비국소성 문제를 해결하고, 실제 관측이 단일 맥락에서 이루어진다는 점을 들어 양자 이론의 객관적 수용 근거를 제시합니다.
이 논문은 해밀턴 - 자코비 방정식을 속도 자유도를 제거한 모델 축소로 접근하여 비보존력 시스템을 포함하는 일반 뉴턴 역학으로 확장하고, 기하광학 근사를 통해 소산 슈뢰딩거 방정식을 유도합니다.
이 논문은 페르미 LAT 와 DES 데이터를 활용한 다중 추적자 교차 상관 분석을 통해 미해결 감마선 배경 (UGRB) 의 기원이 외은하에 있음을 10.31 시그마의 높은 통계적 유의도로 확증하고, UGRB 를 구성하는 미약한 감마선원들이 현재 관측된 밝은 천체들의 단순한 확장이 아님을 시사합니다.
이 논문은 항생제 내성 (AMR) 확산과 같은 구조적 불확실성 하에서 시뮬레이션이 고정된 메커니즘의 가중치 조정이나 무효화를 넘어, 실행 시점에 새로운 메커니즘을 동적으로 추가하거나 실패하는 요소를 제거하고 변수의 해결 정책을 변경하며 인과 그래프 자체를 실험을 통해 진화시키는 '에피스테믹 거버넌스' 프레임워크인 Procela 를 제안합니다. 이 프레임워크는 실패 시 자동 복귀를 보장하며, 이를 통해 오류를 20.4% 감소시키고 누적 후회도를 69% 개선합니다.
이 논문은 JSON 기반 프로토콜의 취약점과 실행 환경의 한계를 해결하기 위해 XML-Regex 이중 경로 라우팅, 런타임 상태 인터셉션 샌드박스, 상태 기반 동적 뷰포트 UI 등 세 가지 혁신적 아키텍처를 통해 차세대 과학적 발견을 위한 범용 멀티모달 에이전트 워크스페이스 'BloClaw'를 제안합니다.