WaterSIC: information-theoretically (near) optimal linear layer quantization
이 논문은 정보 이론적 한계에 근접한 선형 계층 양자화를 위해 입력 활성화의 공분산 행렬에 따라 각 열에 다른 양자화 비트 수를 할당하는 'WaterSIC' 알고리즘을 제안하여, Llama 및 Qwen 계열 LLM 에서 1~4 비트 양자화 구간에서 새로운 최첨단 성능을 달성함을 보여줍니다.
172 편의 논문
이 논문은 정보 이론적 한계에 근접한 선형 계층 양자화를 위해 입력 활성화의 공분산 행렬에 따라 각 열에 다른 양자화 비트 수를 할당하는 'WaterSIC' 알고리즘을 제안하여, Llama 및 Qwen 계열 LLM 에서 1~4 비트 양자화 구간에서 새로운 최첨단 성능을 달성함을 보여줍니다.
이 논문은 과완전 QLDPC 코드의 신뢰도 전파 복호화에서 초기 로그 가능도 비 (LLR) 의 불일치가 저잡음 환경에서 프레임 오류율에 큰 영향을 미치지만, 최적 성능이 특정 값에 국한되지 않고 넓은 불일치 영역에서 둔감하게 유지됨을 보여줌으로써, LLR 불일치를 채널 정합이 아닌 정규화 제어 매개변수로 해석할 수 있음을 주장합니다.
이 논문은 연속 상태 확률 시스템의 엔트로피와 제어 성능을 동시에 고려하여, 이산화 오차에 대한 새로운 경계와 기존 형식적 추상화 기법을 결합해 예측 가능성과 제어 목표를 균형 있게 달성하는 형식적 엔트로피 규제 제어 방법을 제안합니다.
이 논문은 다중 태스크 학습이 추가적인 정규화 항을 가진 전통적 학습과 점근적으로 동등하며, 이를 통해 일반화 성능을 향상시키고 이중 하강 (double descent) 현상을 지연 또는 완화할 수 있음을 이론적 분석과 실험을 통해 규명합니다.
이 논문은 나노포어 시퀀서의 적응형 샘플링 기능을 활용하여 PCR 없이도 특정 분해능의 이미지를 DNA 에서 효율적으로 추출할 수 있도록 JPEG2000 의 점진적 디코딩 기능을 DNA 저장 시스템에 적용하는 방법을 제안합니다.
이 논문은 동적 가중치 자동화 시장 메이커 (TFMM) 의 최적 재균형 전략이 가중치 심플렉스 상의 피셔 - 라오 계량 하에서 헬링거 좌표계의 측지선인 SLERP(구면 선형 보간) 로 정의됨을 증명하고, 이를 통해 기존 AM-GM 이분법 휴리스틱이 측지선 상에 위치하며 모든 이분점에서의 최적 보간이 가능함을 보여줍니다.
이 논문은 밀리미터파 네트워크의 높은 지향성과 차폐 특성을 활용하여 주파수 공유의 효율성을 높이는 공간 인식형 2 차 라이선스 공유 (SLS) 프레임워크를 확률 기하학을 통해 분석하고, 차폐 조건과 지향성이 2 차 사용자의 전송 기회와 네트워크 성능에 미치는 긍정적 영향을 규명했습니다.
이 논문은 양자 탠너 코드 (Quantum Tanner codes) 의 구조를 활용하여 일반화된 체크 노드를 구성하고 MAP 디코더를 적용한 향상된 반복적 신념 전파 (BP) 디코딩 기법을 제안하며, 유한 길이 환경에서 기존 디코더 및 다른 qLDPC 코드 대비 우수한 성능을 입증하고 이론적 분석을 통해 그 유효성을 뒷받침합니다.
이 논문은 SCMA 와 BIA 의 단점을 보완하고 이득을 결합하여 SBMA 라는 새로운 다중 접속 방식을 제안하고, 저복잡도 2 단계 및 JMPA 디코더를 통해 MISO 시스템에서 우수한 BER 성능, 다이버시티 및 다중화 이득, 그리고 향상된 프라이버시를 달성함을 보여줍니다.
이 논문은 상호작용을 활용한 라운드의 알고리즘을 통해 비상호작용 방식의 하한을 깨고, 개의 분포 클래스에 대한 국소적 차분 프라이버시 가설 선택 문제의 최적 샘플 복잡도 를 달성함을 보여줍니다.
이 논문은 양자 상태 배제 및 채널 배제 문제의 오류 지수에 대해 다변수 로그-유클리드 체르노프 발산을 기반으로 한 단일 문자 상한을 제시하고, 기존 결과보다 개선된 효율적으로 계산 가능한 경계를 증명하며 고전 채널 배제의 정확한 오류 지수를 해결합니다.
이 논문은 최적의 팔 개수를 미리 아는 다중 최적 팔 환경에서 고정 신뢰도 하의 최적 팔 식별 문제를 다루며, 새로운 정보 이론적 하한을 유도하고 이를 달성하는 변형된 Track-and-Stop 알고리즘을 제안하여 점근적 최적성을 증명합니다.
이 논문은 6G 의 주파수 범위 3(FR3) 이 통합 감지 및 통신 (ISAC) 을 위한 핵심 기술로서 고해상도 감지와 고속 통신을 가능하게 하지만, 초대규모 MIMO 와 극대형 어레이 안테나 (ELAA) 기반의 효율적인 시스템 구현을 위해 새로운 채널 모델링 및 기술적 과제를 해결해야 함을 제시합니다.
이 논문은 중계기를 활용한 비동기 통합 감지 및 통신 시스템의 성능 한계를 분석하여, 통신-감지 트레이드오프를 규명하는 용량-왜곡 함수에 대한 상한과 하한을 유도하고 특정 채널 클래스에서 최적성을 입증합니다.
이 논문은 엔트로피와 대칭적 불확실성 (SU) 을 기반으로 범주형 확률변수에 대한 거리 함수를 정의하고, 이를 적절한 몫 공간으로 확장하여 위상과 호환되는 자연스러운 가환 모노이드 구조를 제시합니다.
이 논문은 대칭성 붕괴로 인해 기존에 구할 수 없었던 3 차원 흡수 구형 수신기를 가진 채널의 정확한 임펄스 응답을, 가이사노프 기반 측도 변환을 통해 드리프트 효과를 명시적 곱셈 인자로 분리하여 유도함으로써 제시합니다.
이 논문은 기존 PANDA 알고리즘의 실행 시간 복잡도 내 숨겨진 인자를 제거하여 최적의 성능을 달성하면서도 모든 일반성을 유지하는, 새로운 확률적 부등식과 동적 하이퍼평면 분할 기법을 기반으로 한 더 간단하고 빠른 'PANDAExpress' 알고리즘을 제안합니다.
이 논문은 지배 측도가 존재하지 않는 일반적인 경우에도 가설 검정의 존재성을 보장하기 위해 르캄 (Le Cam) 의 프로그램을 완성하여, 유계 가산 가측 공간에서 확률 측도 집합의 볼록 폐포가 분리되는 것을 필요충분조건으로 제시합니다.
이 논문은 확률적 신경 부호 (가능도 함수 대 사후분포) 를 구별하기 위한 최적의 실험 설계를 도출하기 위해, 두 부호 가설 간의 정보 격차를 정량화하는 정보이론적 프레임워크를 제안하고 이를 통해 신경 집단이 어떻게 감각 불확실성을 표현하고 처리하는지에 대한 이해를 심화시킵니다.
이 논문은 FDD 대용량 MIMO 시스템에서 CSI 피드백 효율성을 높이기 위해, CSI 압축을 마스킹 토큰 예측 작업으로 재정의하고 자기 정보 (self-information) 기반의 정보이론적 마스킹 전략을 도입하여 대규모 언어 모델 (LLM) 을 활용한 새로운 프레임워크를 제안합니다.