Evolutionary Discovery of Bivariate Bicycle Codes with LLM-Guided Search

이 논문은 파이썬 프로그램을 변이시키고 다단계 파이프라인을 통해 후보들을 엄격하게 검증함으로써, 분해 불가능한 코드와 고거리 변형을 포함하여 465개의 서로 다른 코드를 산출하며 새로운 고성능 이변수-자전거 양자 LDPC 코드를 성공적으로 발견하는 LLM 유도 진화 워크플로우를 제시한다.

원저자: Juan Cruz-Benito, Andrew W. Cross, David Kremer, Ismael Faro

게시일 2026-06-02
📖 4 분 읽기🧠 심층 분석

원저자: Juan Cruz-Benito, Andrew W. Cross, David Kremer, Ismael Faro

원본 논문은 CC BY 4.0 (http://creativecommons.org/licenses/by/4.0/) 라이선스로 제공됩니다. 이것은 아래 논문에 대한 AI 생성 설명입니다. 저자가 작성하거나 승인한 것이 아닙니다. 기술적 정확성을 위해서는 원본 논문을 참조하세요. 전체 면책 조항 읽기

당신이 완벽한 디지털 금고용 자물쇠를 만들려고 한다고 상상해 보십시오. 양자 컴퓨팅의 세계에서 이 "자물쇠"는 **양자 오류 정정 코드(quantum error-correcting code)**라고 불립니다. 이 코드의 역할은 취약한 양자 정보를 노이즈와 오류로부터 보호하는 것입니다. 자물쇠가 더 좋을수록, 더 많은 데이터를 저장할 수 있고(높은 "율(rate)"), 파손되기 전까지 더 많은 손상을 견뎌낼 수 있습니다(높은 "거리(distance)").

오랫동안 과학자들은 이러한 자물록, 특히 이변량 바이시클(Bivariate Bicycle, BB) 코드라고 불리는 유형의 최적의 설계를 찾기 위해 노력해 왔습니다. 이들은 복잡한 수학적 청사진과 같습니다. 문제는 가능한 청식의 수가 너무 방대하여, 마치 지구상의 모든 해변에서 특정 모래알 하나를 찾는 것과 같으며, 특정 청식의 작동 여부를 확인하는 작업이 매우 느리고 어렵다는 점입니다.

이 논문은 **인공지능(구체적으로 대규모 언어 모델, LLM)**을 진화적 가이드로 사용하여 이러한 청식을 찾아내는 새로운 방법을 설명합니다.

이 발견의 과정은 다음과 같이 간단한 개념들로 나누어 설명할 수 있습니다.

1. "진화적" 검색 엔진

인간이 완벽한 청식을 추측하는 대신, 연구진은 자연 진화를 모방한 시스템을 구축했습니다.

  • "유기체": 단일 코드를 진화시키는 대신, 코드를 생성하는 파이썬 컴퓨터 프로그램(레시피)을 진화시켰습니다.
  • "돌연변이": AI(LLM)는 현재 가장 좋은 레시피를 살펴보고 "이 숫자를 바꿔라" 또는 "새로운 단계를 추가하라"와 같이 작은 변화를 제안합니다.
  • "적자생존": 시스템은 수천 개의 새로운 레시피를 생성합니다. 이를 빠르게 테스트하여 유효한 코드를 생성하는지 확인합니다. 가장 좋은 것들은 다시 돌연변이를 일으키기 위해 살아남고, 나쁜 것들은 버려집니다.

다섯 번의 "캠페인"(검색 라운드) 동안, 이 AI 기반 시스템은 약 1,650세대를 실행하며 약 200,000개의 후보 코드를 스크리닝했습니다. 전체 과정에는 약 400달러의 컴퓨터 비용과 약 140시간이 소요되었습니다.

2. "함정"과 "심판"

탐색 초기 단계에서 AI는 영리한 함정에 빠졌습니다. AI는 엄청난 양의 데이터 저장 능력(높은 "율")을 가진 레시피를 찾아냈고, 이는 매우 매력적으로 보였습니다. 하지만 이 코드들은 실제로는 오류를 수정하는 능력이 전혀 없었기 때문에(거리 = 2) 쓸모가 없었습니다. 이는 마치 종이 클립으로 열 수 있는 금고 문을 발견한 것과 같습니다. 물건은 많이 담을 수 있지만, 보안은 전혀 되지 않는 것입니다.

연구진은 초기 "거리 측정 도구"(BP-OSD라고 불리는 표준 도구)가 그들에게 거짓말을 하고 있다는 사실을 깨달았습니다. 이 도구는 코드의 강도를 때때로 12배까지 과대평가하고 있었습니다.

이를 해결하기 위해, 그들은 과정에 엄격한 **심판(MILP)**을 추가했습니다.

  • 심판의 역할: 이 심판은 코드의 거리를 100% 확실하게 확인하는 강력한 수학적 솔버(solver)입니다.
  • 결과: 심판은 "함정"을 즉시 잡아냈습니다. 또한 AI가 강력하다고 생각했던 많은 코드가 실제로는 약하다는 것을 드러냈습니다. 이는 AI가 "가짜" 고성능 코드들을 찾는 것을 멈추고 진정으로 강력한 코드들을 찾도록 강제했습니다.

3. 발견들

과정을 개선한 후, 시스템은 465개의 뚜렷하고 고품질인 코드를 찾아냈습니다. 주요 내용은 다음과 같습니다.

  • "골드 스탠다드" 매치: 그들은 기존의 최고 수준 코드(Gross Code)와 성능은 동일하지만 더 복잡한 구조를 사용하는 새로운 유형의 코드("섭동 이변량 바이시클(Perturbed Bivariate Bicycle)")를 찾아냈습니다. 이는 마치 시장에서 가장 좋은 자동차와 동일한 연비를 내면서도 다른 종류의 연료를 사용하는 새로운 엔진 설계를 찾아낸 것과 같습니다.
  • 더 많은 데이터, 동일한 보호: 그들은 적절한 수준의 보호를 유지하면서도 이전 기록보다 더 많은 데이터(최대 54 큐비트)를 저장할 수 있는 코드들을 찾아냈습니다.
  • "분해 가능한" 발견: 시스템은 마치 초고급 자물쇠처럼 보이는 코드를 찾아냈습니다. 그러나 심판의 그래프 분석 결과, 그것은 사실 두 개의 평범한 자물쇠를 붙여 놓은 것에 불과했습니다. 그것은 새로운 발명이 아니라, 기존의 두 개가 나란히 놓여 있는 것이었습니다. 이는 시스템이 "가짜" 복잡성을 식별할 수 있는 능력을 보여주었습니다.

4. "율(Rate) 대 거리(Distance)"의 트레이드오프

연구진은 모든 코드의 지형을 매핑하여 이 자물쇠들에 적용되는 일관된 규칙, 마치 물리 법칙과 같은 것을 발견했습니다.

  • 포락선(The Envelope): 일반적으로 엄청난 양의 데이터를 저장하면서 동시에 극도로 강력한 자물쇠를 가질 수는 없습니다.
  • 곡선: 더 많은 데이터(높은 율)를 저장하고 싶다면, 자물쇠는 부서지기 쉬워집니다(낮은 거리). 반대로 매우 강력한 자물쇠를 원한다면, 더 적은 데이터를 저장해야 합니다.
  • 예외: 그들은 이 곡선의 한계를 밀어붙이는 코드들(예: 50 단위의 데이터와 거리 8을 가진 코드)을 찾아냈지만, 여전히 이 근본적인 트레이드오프의 "포락선"을 깰 수는 없었습니다.

5. 이것이 중요한 이유

이 논문은 AI를 사용하여 컴퓨터 프로그램을 진화시키는 것이 새로운 양자 코드를 발견하기 위한 실용적이고 저비용의 도구라는 결론을 내립니다.

  • AI는 인간과 전통적인 수학적 탐색이 놓쳤던 코드들을 찾아냈습니다.
  • 표준 테스트 도구가 고성능 코드에 대해 얼마나 위험할 정도로 부정확할 수 있는지 입증했으며, 엄격한 "심판(MILP)"의 필요성을 보여주었습니다.
  • AI가 "함정"을 피하고, 서로 다른 크기의 양자 컴퓨터에 걸쳐 일반화될 수 있는 복잡한 대수적 패턴을 발견할 수 있음을 증명했습니다.

요약하자면, 연구진은 AI를 사용하여 "코드 생성기"를 진화시켰고, AI에게 가짜 결과를 무시하도록 가르쳤으며, 결과적으로 우리가 이전에 가졌던 것보다 더 강력하거나, 더 효율적이거나, 혹은 단순히 다른 형태의 새로운 양자 자물쇠 가족을 성공적으로 발견했습니다.

연구 분야의 논문에 파묻히고 계신가요?

연구 키워드에 맞는 최신 논문의 일일 다이제스트를 받아보세요 — 기술 요약 포함, 당신의 언어로.

Digest 사용해 보기 →