FS-KAN: Permutation Equivariant Kolmogorov-Arnold Networks via Function Sharing

이 논문은 임의의 치환 대칭군에 적용 가능한 새로운 프레임워크인 함수 공유 KAN(FS-KAN) 을 제안하여, 기존 파라미터 공유 네트워크의 표현력 이론을 확장하면서도 데이터 효율성과 해석 가능성을 크게 향상시켰음을 보여줍니다.

Ran Elbaz, Guy Bar-Shalom, Yam Eitan, Fabrizio Frasca, Haggai Maron

게시일 2026-03-10
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

🎨 1. 핵심 아이디어: "똑같은 일을 하는 친구들"

일반적인 AI(신경망) 는 데이터를 처리할 때 각 부분을 따로따로 학습합니다. 하지만 세상의 많은 데이터는 **대칭성 (Symmetry)**을 가지고 있습니다.

  • 비유: imagine(상상해 보세요) 당신이 친구 5 명과 함께 피자를 나누어 먹는 상황입니다.
    • 일반적인 AI: "A 가 먹은 피자 조각, B 가 먹은 피자 조각, C 가 먹은 피자 조각..."을 각각 따로 분석합니다. 만약 친구들이 자리를 바꾼다고 해도 AI 는 다시 처음부터 계산해야 할 수도 있습니다.
    • 이 논문의 AI (FS-KAN): "어떤 친구가 앉든, 피자 조각의 맛과 양은 같다"는 사실을 미리 알고 있습니다. 따라서 친구들이 자리를 바꾸더라도 (순서가 바뀌더라도) AI 는 **"똑같은 규칙"**을 적용해서 처리합니다.

이처럼 데이터의 순서가 바뀌어도 결과가 일관되게 유지되도록 만든 것이 FS-KAN의 핵심입니다.

🧩 2. 기존 방식 vs 새로운 방식 (FS-KAN)

기존의 대칭성을 가진 AI 는 **"가중치 공유 (Parameter Sharing)"**라는 방식을 썼습니다.

  • 비유: "모든 친구에게 똑같은 **숫자 (가중치)**를 부여한다"는 뜻입니다. 예를 들어, 모든 친구에게 "맛 = 5"라는 숫자를 줍니다.

하지만 FS-KAN 은 이를 한 단계 업그레이드했습니다. **"함수 공유 (Function Sharing)"**를 사용합니다.

  • 비유: 단순히 숫자를 주는 게 아니라, **"모든 친구에게 똑같은 '맛을 느끼는 방법 (함수)'"**을 공유합니다.
    • "A 가 먹으면 '달다', B 가 먹으면 '달다'라고 판단하는 생각의 과정이 완전히 동일하다"는 것입니다.
    • 이는 AI 가 단순히 숫자를 맞추는 것을 넘어, 데이터의 구조와 패턴 자체를 더 깊이 이해하게 해줍니다.

🚀 3. 왜 이 모델이 특별한가요? (세 가지 장점)

① 적은 데이터로도 천재가 됩니다 (데이터 효율성)

  • 상황: 요리 레시피를 배우는데, 시식할 수 있는 음식이 10 개뿐이라고 해보세요.
  • 일반 AI: 10 개만 보고는 "이건 짜고, 저건 매운가?"를 막연하게 추측하다가 실패합니다.
  • FS-KAN: "이건 피자고, 저건 파스타야"라는 기본 규칙을 이미 알고 있기 때문에, 10 개만 봐도 나머지 100 개를 완벽하게 예측할 수 있습니다.
  • 결과: 데이터가 부족한 상황 (저데이터 레짐) 에서 기존 모델보다 훨씬 뛰어난 성능을 보여줍니다.

② AI 의 두뇌를 볼 수 있습니다 (해석 가능성)

  • 상황: 보통 AI 는 "왜 이걸 정답이라고 했지?"라고 물어보면 "모르다"라고 답합니다 (블랙박스).
  • FS-KAN: 이 모델은 어떤 규칙을 배웠는지 직접 그림으로 보여줍니다.
    • 마치 "내가 '달다'를 판단할 때 이렇게 곡선을 그렸어"라고 학습한 함수의 모양을 시각화할 수 있습니다.
    • 연구자들은 이 모델을 통해 AI 가 데이터의 대칭성을 어떻게 이해하는지 눈으로 확인할 수 있었습니다.

③ 기억력도 좋습니다 (연속 학습)

  • 상황: 새로운 것을 배울 때, 예전에 배운 것을 잊어버리는 현상 (망각) 이 발생합니다.
  • FS-KAN: 새로운 데이터를 배워도 이전 지식을 잘 유지하면서 적응합니다. 점토를 반죽할 때 새로운 모양을 만들더라도 기본 재료의 성질은 유지되는 것과 같습니다.

🏗️ 4. 어떻게 작동할까요? (간단한 구조)

이 모델은 **KAN (콜모고로프 - 아르논 네트워크)**이라는 최신 기술을 기반으로 합니다.

  • 기존 MLP: 레고 블록을 쌓아올리는 방식 (선형적).
  • KAN & FS-KAN: **부드러운 곡선 (스플라인)**으로 연결된 방식.
    • FS-KAN 은 이 부드러운 곡선들이 친구들끼리 서로 공유되도록 설계되었습니다.
    • 예를 들어, "친구 A 가 겪은 경험"과 "친구 B 가 겪은 경험"이 구조적으로 같다면, 그 경험을 처리하는 **곡선 (규칙)**도 똑같이 공유됩니다.

💡 5. 요약: 이 논문이 우리에게 주는 메시지

이 논문은 **"순서가 바뀌어도 똑같은 데이터 (피자, 점구름, 추천 시스템 등)"**를 다룰 때, 기존의 AI 보다 더 똑똑하고, 더 빠르고, 더 투명하게 작동하는 새로운 모델을 제안합니다.

  • 데이터가 적을 때: FS-KAN 이 압도적으로 유리합니다.
  • 이해가 필요할 때: FS-KAN 은 AI 가 어떻게 생각하는지 보여줍니다.
  • 실제 적용: 추천 시스템 (유저와 아이템 순서 바뀜), 3D 물체 인식 (점의 순서 바뀜), 신호 처리 등 다양한 분야에서 유용하게 쓰일 것입니다.

한 줄 요약:

"FS-KAN 은 데이터의 순서가 바뀌어도 혼란스럽지 않게, 공유된 규칙으로 적은 데이터로도 빠르게 배우고, 그 이유를 우리에게 직관적으로 보여주는 차세대 AI 입니다."