Each language version is independently generated for its own context, not a direct translation.
🧩 문제: "단순한 3 단 문장"으로는 부족해요
기존의 지식 그래프 (Knowledge Graph) 는 마치 레고 블록처럼 '주어 - 서술어 - 목적어'라는 3 단 문장 (예: "오ppenheimer - 교육받음 - 하버드") 으로만 지식을 저장했습니다.
하지만 현실 세계는 훨씬 더 복잡합니다.
- 시간이 중요한 경우: "오ppenheimer 는 1963 년에 페르미상을 수상했다." (단순 3 단 문장엔 '1963 년'이 들어갈 자리가 없습니다.)
- 추가 정보가 필요한 경우: "오ppenheimer 는 하버드에서 화학 전공으로 학사를 받았다." (단순 3 단 문장엔 '화학', '학사'라는 정보가 빠집니다.)
- 사실과 사실이 연결된 경우: "오ppenheimer 가 뉴욕에서 태어났다"는 사실은 "미국 국적이다"라는 사실을 암시합니다.
기존 AI 모델들은 이런 복잡한 정보를 처리할 때, 각각의 상황 (시간, 추가 정보, 중첩된 사실) 에 맞춰 별도의 전용 모델을 만들어야 했습니다. 마치 "날씨를 볼 때는 우산 전용 모델, 비를 볼 때는 우산 전용 모델, 눈이 올 때는 눈 전용 모델"을 따로 만들어야 하는 것처럼 비효율적이었습니다.
💡 해결책: UniHR (유니버설 지식 번역기)
저자들은 **"모든 복잡한 지식을 하나의 통일된 언어로 번역해서, 하나의 모델로 처리하자"**는 아이디어를 제시했습니다. 이것이 바로 UniHR입니다.
1. HiDR: "모든 것을 3 단 문장으로 변환하는 번역기"
가장 먼저, 복잡한 정보를 AI 가 이해하기 쉬운 **통일된 형식 (3 단 문장)**으로 바꾸는 작업을 합니다.
- 비유: 마치 다양한 언어 (중국어, 영어, 스페인어) 로 된 복잡한 문장을 모두 영어로 번역하는 작업입니다.
- 어떻게 하나요?
- "1963 년"이라는 시간 정보를 별도의 '시간 노드'로 만들어 연결합니다.
- "화학 전공"이라는 정보를 별도의 '속성 노드'로 만들어 연결합니다.
- "사실 A 가 사실 B 를 의미한다"는 관계도 하나의 '사실 노드'로 만들어 연결합니다.
- 결과: 이제 AI 는 모든 복잡한 정보를 "A 는 B 와 연결되어 있고, B 는 C 와 연결되어 있다"는 단순한 연결 고리 형태로만 보면 됩니다.
2. HiSL: "소문과 전체 흐름을 동시에 듣는 귀"
변환된 정보를 학습하는 두 단계의 과정입니다.
- 단계 1: 사실 내부의 의미 파악 (Intra-fact)
- 비유: 한 사람의 이력서를 자세히 읽는 것과 같습니다. "화학 전공"과 "학사"가 어떻게 연결되어 있는지 그 내부의 맥락을 파악합니다.
- 단계 2: 사실 간의 관계 파악 (Inter-fact)
- 비유: 이력서를 읽은 후, 주변 사람들과의 관계를 파악하는 것입니다. "오ppenheimer 가 뉴욕에서 태어났다"는 사실이 "미국 국적"이라는 사실과 어떻게 연결되는지, 전체 네트워크 속에서 어떤 의미를 갖는지 파악합니다.
이 두 단계를 거치면 AI 는 개별 사실의 의미와 전체 지식의 구조를 모두 이해하게 됩니다.
🏆 왜 이것이 혁신적인가요?
- 한 번에 모두 해결 (Unified): 시간, 추가 정보, 중첩된 사실 등 어떤 형태의 지식이 들어와도 하나의 모델로 처리할 수 있습니다. 별도의 전용 모델을 만들 필요가 없습니다.
- 상호 보완 (Synergy): 서로 다른 종류의 지식 (예: 시간 정보와 추가 속성 정보) 을 함께 학습하면, 서로의 정보를 보완하여 더 정확한 추론이 가능해집니다. 마치 여러 전문가가 모여 토론하면 더 좋은 결론이 나오듯이요.
- 효율성: 복잡한 구조를 처리하더라도 메모리나 계산 속도가 기존 방식보다 느리지 않습니다.
🚀 결론
UniHR은 현실 세계의 복잡하고 다양한 지식을 하나의 통일된 언어로 번역하고, 개별 의미와 전체 구조를 동시에 학습하는 지능형 시스템입니다.
이 기술은 AI 가 단순히 "사실"을 외우는 것을 넘어, 시간의 흐름, 세부적인 조건, 그리고 사실들 사이의 숨겨진 연결고리까지 이해할 수 있게 만들어, 더 똑똑하고 현실적인 질문 답변 시스템을 만드는 데 큰 기여를 할 것으로 기대됩니다.