Beyond Fine-Tuning: Robust Food Entity Linking under Ontology Drift with FoodOntoRAG

Each language version is independently generated for its own context, not a direct translation.

이 논문은 **"음식 이름의 혼란을 해결하는 똑똑한 비서 (FoodOntoRAG)"**에 대한 이야기입니다.

우리가 매일 먹는 음식의 라벨이나 메뉴판을 보면, 같은 음식이라도 이름이 천차만별입니다. 예를 들어 '설탕'은 '백설탕', '설탕 가루', '슈가 파우더' 등으로 불리기도 하고, '레몬'은 '레몬즙', '레몬 추출물' 등으로 다양하게 표현됩니다. 컴퓨터가 이 모든 이름을 알아서 정리하고, "아, 이건 저기 있는 '레몬'이라는 공식적인 개념이구나!"라고 연결해 주는 일을 **엔티티 링크 (Entity Linking)**라고 합니다.

기존에는 이 일을 잘하기 위해 컴퓨터에게 수많은 데이터를 보여주고 **특별한 훈련 (파인튜닝)**을 시켰습니다. 하지만 이 방식에는 큰 문제가 있었습니다.

🍎 기존 방식의 문제점: "고정된 지도를 가진 나침반"

기존의 훈련된 모델은 마치 오래된 지도를 들고 있는 나침반과 같습니다.

훈련 비용이 비쌉니다: 새로운 지도를 만들려면 엄청난 시간과 돈이 듭니다.
유연하지 않습니다: 만약 음식 이름 규칙이 바뀌거나 (예: 새로운 첨가물이 생기거나), 데이터베이스가 업데이트되면, 훈련된 나침반은 그 변화를 따라가지 못해 엉뚱한 곳을 가리킵니다. 이를 논문에서는 **'온톨로지 드리프트 (Ontology Drift, 개념의 변화)'**라고 부릅니다.

🚀 이 논문이 제안한 해결책: "실시간 검색을 하는 똑똑한 비서 (FoodOntoRAG)"

이 논문은 "훈련을 시키는 대신, 실시간으로 정보를 찾아주는 비서를 만들자"고 제안합니다. 이것이 바로 FoodOntoRAG입니다.

이 비서는 4 명의 전문가 (에이전트) 가 팀을 이루어 일합니다. 마치 수사팀이 사건을 해결하는 과정과 비슷합니다.

1. 수사관 (Hybrid Retriever): "범인 후보를 쫓아라!"

사용자가 "레몬 가루"라고 입력하면, 이 수사관은 거대한 음식 사전 (데이터베이스) 에서 "레몬", "가루", "설탕" 등 관련 단어와 의미로 가장 비슷한 후보 30 명을 빠르게 찾아냅니다.

비유: 경찰이 용의자 명단을 빠르게 추려내는 과정입니다.

2. 심문관 (Selector): "진짜 범인은 누구야?"

찾아온 30 명의 후보 중 가장 유력한 한 명을 선택합니다. 이때 단순히 이름이 비슷한 것만 보고 선택하지 않고, "이게 정말 레몬 가루일까? 아니면 다른 것일까?"라고 논리적으로 판단합니다.

비유: 용의자 중 가장 의심스러운 사람을 골라 심문하는 과정입니다.

3. 판사 (Scorer): "이 결정이 맞을까?"

심문관이 골라낸 사람이 진짜 범인인지, 아니면 오해인지 판사가 최종 심사를 합니다. 판사는 "이건 확실히 레몬 가루가 아니야"라고 판단하면, 그 이유를 설명하며 **재심 (Retry)**을 요구합니다.

비유: 판사가 배심원의 판결을 검토하고, 의심스러우면 다시 조사하라고 지시하는 과정입니다.

4. 통역사 (Synonym Generator): "다른 말로 다시 물어봐!"

만약 판사가 "아니야, 이건 틀렸어"라고 하면, 통역사가 나옵니다. 통역사는 "레몬 가루"라는 말을 "레몬 파우더", "산미료" 등 다른 표현으로 바꿔서 다시 수사관에게 보냅니다. 이렇게 하면 처음에 놓쳤던 정답을 찾을 수 있습니다.

비유: 범인이 가짜 이름을 썼을 때, 다른 이름으로 다시 수색을 요청하는 과정입니다.

🌟 이 방식의 장점 (왜 이것이 혁신인가?)

훈련 불필요 (No Fine-tuning): 이 비서는 새로운 음식을 배울 때 다시 공부할 필요가 없습니다. 사전 (데이터베이스) 만 업데이트되면 바로 따라잡습니다.
변화에 강함 (Robustness): 음식 이름 규칙이 바뀌어도, 새로운 정보를 찾아서 바로 대응할 수 있습니다.
이유 설명 가능 (Interpretability): "왜 이걸 레몬 가루라고 했는지"에 대한 이유를 항상 설명해 줍니다. (예: "정의에 '레몬 파우더'라고 명시되어 있기 때문입니다.")

📊 실제 결과: "현실 세계에서도 통했다!"

연구진은 이 시스템을 실제 음식 라벨 데이터에 적용해 보았습니다.

기존 훈련된 모델 (FoodSEM): 새로운 첨가물이나 화학 물질을 만나면 완전히 엉망이 되었습니다. (정확도 36.9%)
새로운 비서 (FoodOntoRAG): 실시간으로 찾아서 정확하게 연결했습니다. (정확도 90.7%)

💡 결론

이 논문은 **"컴퓨터에게 모든 것을 외우게 하는 것 (훈련)"보다, **"필요할 때 정확한 정보를 찾아서 논리적으로 판단하게 하는 것 (검색과 추론)"**이 훨씬 더 강력하고 유연하다는 것을 증명했습니다.

마치 오래된 지도를 들고 있는 나침반 대신, 실시간으로 날씨와 지형을 확인하며 길을 찾아주는 GPS를 사용하는 것과 같습니다. 음식 데이터의 세계가 어떻게 변하더라도, FoodOntoRAG 는 항상 정확한 길을 안내해 줄 것입니다.

Each language version is independently generated for its own context, not a direct translation.

1. 문제 정의 (Problem)

식품 및 영양 데이터는 제품 라벨, 온라인 성분 목록, 메뉴 설명 등 다양한 소스에 분산되어 있으며, 동의어 (예: icing sugar vs. powdered sugar), 역할 기반 표현, 브랜드명, 문화적/언어적 변이 등으로 인해 일관된 분석이 어렵습니다.

핵심 과제: 자연어 처리 (NLP) 를 통해 비정형 텍스트의 식품 개체를 표준화된 온톨로지 (Ontology, 예: FoodOn) 개념에 매핑하는 명명 개체 링크 (Named Entity Linking, NEL) 작업.
기존 접근법의 한계:
- 파인튜닝 (Fine-tuning) 의존성: 기존 SOTA(최첨단) 모델들은 특정 작업용 코퍼스 (예: FoodSEM) 에 대해 대규모 언어 모델 (LLM) 을 파인튜닝합니다. 이는 막대한 계산 비용이 소요됩니다.
- 온톨로지 드리프트 (Ontology Drift): 온톨로지는 지속적으로 업데이트되지만, 파인튜닝된 모델은 학습 당시의 온톨로지 스냅샷에 고정되어 버전 변경 시 성능이 급격히 저하됩니다.
- 일반화 부족: 특정 도메인 데이터에 과적합되어 다른 데이터셋이나 새로운 용어에 대한 적응력이 떨어집니다.

2. 방법론 (Methodology): FoodOntoRAG

이 논문은 파인튜닝 없이 검색 증강 생성 (RAG) 기반의 모델 및 온톨로지 중립 (Model- and Ontology-agnostic) 파이프라인인 FoodOntoRAG를 제안합니다. 시스템은 4 개의 에이전트 (Agent) 로 구성된 피드백 루프 구조를 가집니다.

A. 데이터 전처리 및 하이브리드 리트리버 (Hybrid Retriever)

데이터 준비: FoodOn 온톨로지의 RDF 그래프를 파싱하여 CURIE, 선호 라벨, 동의어, 정의, 계층적 관계 등을 추출하고 JSON 형태로 구조화합니다.
하이브리드 검색:
1. 어휘적 검색 (Lexical): Whoosh 인덱스를 사용하여 BM25 알고리즘으로 라벨, 동의어, 정의 기반의 키워드 매칭 수행 (Top 15).
2. 의미적 검색 (Semantic): all-MiniLM-L6-v2 임베딩 모델을 사용하여 텍스트를 384 차원 벡터로 변환하고 FAISS 벡터 DB 에서 유사도 검색 수행 (Top 15).
3. 퓨전: 두 검색 결과를 결합하고, 정확한 표면 형식 (surface-form) 일치나 토큰 커버리지를 기준으로 순위를 조정하여 최종 후보군 (약 30 개) 을 Selector 에 전달합니다.

B. 선택 에이전트 (Selector Agent)

역할: 리트리버가 선정한 후보군 중 가장 적합한 온톨로지 엔티티를 1 개 선택합니다.
동작: LLM 에 프롬프트를 통해 다음 규칙을 적용하도록 지시합니다.
1. 정확 일치 우선: 라벨이나 동의어와의 대소문자 무시 정확 일치가 부분 일치보다 우선합니다.
2. 구체성 규칙 (Specificity): 여러 후보가 가능할 때, 더 넓은 상위어 (hypernym) 보다 더 구체적인 하위어를 선택합니다.
출력: 선택된 ID 와 그 근거 (rationale) 를 JSON 으로 출력합니다.

C. 점수 매기기 에이전트 (LLM Scorer Agent)

역할: Selector 가 선택한 결과가 신뢰할 만한지 평가합니다.
동작: 0 에서 1 사이의 신뢰도 점수 (Confidence Score) 를 산출합니다.
- 점수가 임계값 ( $\tau$ ) 미만이면, 선택이 부적절하다고 판단하고 거부 이유를 설명합니다.
- 이 경우 동의어 생성 에이전트를 활성화하여 재시도 (Retry) 를 유도합니다.

D. 동의어 생성 에이전트 (Synonym Generator Agent)

역할: Scorer 가 거절한 경우, 원래 쿼리를 재구성 (Reformulation) 하여 새로운 검색을 시도합니다.
동작: 실패 이유 (예: 정체성 불일치, 처리 상태 불일치) 를 기반으로 동의어, 과학적 명칭, 구문 변형 등을 생성합니다. 생성된 새로운 쿼리로 다시 리트리버 $\rightarrow$ Selector $\rightarrow$ Scorer 과정을 거칩니다.
제약: 최대 1 회만 루프를 돌며, 원본 쿼리와 생성된 쿼리 모두를 검증하여 의미적 편향을 방지합니다.

3. 주요 기여 (Key Contributions)

파인튜닝 없는 RAG 파이프라인: 학습 데이터에 의존하지 않고 온톨로지의 최신 상태를 반영할 수 있는 구조를 제시하여 온톨로지 드리프트에 강인합니다.
해석 가능한 의사결정: 단순한 예측이 아닌, 선택 근거와 신뢰도 점수, 실패 시 재구성 논리를 제공하여 인간 검증 (Human-in-the-loop) 을 용이하게 합니다.
하이브리드 검색 전략: 어휘적 정확성과 의미적 유연성을 결합하여 긴 꼬리 (Long-tail) 용어와 복잡한 식품 명칭을 효과적으로 처리합니다.
오픈 소스 아티팩트: 데이터 (Zenodo), 코드 (GitHub), 그리고 전문가 검증용 인터랙티브 애플리케이션을 공개하여 재현성을 보장합니다.

4. 실험 결과 (Results)

A. CafeteriaFCD 코퍼스 평가 (공식 레시피 데이터)

성능: 신뢰도 임계값 ( $\tau$ ) 을 0.6~~0.7 으로 설정했을 때, 초기 시도 및 재시도 후 최종 정확도 (Acc@1) 가 약 **58~~59%** 수준을 유지했습니다.
재평가 (Adjudication): 초기 평가에서 '오류'로 판정된 사례 중 상당수가 온톨로지 계층 구조의 차이 (예: 일반 성분 vs 생물학적 분류, 동의어 차이) 로 인한 것이었습니다. 이를 온톨로지 관점에서 재해석하고 수동 보정 후 정확도를 97% 로 재계산했습니다. 이는 기존 평가 기준의 한계와 제안된 모델의 온톨로지 이해 능력을 보여줍니다.

B. Open Food Facts 평가 (실제 브랜드 제품 성분 목록)

비교 대상: 파인튜닝된 SOTA 모델인 FoodSEM과 비교.
결과:
- FoodOntoRAG: 90.7% 정확도 달성.
- FoodSEM: 36.9% 정확도.
분석: FoodSEM 은 학습 데이터 (CafeteriaFCD) 에 없는 색소나 화학 첨가제 등 새로운 엔티티에 대해 성능이 급격히 떨어졌습니다. 반면 FoodOntoRAG 는 검색 기반 접근법으로 이러한 온톨로지 드리프트와 도메인 변화에 강인하게 대응했습니다.

5. 의의 및 결론 (Significance)

지속 가능성: 지속적인 파인튜닝 없이도 온톨로지의 진화에 따라 시스템이 자동으로 적응할 수 있어, 식품 및 영양 분야에서의 장기적인 데이터 통합에 비용 효율적인 솔루션을 제공합니다.
신뢰성: 신뢰도 기반의 피드백 루프와 인간 검증 도구를 통해 안전성 보고 (Allergen detection 등) 와 같은 민감한 분야에서 신뢰할 수 있는 결정을 지원합니다.
확장성: 식품 도메인뿐만 아니라 약물, 화학물질, 질병 등 다른 생명과학 온톨로지에도 동일한 아키텍처를 적용하여 확장할 수 있는 잠재력을 가집니다.

결론적으로, FoodOntoRAG 는 파인튜닝의 한계를 극복하고, 온톨로지의 동적 변화를 수용하며, 해석 가능한 높은 정확도의 식품 개체 링크를 가능하게 하는 새로운 패러다임을 제시합니다.