UtilityMax Prompting: A Formal Framework for Multi-Objective Large Language Model Optimization

이 논문은 다중 목표 최적화 문제를 해결하기 위해 자연어 프롬프트 대신 수학적 형식 언어와 효용 함수를 기반으로 한 'UtilityMax Prompting' 프레임워크를 제안하고, 영화 추천 태스크에서 기존 자연어 기반 방법보다 정밀도와 NDCG 성능이 향상됨을 검증했습니다.

Ofir Marom

게시일 2026-03-13
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

🎬 영화 추천의 비밀: "수학으로 만든 완벽한 주문" (UtilityMax Prompting)

이 논문은 인공지능 (LLM) 이 복잡한 일을 할 때, 우리가 어떻게 지시를 내려야 더 똑똑하게 일할 수 있는지에 대한 새로운 방법을 소개합니다. 핵심은 **"자연어 (일상적인 말) 대신 수학적 언어로 지시하라"**는 것입니다.

이 내용을 누구나 이해할 수 있도록 요리사, 내비게이션, 그리고 주사위에 비유해서 설명해 드릴게요.


1. 문제: "적당한 위험"이라는 말은 너무 모호해요! 🤔

지금까지 우리는 AI 에게 일을 시킬 때 일상적인 말 (자연어) 로 지시했습니다.
예를 들어, "트레이딩 에이전트에게 수익을 극대화하되, '적당한' 위험 수준을 유지하라"고 말합니다.

하지만 여기서 **'적당한 (Medium)'**이 무슨 뜻일까요?

  • AI 는 "아, 적당한 거야? 그럼 50% 위험을 감수해야지!"라고 생각할 수도 있고,
  • "아니, 10% 도 위험해. 아주 안전한 걸로 해야지!"라고 생각할 수도 있습니다.

이처럼 여러 목표를 동시에 달성해야 할 때 (수익 vs 안전, 혹은 '코미디' vs '로맨스' 영화), 일상적인 말은 AI 가 해석할 여지가 너무 많아 혼란을 빚습니다. 마치 "맛있는 음식"을 주문했는데, 요리사가 "매운 거"를 생각할지 "단 거"를 생각할지 알 수 없는 것과 비슷합니다.

2. 해결책: UtilityMax Prompting (수학으로 된 주문서) 📐

이 논문이 제안하는 UtilityMax Prompting은 AI 에게 "적당한"이라는 모호한 말을 쓰지 않고, 수학 공식으로 지시하는 방법입니다.

비유: AI 를 '수학 문제를 푸는 요리사'로 바꾸기

  • 기존 방식 (자연어): "맛있으면서도 건강하고, 가격도 저렴한 요리를 만들어줘." (요리사는 무엇을 우선시할지 고민합니다.)
  • 새로운 방식 (UtilityMax): "다음 공식을 만족하는 요리를 찾아줘: (맛점수 × 건강점수 × 가격점수) 가 가장 높은 조합."

AI 는 이제 "맛있다는 게 뭐지?"라고 추측하지 않습니다. 대신 **"맛점수, 건강점수, 가격점수를 각각 계산해서, 곱했을 때 가장 큰 숫자가 나오는 조합을 찾아야 한다"**는 명확한 규칙을 따릅니다.

3. 어떻게 작동할까요? (영화를 추천하는 AI) 🎥

논문의 실험은 영화 추천에서 이루어졌습니다. 사용자는 "코미디이면서 동시에 로맨스인 영화"를 원하고, 점수도 높아야 합니다.

  1. 기존 방식 (Basic/Harsh): "코미디와 로맨스 영화를 추천해줘." (AI 가 두 장르를 어떻게 균형 있게 섞을지 모호함)
  2. UtilityMax 방식:
    • AI 는 각 영화 후보를 볼 때 세 가지 확률을 따로 계산합니다.
      • S (점수): 이 영화가 사용자에게 4 점 이상일 확률?
      • G1 (코미디): 이 영화가 코미디일 확률?
      • G2 (로맨스): 이 영화가 로맨스일 확률?
    • 목표: S × G1 × G2 값을 최대화하는 영화를 찾아라.
    • 만약 영화가 코미디가 아니면 (G1=0), 전체 값은 0 이 되어 탈락합니다. 이렇게 수학적으로 명확하게 필터링하는 것입니다.

4. 결과는 어땠나요? 📈

세 가지 최신 AI 모델 (Claude, GPT, Gemini) 로 실험한 결과, UtilityMax 방식이 압도적으로 잘 나왔습니다.

  • 정확도 (Precision): 사용자가 진짜 원하는 영화를 더 잘 찾아냈습니다.
  • 순위 (NDCG): 좋은 영화를 목록의 앞쪽에 더 잘 배치했습니다.

왜 그랬을까요?
자연어 지시 (Harsh) 로 "코미디와 로맨스만 추천해!"라고 강하게 말해도, AI 는 여전히 "어떤 비중으로 섞어야 하지?"라고 헷갈렸습니다. 하지만 수학 공식은 AI 에게 "두 가지 조건을 동시에 만족해야만 점수가 산출된다"는 것을 명확히 알려주어, AI 가 논리적으로 최선의 답을 찾게 만들었습니다.

5. 요약: 왜 이 방법이 중요할까요? 🌟

  • 모호함 제거: "적당히", "조금", "많이" 같은 애매한 말을 없애고 정확한 목표를 줍니다.
  • 논리적 사고 유도: AI 가 감이나 직관이 아니라, 각 요소 (코미디, 로맨스, 점수) 를 따로 계산하고 합쳐보는 과정을 거치게 합니다.
  • 미래의 가능성: 앞으로 AI 에게 복잡한 업무 (투자, 의료 진단, 법률 조언 등) 를 시킬 때, "수학 공식"처럼 명확한 지시서를 주는 것이 더 좋은 결과를 낼 것입니다.

한 줄 요약:

"AI 에게 '잘 해줘'라고 말하지 말고, '어떤 공식을 만족하면 잘한 거야'라고 수학적으로 정의해 주면, AI 는 그 공식을 따라 최고의 답을 찾아냅니다."