Evaluating Prompting Strategies for Chart Question Answering with Large Language Models

이 논문은 ChartQA 데이터셋을 기반으로 다양한 대규모 언어 모델에서 구조화된 차트 데이터에 대한 질문 답변 성능을 평가한 결과, 추론이 필요한 복잡한 질문에는 Few-Shot Chain-of-Thought 프롬핑 전략이 가장 높은 정확도를 보인다는 것을 확인했습니다.

Ruthuparna Naikar, Ying Zhu

게시일 2026-03-25
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

📊 차트 질문 답변: AI 에게 "어떻게" 물어볼까?

이 논문은 **"AI 가 복잡한 차트나 그래프를 보고 질문에 답할 때, 우리가 어떻게 질문을 던지느냐에 따라 정답률이 얼마나 달라지는지"**를 실험한 연구입니다.

마치 AI 를 '천재 학생'으로, 우리가 '선생님'으로 비유해 설명해 드릴게요.


1. 배경: 왜 이 연구가 필요할까요?

요즘 AI(대규모 언어 모델) 는 글을 읽고 이해하는 능력이 뛰어나죠. 하지만 차트나 그래프 같은 시각 자료를 보고 "2020 년과 2021 년 매출 차이는 얼마야?" 같은 복잡한 질문을 던지면, AI 가 헷갈려 하거나 엉뚱한 답을 내놓기도 합니다.

연구자들은 "AI 가 차트를 잘 읽게 하려면, **질문하는 방식 (프롬프트)**을 어떻게 바꿔야 할까?"를 궁금해했습니다. 차트 자체를 AI 가 직접 그림으로 보는 게 아니라, 데이터를 숫자와 글자로 정리해서 (표 형태로) AI 에게 주는 상황에서 실험을 진행했습니다.

2. 실험 방법: 네 가지 '질문 전략'

연구진은 AI 에게 똑같은 차트 데이터를 주고, 네 가지 다른 방식으로 질문을 던져보며 정답률을 비교했습니다.

  1. 제로샷 (Zero-Shot): "그냥 물어보기"

    • 비유: 학생에게 아무런 힌트도 주지 않고 "이 문제 풀어봐"라고만 던지는 것.
    • 결과: 아주 간단한 문제나 똑똑한 AI(GPT-4) 에겐 잘 통했지만, 복잡한 계산이 필요하면 헷갈렸습니다.
  2. 퓨샷 (Few-Shot): "예시 보여주기"

    • 비유: "이런 문제는 이렇게 풀었어, 저런 문제는 이렇게 풀었어"라고 유사한 예시 3 개를 먼저 보여주고 문제를 내는 것.
    • 결과: AI 가 **답변 형식 (예: 숫자만, Yes/No 만)**을 잘 지키게 만들었습니다.
  3. 제로샷 체인 오브 씽킹 (ZS-CoT): "단계별로 생각해보자"

    • 비유: 예시는 없지만, "자, 단계별로 하나씩 생각해보자"라고 말려주는 것.
    • 결과: AI 가 답을 바로 뱉지 않고 논리적으로 생각하게 되어 정확도가 조금 올랐습니다.
  4. 퓨샷 체인 오브 씽킹 (FS-CoT): "예시 + 단계별 생각"

    • 비유: 예시 3 개를 보여주면서, 각 예시마다 "왜 이 답이 나왔는지 단계별 이유"까지 적어주고, 마지막에 "자, 너도 이렇게 단계별로 생각해보자"라고 시키는 것.
    • 결과: **가장 높은 정답률 (약 78%)**을 기록했습니다! 특히 복잡한 계산이나 추론이 필요한 문제에서 AI 가 가장 똑똑하게 행동했습니다.

3. 핵심 발견: "정답"과 "형식"의 싸움

이 연구에서 가장 재미있는 점은 정답의 내용정답의 모양이 서로 다른 전략을 요구한다는 것입니다.

  • 가장 똑똑한 답을 원한다면? 👉 FS-CoT (예시 + 단계별 생각)

    • AI 가 논리적으로 깊이 생각하게 해서 내용적인 정답률이 가장 높았습니다.
    • 단점: 답변이 길어지고, AI 가 "정답: 100"이라고 해야 할 때 "정답은 100 입니다"처럼 문장을 길게 늘어놓아 형식 (Exact Match) 점수는 떨어졌습니다.
  • 가장 깔끔한 답을 원한다면? 👉 Few-Shot (예시만)

    • AI 가 "아, 예시처럼 답만 짧게 써야 구나!"라고 배워서 형식 점수가 가장 좋았습니다.
    • 장점: 비용도 적게 들고, 정확도도 나쁘지 않아 실무에서 가장 균형 잡힌 전략입니다.

4. 결론: 우리에게 주는 교훈

이 논문은 우리에게 **"AI 에게 질문할 때는 상황에 따라 전략을 바꿔야 한다"**는 것을 알려줍니다.

  • 복잡한 계산이나 추론이 필요하다면? 🧠
    • "예시를 보여주고, 단계별로 생각해보자"라고 시키세요. (비록 답변이 길어지더라도 내용 정답률이 높습니다.)
  • 단순히 데이터만 빠르게 뽑아내야 한다면?
    • "예시만 보여주고 답만 짧게 써"라고 시키세요. (비용도 절약되고 형식도 깔끔합니다.)
  • 가장 똑똑한 AI(GPT-4o) 를 쓴다면?
    • 작은 모델이라도 잘 가르치면 큰 모델 못지않게 똑똑해질 수 있습니다.

💡 한 줄 요약

"AI 가 차트를 잘 읽게 하려면, 단순히 물어보는 게 아니라 '예시'를 보여주고 '단계별 생각'을 유도하는 것이 정답을 찾는 지름길입니다!"

이 연구는 AI 를 단순히 사용하는 것을 넘어, 어떻게 질문을 설계하느냐가 AI 의 능력을 100% 끌어내는 열쇠임을 보여줍니다.