Beyond Via: Analysis and Estimation of the Impact of Large Language Models in Academic Papers

이 논문은 arXiv 논문 분석을 통해 LLM 사용이 제목과 초록의 어휘 사용 패턴에 미치는 영향을 정량적으로 평가하고, 다양한 모델 간의 유사성으로 인해 특정 생성 모델 식별이 어렵다는 점과 LLM 사용이 이질적이고 역동적으로 진화하고 있음을 규명합니다.

Mingmeng Geng, Yuhang Dong, Thierry Poibeau

게시일 2026-03-27
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

이 논문은 **"대형 언어 모델 (LLM, 예: 챗 GPT) 이 학계, 특히 논문 쓰기에 어떤 영향을 미쳤는지"**를 분석한 연구입니다.

복잡한 통계나 알고리즘 대신, **"단어의 사용 빈도"**라는 직관적인 방법을 통해 그 영향을 파악했습니다. 마치 **"누가 이 글을 썼는지 (사람인지 AI 인지) 를 알아내기 위해, 그 사람의 말버릇이나 자주 쓰는 단어들을 분석하는 것"**과 비슷합니다.

이 내용을 일반인이 쉽게 이해할 수 있도록 비유와 함께 설명해 드리겠습니다.


1. 핵심 발견: "AI 의 말버릇이 논문에도 퍼졌다"

연구진은 arXiv(학술 논문 공유 사이트) 에 올라온 수백만 편의 논문을 분석했습니다. 그 결과, AI 가 쓴 글에서 자주 나타나는 특정 단어들의 사용 패턴이 실제 논문에도 스며들고 있다는 것을 발견했습니다.

  • 비유: 마치 **"AI 가 쓴 논문은 마치 '비행기'를 타고 온 것 같다"**는 뜻입니다.
    • 제목에서 **'via (를 통해)'**나 **'beyond (를 넘어)'**라는 단어가 급격히 늘어났습니다. 마치 AI 가 "이 연구는 A 를 통해 B 를 넘어서는 결과를 냈다"라고 말하길 좋아하듯, 실제 논문 제목들도 그런 패턴을 따르기 시작했습니다.
    • 반면, 사람이 자연스럽게 쓰는 'the', 'of' 같은 아주 흔한 단어들은 AI 가 쓴 논문에서는 줄어들었습니다. AI 는 문장을 너무 깔끔하게 다듬으려다 이런 '접속사'들을 과감히 잘라내는 경향이 있기 때문입니다.

2. AI 는 계속 변한다: "말버릇이 바뀌는 AI"

AI 는 한 번 만들어지면 그대로인 것이 아니라, 계속 업데이트됩니다. 연구진은 이 변화가 논문에도 영향을 준다고 보았습니다.

  • 비유: **"요리사의 레시피가 바뀌는 것"**과 같습니다.
    • 예전 AI(챗 GPT 초기 버전) 는 **'delve (깊이 파고들다)'**라는 단어를 아주 좋아했습니다. 하지만 최신 AI 모델들은 이 단어를 쓰지 않고, 대신 **'furthermore (더불어)'**나 'utilize (활용하다)' 같은 다른 단어를 선호합니다.
    • 연구진은 이 변화를 통해 **"어떤 AI 모델이 언제부터 많이 쓰였는지"**를 역추적할 수 있었습니다. 마치 요리사의 스타일 변화를 통해 그가 언제 어떤 식당에 들어갔는지 알 수 있는 것과 같습니다.

3. AI 구분하기: "쌍둥이를 구별하는 것은 어렵다"

논문은 "여러 AI 가 쓴 글을 구별해 낼 수 있는가?"를 실험했습니다.

  • 비유: **"서로 다른 브랜드의 쌍둥이 옷을 구별하기"**는 매우 어렵습니다.
    • GPT, 클로드, 제미니 등 서로 다른 AI 가 쓴 글을 분류기에 넣으면, **"이 글이 정확히 어떤 AI 가 썼는지"**를 100% 맞히는 것은 거의 불가능했습니다.
    • AI 들끼리도 서로 너무 비슷해졌기 때문입니다. 하지만 **"사람이 쓴 글"과 "AI 가 쓴 글"**을 구분하는 것은 상대적으로 수월했습니다. (하지만 여전히 20% 정도는 AI 가 쓴 글을 사람 글로 오인하는 등 완벽하지는 않았습니다.)

4. 연구의 결론: "검은 상자보다는 직관적인 눈"

연구진은 복잡한 AI 탐지 프로그램 (블랙박스) 보다는, **"단어 사용 패턴을 직관적으로 분석하는 방법"**이 더 효과적일 수 있다고 말합니다.

  • 핵심 메시지:
    • AI 는 학술界的인 글쓰기 스타일을 바꾸고 있습니다.
    • AI 모델마다 고유한 '말버릇'이 있고, 이 버릇이 시간이 지남에 따라 변합니다.
    • 우리는 AI 가 얼마나 많이 쓰였는지, 어떤 모델이 쓰였는지를 단순히 단어의 빈도 변화를 통해도 어느 정도 추정할 수 있습니다.

요약

이 논문은 **"AI 가 학문 세계에 침투하자, 논문들의 '말투'가 변했다"**는 사실을 발견했습니다. 마치 **"새로운 언어 습관이 생긴 AI 가 학자들의 필기를 대신 쓰면서, 논문 전체의 분위기까지 AI 스타일로 변해가고 있다"**는 경고이자 분석입니다.

이 연구는 앞으로 AI 가 쓴 글을 감지하거나, AI 가 학계에 미친 영향을 추적할 때 "복잡한 기술"보다는 "단순한 단어 분석"이 더 유용한 열쇠가 될 수 있음을 보여줍니다.

연구 분야의 논문에 파묻히고 계신가요?

연구 키워드에 맞는 최신 논문의 일일 다이제스트를 받아보세요 — 기술 요약 포함, 당신의 언어로.

Digest 사용해 보기 →