Predictive Authoring for Brazilian Portuguese Augmentative and Alternative Communication

이 논문은 BERTimbau 를 활용하여 브라질 포르투갈어 AAC 시스템의 그림기호 예측을 위한 학습 코퍼스를 구축하고, 그림기호를 단어, 정의, 동의어 또는 이미지로 표현하는 다양한 방법을 평가하여 캡션 기반 표현이 가장 높은 정확도를 보임을 입증했습니다.

Jayr Pereira, Rodrigo Nogueira, Cleber Zanchettin + 1 more2026-03-04🤖 cs.AI

Focal Inferential Infusion Coupled with Tractable Density Discrimination for Implicit Hate Detection

이 논문은 사전 학습된 대규모 언어 모델의 미세한 암시적 혐오 표현 이해 부족을 해결하기 위해, 표면적 의미와 암시적 의미를 가깝게 하고 클래스 간 거리를 넓히는 'FiADD'라는 새로운 프레임워크를 제안하여 여러 암시적 혐오 및 유사 과제의 성능을 크게 향상시켰음을 보여줍니다.

Sarah Masud, Ashutosh Bajpai, Tanmoy Chakraborty2026-03-04💬 cs.CL

Monitoring AI-Modified Content at Scale: A Case Study on the Impact of ChatGPT on AI Conference Peer Reviews

이 논문은 ICLR 2024 등 주요 AI 컨퍼런스의 동료 검토 과정을 분석한 사례 연구를 통해, 제출된 리뷰 텍스트의 6.5%~16.9% 가 ChatGPT 와 같은 대규모 언어 모델에 의해 실질적으로 수정되거나 생성되었을 것으로 추정되며, 이는 특히 낮은 신뢰도를 가진 리뷰나 마감 임박 시에 더 두드러진다는 사실을 밝히고 있습니다.

Weixin Liang, Zachary Izzo, Yaohui Zhang + 9 more2026-03-04🤖 cs.AI

NutriBench: A Dataset for Evaluating Large Language Models on Nutrition Estimation from Meal Descriptions

이 논문은 전 세계 실제 식습관 데이터로 구성된 인간 검증 영양 추정 벤치마크 'NutriBench'를 소개하고, 다양한 대형 언어 모델 (LLM) 의 성능을 평가하여 전문가 수준의 빠른 영양 분석 가능성과 당뇨병 환자의 혈당 예측에 대한 실용적 위험을 입증했습니다.

Andong Hua, Mehak Preet Dhaliwal, Laya Pullela + 2 more2026-03-04🤖 cs.AI

The Price of Prompting: Profiling Energy Use in Large Language Models Inference

이 논문은 대규모 언어 모델 (LLM) 추론 과정의 에너지 소비를 모니터링하고 최적화하기 위한 'MELODI' 프레임워크와 이를 통해 생성된 데이터셋을 소개하며, 프롬프트 속성과 에너지 효율 간의 상관관계를 분석하여 지속 가능한 LLM 배포를 위한 기초를 마련했습니다.

Erik Johannes Husom, Arda Goknil, Lwin Khin Shar + 1 more2026-03-04🤖 cs.AI

BA-LoRA: Bias-Alleviating Low-Rank Adaptation to Mitigate Catastrophic Inheritance in Large Language Models

이 논문은 대규모 언어 모델의 미세 조정 시 발생하는 편향과 노이즈의 과도한 전파인 '재앙적 유전'을 완화하기 위해 일관성, 다양성, SVD 정규화를 결합한 새로운 효율적 파라미터 미세 조정 방법인 BA-LoRA 를 제안하고, 다양한 작업과 모델에서 기존 LoRA 변형들보다 뛰어난 성능과 편향 완화 효과를 입증합니다.

Yupeng Chang, Yi Chang, Yuan Wu2026-03-04💬 cs.CL

Diverging Preferences: When do Annotators Disagree and do Models Know?

이 논문은 인간 어노테이터 간의 불일치가 단순한 노이즈가 아니라 작업의 미명시나 응답 스타일 등 다양한 요인에 기인함을 규명하고, 이를 고려하지 않은 기존 보상 모델링 및 평가 방법의 한계를 지적하며, 이러한 이질적인 선호도를 식별하고 완화하는 새로운 방법론을 제시합니다.

Michael JQ Zhang, Zhilin Wang, Jena D. Hwang + 6 more2026-03-04💬 cs.CL

Hallucination, Monofacts, and Miscalibration: An Empirical Investigation

이 논문은 n-gram 모델과 Transformer 에서 홀루시네이션, 모노팩트 (monofact) 비율, 모델 보정 불일치 간의 관계를 실증적으로 규명하고, 소수의 학습 데이터를 전략적으로 재가중치하는 '선택적 상향 가중치 (selective upweighting)' 기법을 통해 정확도를 유지하면서 홀루시네이션을 최대 40% 까지 감소시킬 수 있음을 보여줍니다.

Miranda Muqing Miao, Michael Kearns2026-03-04🤖 cs.AI