Code Fingerprints: Disentangled Attribution of LLM-Generated Code
이 논문은 생성된 코드의 출처 LLM 을 식별하기 위해 의미 정보와 스타일적 특징을 분리하는 '분리형 코드 귀속 네트워크 (DCAN)'를 제안하고, 네 가지 주요 LLM 과 프로그래밍 언어로 구성된 대규모 벤치마크를 통해 모델 수준의 코드 귀속 가능성과 성능을 입증했습니다.
2180 편의 논문
이 논문은 생성된 코드의 출처 LLM 을 식별하기 위해 의미 정보와 스타일적 특징을 분리하는 '분리형 코드 귀속 네트워크 (DCAN)'를 제안하고, 네 가지 주요 LLM 과 프로그래밍 언어로 구성된 대규모 벤치마크를 통해 모델 수준의 코드 귀속 가능성과 성능을 입증했습니다.
이 논문은 11 개의 주요 대규모 언어 모델 (LLM) 을 대상으로 24 개 인권 조항과 8 개 언어에 걸쳐 1,152 개의 시나리오를 분석한 결과, 모델들이 정치적·시민적 권리보다 경제적·사회적·문화적 권리 제한을 더 자주 수용하고, 중국어와 힌디어에서 영어나 루마니아어보다 권리 제한을 더 많이 지지하며, 프롬프트 조작에 취약하고 응답 형식 (리커트 척도 대 서술형) 에 따라 편차가 크다는 체계적 편향을 발견했다고 요약할 수 있습니다.
이 논문은 다국어 및 시각적으로 풍부한 RAG 벤치마크에서 관찰된 성능 향상이 복잡한 검색 모델의 발전이 아니라 문서 표현 (전사 및 전처리) 의 개선에 기인함을 증명하며, 이를 위해 전사와 검색 능력을 분리하여 평가할 것을 제안합니다.
이 논문은 장기 작업에서 LLM 에이전트의 컨텍스트 윈도우 한계를 극복하기 위해, 완전한 상호작용 기록을 외부 데이터베이스에 보관하고 요약본과 인덱스만 컨텍스트에 유지하며 강화학습을 통해 최적의 요약·아카이빙·검색 전략을 학습하는 'Memex' 메모리 메커니즘을 제안합니다.
이 논문은 대규모 언어 모델 (LLM) 이 생성한 문서에서 사건을 추출하고 정형화하여 인과 발견 기법을 적용함으로써, LLM 이 가질 수 있는 인과 가설 집합을 검증 가능한 변수와 그래프 형태로 도출하는 프레임워크를 제안합니다.
이 논문은 대규모 언어 모델의 확장 가능하고 안정적인 커스터마이징을 위해 텍스트 프롬프트를 넘어 벡터 프롬프트 입력을 공개 인터페이스로 노출해야 한다고 주장합니다.
이 논문은 LLM 이 다크 트라이어드 (마키아벨리즘, 나르시시즘, 사이코패스) 성향을 가진 사용자 프롬프트에 대해 주로 교정적 반응을 보이지만 특정 상황에서는 강화하는 경향이 있으며, 이는 더 안전한 대화 시스템 설계에 중요한 시사점을 제공한다는 점을 규명했습니다.
이 논문은 생성과 검증의 효율적인 통합을 위해 불확실성 기반의 토너먼트 순위 매김 알고리즘과 생성기-검증기 공동 학습 강화학습 프레임워크를 제안하여, 복잡한 추론 작업에서 기존 방법보다 뛰어난 성능과 효율성을 달성한 프레임워크를 소개합니다.
이 논문은 LLM 의 내부 상태에서 지리적·시간적 구조가 선형적으로 복원 가능하다는 사실이 반드시 '세계 모델'을 의미하는 것은 아니며, 정적 단어 임베딩에서도 텍스트의 공출현 통계만으로도 이러한 구조가 충분히 보존되어 있음을 보여줍니다.
본 논문은 그래프 기반 검색, 반성적 프롬프트 진화를 통한 LLM 추론, 그리고 사후 일관성 강화를 결합한 3 단계 시스템을 통해 SemEval 2026 태스크 12 에서 0.95 의 정확도로 1 위를 차지한 방법론과 14 개 모델의 오류 분석을 통해 다중 레이블 인과 추론에서 발견된 체계적인 실패 모드를 제시합니다.
이 논문은 B-Rep 기하학적 정보와 포인터 기반 엔티티 선택 메커니즘을 통합하여 기존 명령어 시퀀스 방식의 한계를 극복하고 복잡한 CAD 모델 생성의 정확도를 획기적으로 향상시킨 'Pointer-CAD' 프레임워크를 제안합니다.
이 논문은 멀티모달 웹 에이전트의 교차모달 공격 취약점을 해결하기 위해, 모방 학습과 오라클 지도 미세 조정, 그리고 적대적 강화 학습을 결합한 '이중 모달 다단계 적대적 안전 훈련 (DMAST)' 프레임워크를 제안하여 공격 저항성과 작업 수행 효율성을 동시에 크게 향상시킨다는 내용을 담고 있습니다.
이 논문은 대규모 비정형 지식과 도구 사용을 통합하여 평가하는 새로운 벤치마크인 '-Knowledge'와 이를 적용한 '-Banking' 도메인을 소개하며, 최첨단 모델조차도 복잡한 지식 기반에서 높은 정확도를 달성하는 데 어려움을 겪고 있음을 보여줍니다.
이 논문은 중간 보상을 활용한 강화 학습 기법인 TaxonRL 을 통해 시각적 유사성이 높은 종 간의 세밀한 분류 정확도를 인간 수준을 넘어선 91.7% 로 향상시키고, 계층적 추론 과정을 통해 해석 가능한 의사결정 경로를 제공하는 방법을 제시합니다.
이 논문은 머신 번역 기술이 언어 장벽을 낮추어 상호 운용성과 무역을 증진시킬 것으로 전망하지만, 동시에 아이디어의 분포와 혁신, 경제 성장에 새로운 불평등과 도전을 초래할 수 있음을 탐구합니다.
이 논문은 헤겔의 변증법에 영감을 받아 모델이 단일 예측 대신 일련의 사고 흐름을 생성하고 자기 수정 메커니즘을 통해 예측을 반복적으로 개선함으로써 성능을 향상시키고 인간 사용자의 신뢰와 이해를 높이는 '사고 흐름 네트워크 (Thought Flow Nets)'를 제안합니다.
이 논문은 VQA-MHUG 라는 새로운 다중 모달 시선 추적 데이터셋을 통해 인간과 신경망의 주의를 비교 분석한 결과, 텍스트에 대한 인간의 주의와 높은 상관관계를 보이는 모델이 VQA 성능이 더 우수함을 최초로 규명했습니다.
이 논문은 이미지와 텍스트의 인간 유사 주의를 통합한 멀티모달 네트워크 MULAN 을 제안하여, 기존 모델보다 약 80% 적은 학습 파라미터로 VQAv2 데이터셋에서 새로운 최고 성능을 달성했음을 보여줍니다.
이 논문은 13 개 인도어와 유럽어 데이터셋에서 98% 이상의 높은 정확도와 잡음 내성을 입증한 CRNN 기반 언어 식별 모델을 제안하고, 어텐션 메커니즘이 항상 필수적인지 비교 분석합니다.
이 논문은 저자 식별 방어 기법에 대한 기존 연구를 재현 및 복제하여 원 연구의 통제 집단 부재로 인해 방어 기법의 효과가 과장되었을 수 있음을 지적하고, 자동 번역을 통한 우회 번역이 저자 식별 방법의 효과를 감소시킨다는 새로운 증거를 제시합니다.