HatePrototypes: Interpretable and Transferable Representations for Implicit and Explicit Hate Speech Detection
이 논문은 명시적 및 암시적 혐오 표현 감지를 위해 소량의 예시만으로 학습된 'HatePrototypes'을 활용하여 반복적인 파인튜닝 없이도 효과적인 전이 학습과 파라미터 없는 조기 종료 방식을 가능하게 하는 새로운 접근법을 제시합니다.
1071 편의 논문
이 논문은 명시적 및 암시적 혐오 표현 감지를 위해 소량의 예시만으로 학습된 'HatePrototypes'을 활용하여 반복적인 파인튜닝 없이도 효과적인 전이 학습과 파라미터 없는 조기 종료 방식을 가능하게 하는 새로운 접근법을 제시합니다.
이 논문은 온라인 토론에서 논의를 중단하거나 방향을 전환하는 '중단점 (stopping points)'을 탐지하기 위한 프랑스어 주석 데이터셋 SPOT 과 벤치마크를 소개하며, 이를 통해 CamemBERT 기반의 미세 조정 모델이 지시 기반 LLM 보다 더 우수한 성능을 보임과 동시에 문맥 메타데이터의 중요성을 입증했습니다.
이 논문은 멀티모달 대규모 언어 모델 (MLLM) 이 모달리티 간에 학습된 기술을 조합하는 데 있어 상당한 격차가 존재하며, 프롬프팅이나 미세 조정과 같은 기존 전략으로도 이를 완전히 해결하지 못함을 규명했습니다.
이 논문은 RVLM(추론 강화 비전 - 언어 모델) 의 안전성 정렬을 깨뜨리기 위해 자기 생성 추론을 활용한 '은밀한 미세 조정 (Stealth Fine-Tuning)'이라는 새로운 공격 기법을 제안하며, 소량의 데이터와 짧은 시간으로도 기존 방법보다 훨씬 높은 성공률로 정렬 우회를 달성할 수 있음을 보여줍니다.
이 논문은 에이전트 소프트웨어 시스템의 실행 과정을 그래프 기반으로 체계적으로 분석하는 'Graphectory'를 제안하여, 에이전트의 추론 및 전략 패턴을 심층적으로 규명하고 실시간 모니터링을 통해 문제 해결률을 6.9%~23.5% 향상시키는 효과를 입증했습니다.
이 논문은 기존 AMR 파서를 미세 조정하거나 Universal Dependencies 변환기를 활용하는 두 가지 방법을 제안하여 영어 텍스트를 자동으로 Uniform Meaning Representation (UMR) 그래프로 변환하는 SETUP 모델을 개발하고, 이를 통해 UMR 파싱의 정확도를 크게 향상시켰음을 보여줍니다.
이 논문은 고정된 트랜스포머 트렁크에 플래너가 시드하는 잠재 작업 공간과 동기화된 다중 스트림 출력 프로토콜을 도입하여, 외부 오케스트레이션이 아닌 모델 내부 메커니즘을 통해 병렬 디코딩을 가능하게 하는 '병렬 디코더 트랜스포머 (PDT)'를 제안합니다.
이 논문은 고립된 미디어 소비를 해결하기 위해 다중 AI 에이전트를 실시간 공유 경험의 사회적 협력자로 조율하는 'CompanionCast' 프레임워크를 제안하고, 축구 팬을 대상으로 한 실증을 통해 고립된 시청보다 사회적 존재감과 감정 공유를 크게 향상시킨다고 밝힙니다.
본 논문은 사전 학습 이후 에이전트와 도구의 적응을 포괄하는 4 가지 패러다임 (A1, A2, T1, T2) 프레임워크를 제시하며, 후학습, 메모리, 기술 시스템에 대한 연구 동향을 통합적으로 분석하고 평가 기준 및 향후 과제를 정리합니다.
이 논문은 Swin Transformer 비전 인코더와 시퀀스 - 시퀀스 언어 디코더를 통합한 경량 2 단계 멀티태스크 프레임워크를 제안하여 작물 질병 시각적 질문 응답 (VQA) 에서 높은 정확도와 설명 가능성을 달성하고 PlantVillageVQA 벤치마크에서도 우수한 일반화 성능을 입증했습니다.
NC-Bench 는 IBM 의 자연 대화 프레임워크에 기반하여 LLM 의 주제나 작업 수행이 아닌 대화의 형식과 구조적 순서 관리 능력을 평가하는 새로운 벤치마크를 제안합니다.
이 논문은 대규모 언어 모델 (LLM) 과 다중 팔 밴딧 (MAB) 간의 양방향 상호작용을 구성 요소 수준에서 체계적으로 검토하여, MAB 가 LLM 의 학습 및 개인화 문제를 해결하고 LLM 이 MAB 의 핵심 구성 요소를 재정의하여 의사결정을 개선하는 상호 보완적 관계와 향후 연구 방향을 제시합니다.
이 논문은 전역적 오케스트레이션을 강화학습 기반으로 구현한 'MAS-Orchestra' 프레임워크와 다중 에이전트 시스템의 효용을 체계적으로 분석하는 'MASBENCH' 벤치마크를 제안하여, 단일 에이전트 대비 다중 에이전트 시스템의 성능 향상을 효율적으로 달성하고 그 작동 원리를 규명합니다.
이 논문은 금융 서비스용 도구 활용 LLM 에이전트의 규제 감사 재현성을 보장하기 위해 결정론적 일관성과 정확도를 독립적으로 측정하는 '결정론-신뢰성 보장 하네스 (DFAH)' 프레임워크와 관련 벤치마크를 제안하며, 두 지표가 서로 상관관계가 없으므로 모두 독립적으로 평가해야 함을 실증합니다.
이 논문은 인지적 재구조화 중심의 기존 접근법의 한계를 극복하기 위해 감정중심치료 (EFT) 기반의 다중 에이전트 체인 오브 씽킹 프레임워크인 'EFT-CoT'를 제안하고, 이를 통해 고품질 데이터셋과 전용 모델을 구축하여 공감의 깊이와 전문성 측면에서 기존 모델 및 인간 응답을 능가하는 정신 건강 지원 시스템을 제시합니다.
이 논문은 X-Codec-2.0 의 잠재 공간 레이트를 50Hz 에서 25Hz 로 낮추고 샘플링 주파수를 16kHz 에서 24kHz 로 높이는 간단한 구조 개선을 통해 다국어 음성 모델의 효율성과 음질 (MOS 점수 0.29 향상) 을 동시에 개선한 결과를 제시합니다.
이 논문은 118 억 토큰 규모의 사이버 보안 데이터와 에이전트 기반 증강 파이프라인을 활용하여 훈련된 오픈소스 사이버 보안 특화 LLM 인 'RedSage'를 제안하고, 이를 통해 사이버 보안 전문성과 일반 추론 능력을 동시에 향상시켰음을 입증합니다.
이 논문은 희소하고 지연된 보상 문제를 해결하기 위해 메모리 작업 트리를 통한 힌드사이트 크레딧 할당을 도입한 MoT-GRPO 학습 프레임워크와 경량 계층적 메모리 데이터베이스를 활용한 Mem-T 에이전트를 제안하여 장기 기억 관리 정책의 종단간 최적화와 성능 향상을 달성했습니다.
이 논문은 Schwartz 의 고차원 가치 범주가 단일 문장 기반 인간 가치 감지 작업에서 경성 계층적 게이트링보다는 인덕티브 바이어스나 보정 및 앙상블 기법과 결합될 때 더 유용함을 보여줍니다.
이 논문은 역할 인식 맞춤형 메모리와 정보 과부하 문제를 해결하기 위해 토큰 효율적인 잠재 메모리 프레임워크인 LatentMem 과 이를 최적화하는 LMPO 를 제안하여 다중 에이전트 시스템의 성능을 기존 방식 대비 최대 19.36% 향상시킨 연구입니다.