Mitigating Unintended Memorization with LoRA in Federated Learning for LLMs
이 논문은 연방 학습 환경에서 저랭크 적응 (LoRA) 기법을 적용하면 모델의 성능 저하 없이 훈련 데이터의 암기 현상을 최대 10 배까지 감소시켜 개인정보 보호를 강화할 수 있음을 입증합니다.
1071 편의 논문
이 논문은 연방 학습 환경에서 저랭크 적응 (LoRA) 기법을 적용하면 모델의 성능 저하 없이 훈련 데이터의 암기 현상을 최대 10 배까지 감소시켜 개인정보 보호를 강화할 수 있음을 입증합니다.
이 논문은 대규모 언어 모델 (LLM) 을 활용하여 뇌의 시각 피질 뉴런이 특정 이미지에 반응하는 이유를 자연어 캡션으로 생성하고 해석하는 'LaVCa'라는 새로운 접근법을 제안하며, 기존 방법보다 더 정교하고 상세한 뇌 표현의 특성을 규명했다고 요약할 수 있습니다.
이 논문은 LLM 의 하류 작업 성능 예측 정확도를 높이기 위해 작업 난이도 특성에 따라 클러스터링하는 COD 프레임워크를 제안하고, 이를 통해 예측 가능한 하위 집단의 성능을 전체 평가 세트로 외삽하여 70B 파라미터 모델에서 평균 1.55% 의 낮은 예측 오차를 달성했음을 보여줍니다.
이 논문은 RRAM 의 노이즈로 인한 성능 저하를 해결하기 위해 노이즈가 없는 SRAM 에 LoRA 분기를 배치하고 노이즈 환경에 강인하도록 학습하는 'HaLoRA'를 제안하여, 하이브리드 CIM 아키텍처에서 에너지 효율성을 극대화하면서도 LLM 의 추론 정확도를 유지하거나 향상시키는 방법을 제시합니다.
이 논문은 대규모 언어 모델이 직업별 여성 등장인물을 과대표출하면서도 실제 노동 시장 데이터보다는 성별 고정관념에 더 부합하는 편향을 유지하는 역설적 현상을 규명하고, 이를 해결하기 위한 균형 잡힌 완화 조치의 중요성을 강조합니다.
이 논문은 고비용의 수동 단계 주석이 필요 없이 예측 엔트로피를 기반으로 논리적 전환점을 자동으로 식별하여 효율적인 과정 보상 모델 (EDU-PRM) 을 제안하며, 적은 학습 데이터로도 최첨단 성능을 달성하고 추론 정확도를 높이며 토큰 사용량을 대폭 줄인다는 결과를 보여줍니다.
이 논문은 기존 정보 검색 모델이 간과해 온 인과 관계 추론 능력을 강화하기 위해 의미적 및 인과적 관계를 동시에 학습하는 새로운 검색 모델 'CAWAI'를 제안하고, 대규모 검색 환경과 과학 분야 질문 응답 작업에서 뛰어난 성능과 제로샷 일반화 능력을 입증합니다.
이 논문은 K-5 수학 및 독해 평가 문항의 난이도를 예측하기 위해 대규모 언어 모델 (LLM) 을 활용한 직접 추정법과 특징 기반 앙상블 모델 접근법을 비교한 결과, LLM 이 추출한 언어 및 인지 특징을 나무 기반 머신러닝 모델에 입력하는 방식이 가장 높은 예측 정확도를 보였음을 입증했습니다.
이 논문은 해양 포유류叫声부터 복잡한 실세계 음향에 이르기까지 다양한 도메인의 음향 이해와 추론 능력을 평가하기 위해 DCASE 2025 챌린지의 Task 5 로 오디오 질문 응답 (AQA) 벤치마크를 제안하고, 다양한 오디오 - 언어 모델들의 성능을 비교 분석합니다.
FreeKV 는 학습이 필요 없는 알고리즘 및 시스템 공동 최적화 프레임워크를 통해 KV 캐시 검색 효율성을 극대화하면서도 정확도를 유지하여, 기존 최첨단 방법 대비 최대 13 배의 속도 향상을 달성합니다.
이 논문은 유사 문제 검색과 형식적 검증기를 결합한 신경-심볼릭 접근법을 통해 LLM 의 기하학적 증명 정확도를 크게 향상시키고 신뢰할 수 있는 추론을 가능하게 하는 방법을 제시합니다.
이 논문은 검증 세트 없이도 메타 피드백을 통해 각 문제实例에 맞춰 에이전트 구성을 동적으로 설계, 비판 및 정제할 수 있는 최초의 자기 진화 추론 시간 프레임워크인 MAS-ZERO 를 제안하며, 다양한 벤치마크에서 기존 수동 및 자동 다중 에이전트 시스템보다 뛰어난 성능을 입증합니다.
이 논문은 HDL 코드의 구조적 및 어휘적 불일치 문제를 해결하기 위해 추상 구문 트리와 데이터 흐름 그래프를 통합한 'HDLxGraph' 프레임워크와 실세계 HDL 프로젝트 기반의 'HDLSearch' 벤치마크를 제안하여, 기존 RAG 기반 방법론보다 검색, 디버깅, 코드 완성 정확도를 크게 향상시켰음을 보여줍니다.
이 논문은 LLM 이 실제 소프트웨어 개발 워크플로우를 모방하여 패치를 생성하고 CI 파이프라인을 통해 검증하는 경쟁적 평가 프레임워크 'SwingArena'를 제안하며, 이를 통해 긴 맥락의 GitHub 이슈 해결 능력을 다양한 프로그래밍 언어로 평가할 수 있음을 보여줍니다.
이 논문은 전문가 수준의 테이블 이해, 추론, 조작 능력을 포괄적으로 평가하기 위해 25 가지 실제 태스크와 28,000 개 이상의 질문으로 구성된 대규모 벤치마크인 MMTU 를 소개하고, 최신 선두 모델들조차 이 작업에서 상당한 개선의 여지가 있음을 보여줍니다.
이 논문은 대형 추론 모델의 성능을 저하시킬 수 있는 과도하거나 부족한 반사적 사고를 최적화하기 위해, 추가 계산 비용 없이 추론 토큰의 배치와 빈도를 삼각파 형태로 주기적으로 조절하는 'CyclicReflex'라는 훈련 없는 디코딩 전략을 제안합니다.
이 논문은 보상 함수를 프롬프트에 명시하여 모델이 최적화 목표를 인지하도록 하는 '동기 부여 강화 미세 조정 (MeRF)' 방법을 제안함으로써, 기존 검증 가능 보상을 활용한 강화 학습의 비효율성을 극복하고 대형 추론 모델의 성능을 크게 향상시킨다고 설명합니다.
이 논문은 MLLM 검증기에서 발생하는 '동의 편향 (agreement bias)'을 해결하기 위해 사전 지식을 생성한 후 이를 기반으로 추론하는 '자기 기반 검증 (SGV)' 방법을 제안함으로써, 에이전트의 실패 감지 정확도와 태스크 완료율을 기존 최첨단 성능보다 크게 향상시켰다고 설명합니다.
이 논문은 대화형 AI 에서 사용자 시뮬레이터의 일관된 목표 달성 능력을 향상시키기 위해 사용자 목표 상태 추적 (UGST) 프레임워크와 3 단계 개발 방법론을 제안하고, 이를 통해 MultiWOZ 2.4 와 -Bench 벤치마크에서 목표 정렬 성능을 크게 개선했음을 보여줍니다.
이 논문은 기존 템플릿 변환 방식의 한계를 극복하고 PlanetMath 의 개념 설명 쌍을 기반으로 강화 학습을 통해 난이도와 구조적 유효성을 최적화하는 새로운 합성 문제 생성 프레임워크인 'MathSmith'를 제안하여, 고난도 수학 추론 능력을 향상시키는 것을 목표로 합니다.