OrthoEraser: Coupled-Neuron Orthogonal Projection for Concept Erasure
이 논문은 민감한 개념과 유익한 속성이 중첩된 신경망 구조에서 유해한 콘텐츠를 제거하면서도 모델의 정상적인 생성 능력을 보존하기 위해 희소 오토인코더와 결합된 뉴런의 분석적 직교 투영을 활용하는 'OrthoEraser'라는 새로운 개념 제거 기법을 제안합니다.
11544 편의 논문
이 논문은 민감한 개념과 유익한 속성이 중첩된 신경망 구조에서 유해한 콘텐츠를 제거하면서도 모델의 정상적인 생성 능력을 보존하기 위해 희소 오토인코더와 결합된 뉴런의 분석적 직교 투영을 활용하는 'OrthoEraser'라는 새로운 개념 제거 기법을 제안합니다.
이 논문은 그래프 기반 검색 증강 생성 (GraphRAG) 의 보안 취약점을 공략하기 위해, 외부 데이터베이스에 독성 사건과 지식 진화 경로를 조작하여 지식 그래프를 오염시키고 LLM 의 응답을 악의적으로 조작하는 새로운 공격 기법인 KEPo(Knowledge Evolution Poison) 를 제안하고 그 효과성을 입증합니다.
이 논문은 나노포토닉 소자의 제조 공정에서 발생하는 비균일한 변형을 예측하고 불확실성을 모델링하기 위해, 설계 레이아웃을 입력받아 다양한 고해상도 제조 결과를 생성하는 조건부 생성적 적대 신경망 (cGAN) 기반의 'Gen-Fab'을 제안하고, 기존 방법들보다 우수한 정확도와 일반화 성능을 입증했습니다.
이 논문은 고성능 컴퓨팅 시스템에서 대규모 설계 공간을 탐색하기 위해 전문 에이전트들이 협력하는 LLM 기반의 MADA 프레임워크를 제안하며, 이를 통해 관성 핵융합의 Richtmyer-Meshkov 불안정성 억제와 같은 복잡한 과학적 설계 작업을 자동화하고 최적화하는 것을 입증합니다.
이 논문은 기존 조합 이미지 검색 (CIR) 모델이 어려운 부정적 샘플에서 한 모달리티에 치우쳐 성능이 저하되는 문제를 해결하기 위해, 모델의 주의 집중 불균형을 진단하는 'FBCIR' 방법과 이를 보완하는 데이터 증강 워크플로우를 제안합니다.
이 논문은 저수준 질감 단서와 중간 수준 시맨틱을 통합한 다중 단서 인식 모듈과 의사 레이블 진화 융합 기법을 통해 라벨 노이즈를 정제하고 세부 정보를 복원함으로써, 비지도 위장 객체 탐지 (UCOD) 의 성능을 획기적으로 향상시키는 EReCu 프레임워크를 제안합니다.
이 논문은 토큰이 각 전문가의 임계값을 독립적으로 초과하는지 확인하여 동적 계산 할당과 보조 손실 없이 부하 균형을 달성하는 '전문가 임계값 (Expert Threshold)' 라우팅을 제안하며, 이를 통해 TC-MoE 대비 더 낮은 손실과 적은 토큰으로 동등한 성능을 달성하는 것을 보여줍니다.
이 논문은 CLIP 과 같은 대규모 비전 - 언어 모델의 원샷 적응 시 발생하는 안정성 - 가소성 딜레마를 해결하기 위해, 전역 근접 정규화와 하이브리드 사전 지식, 지원 세트 증강, 적응형 분포 보정, 다중 스케일 RBF 커널을 결합한 훈련 없는 프레임워크 'ReHARK'를 제안하여 11 개 벤치마크에서 기존 방법들을 압도하는 새로운 최첨단 성능을 달성했다고 요약할 수 있습니다.
이 논문은 텍스트, 이미지, 오디오, 비디오 등 다양한 모달리티에 특화된 도구들을 중앙 집중형 'Supervisor'가 동적으로 조정하여 처리하는 에이전트 AI 프레임워크를 제안하며, 이를 통해 기존 계층적 기준 대비 응답 시간과 대화 재작업, 비용을 대폭 절감하면서도 정확도를 유지하는 것을 입증했습니다.
이 논문은 실제 세계의 복잡한 다층 환경과 장기 작업을 평가하기 위해 언어 기반의 전체 건물 규모 3D 장면 생성 프레임워크인 'MANSION'과 이를 활용한 대규모 데이터셋 'MansionWorld'를 제안합니다.
이 논문은 데이터 수집, 정책 학습, 실행을 단일 VLM 기반 에이전트로 통합하고 자기 재설정 루프를 통해 장기적 로봇 작업의 안정성과 확장성을 획기적으로 개선한 'RoboClaw' 프레임워크를 제안합니다.
본 논문은 고위험 의사결정 상황에서 대형 언어 모델들이 오류를 정확히 인지함에도 불구하고 동일한 실수를 고도화된 형태로 반복하는 '나선형 동역학 (Helicoid dynamics)' 현상을 확인하고, 이를 해결하기 위한 12 가지 가설과 인간-AI 협력의 새로운 방향을 제시합니다.
이 논문은 최적화나 학습 중심의 접근을 넘어, 지속적 환경과 분산 인센티브 필드가 결합된 폐루프 피드백 구조를 통해 중앙 집중적 설계나 합리적 기대 없이도 적응적 조정이 어떻게 구조적 속성으로 나타나는지 설명하는 동적 이론을 제시합니다.
이 논문은 다중 목표 최적화 문제를 해결하기 위해 자연어 프롬프트 대신 수학적 형식 언어와 효용 함수를 기반으로 한 'UtilityMax Prompting' 프레임워크를 제안하고, 영화 추천 태스크에서 기존 자연어 기반 방법보다 정밀도와 NDCG 성능이 향상됨을 검증했습니다.
이 논문은 복소수 연산을 기반으로 한 생성기와 판별자, 위상 양자화, 그리고 블록 행렬 계산 기법을 도입하여 기존 실수 기반 모델보다 더 높은 음질과 25% 의 훈련 시간 단축을 달성한 새로운 복소수 신경 보코더 'ComVo'를 제안합니다.
이 논문은 대규모 언어 모델 (LLM) 과 생존 분석을 결합하여 실제 임상 데이터에서 암 진행 및 독성 같은 예측 변수를 추출하고, 이를 통해 화학요법 치료 결과를 조기에 예측하여 개인화된 치료 계획 수립을 가능하게 하는 새로운 접근법을 제시합니다.
이 논문은 7 가지 오픈소스 대규모 언어 모델 (LLM) 을 평가하여, 추론과 오타 수정 작업에서는 특정 모델이 우수했으나 설명 텍스트에 대한 선호도는 평가자에 따라 크게 달라, 일본어 병리 보고서 작성 보조를 위해 오픈소스 LLM 이 제한적이지만 임상적으로 의미 있는 시나리오에서 유용할 수 있음을 시사합니다.
이 논문은 당뇨병, 고혈압 등 5 가지 주요 만성질환의 조기 위험 예측을 위해 생존 분석과 분류 기법을 통합한 새로운 프레임워크를 제안하며, 실제 전자의무기록 (EMR) 데이터를 통해 기존 최첨단 모델보다 우수한 성능과 임상적으로 검증된 설명 가능성을 입증했습니다.
이 논문은 비전 - 언어 모델 (VLM) 의 게임 플레이 성능 향상을 위해 시각적 프레임과 상징적 표현을 결합하는 방식을 연구한 결과, 상징 추출의 정확도가 신뢰할 수 있을 때만 상징적 그라운딩이 효과적이며, 인식의 질이 향후 VLM 기반 에이전트의 핵심 병목 요소임을 밝혔습니다.
이 논문은 오토노머스 LLM 에이전트인 OpenClaw 의 보안 위협을 분석하기 위해 초기화부터 실행까지의 5 단계 수명 주기 프레임워크를 제시하고, 간접 프롬프트 인젝션 및 메모리 중독 등 복합적 위협을 규명하며 기존 방어 기법의 한계를 지적하고 통합적 보안 아키텍처의 필요성을 강조합니다.