The Density of Cross-Persistence Diagrams and Its Applications
이 논문은 교차 지속성 다이어그램의 밀도 존재성을 증명하고, 이를 점 구름 데이터의 분포 예측 및 구분에 활용하는 최초의 머신러닝 프레임워크를 제안하여 기존 기법보다 우수한 성능을 입증합니다.
11554 편의 논문
이 논문은 교차 지속성 다이어그램의 밀도 존재성을 증명하고, 이를 점 구름 데이터의 분포 예측 및 구분에 활용하는 최초의 머신러닝 프레임워크를 제안하여 기존 기법보다 우수한 성능을 입증합니다.
이 논문은 3D 의료 영상 이해를 위한 비효율적인 계산 과부하를 해결하기 위해, 슬라이드 수준 및 토큰 수준의 중복성을 제거하는 훈련 불필요 계층적 토큰 가지치기 프레임워크 'MedPruner'를 제안하며, 이를 통해 시각 토큰을 5% 미만으로 줄이면서도 성능을 유지하거나 향상시킬 수 있음을 입증했습니다.
본 논문은 그래픽 지각 이론에 기반한 인간 유사 해석 그라운딩과 사고 분해 (DoT) 프롬핑팅을 도입하여 차트 기반 시각 추론의 한계를 극복하고, InternVL 기반의 VisDoT 프레임워크를 통해 ChartQA 및 ChartQAPro 등 다양한 벤치마크에서 최첨단 성능을 달성한 연구입니다.
이 논문은 기하학적 유효성과 제어 가능성을 갖춘 통합 프레임워크 'HouseMind'를 제안하여, 이산형 방 인스턴스 토큰을 활용하여 텍스트 명령에 따라 건축 평면도를 이해, 생성 및 편집하는 멀티모달 대규모 언어 모델을 소개합니다.
이 논문은 교차 모달 불일치와 개인별 증상 차이를 해결하기 위해 다중 모달 표현을 해리하고 개인별 가중치 융합을 수행하는 'IDRL' 프레임워크를 제안하여 우울증 진단의 정확성과 견고성을 향상시켰습니다.
이 논문은 비트 단위 AND 연산을 통해 안정적인 스파이크 골격과 불안정한 스파이크 맵을 분리하고 일관성을 최적화하는 'Stable Spike' 방법을 제안하여, 초저지연 환경에서 스파이킹 신경망 (SNN) 의 인식 정확도와 일반화 성능을 크게 향상시킵니다.
이 논문은 인간과 에이전트의 협업이 단순한 개별 행동 제어에서 벗어나, 미래 시나리오를 사전에 시뮬레이션하여 정보에 기반한 의사결정을 가능하게 하는 '시뮬레이션-인-더-루프' 패러다임으로 전환해야 함을 주장합니다.
이 논문은 LLM 이 소량의 데이터로 전역 및 로컬 규칙을 생성하여 복잡한 임상 데이터를 표준화함으로써, 기존 모델보다 우수한 성능과 감사 용이성, 확장성을 갖춘 효율적인 지도 학습 파이프라인을 제안합니다.
이 논문은 정책 경사 알고리즘이 학습 과정에서 엔트로피가 감소하여 탐색 다양성이 저하되는 문제를 지적하고, REPO 와 ADAPO 와 같은 엔트로피 보존 메커니즘을 제안하여 학습 중 다양성을 유지함으로써 최종 성능과 새로운 환경에서의 연속 학습 능력을 향상시키는 방법을 제시합니다.
이 논문은 FastSpeech2 아키텍처에 명시적인 감정 조건부와 반사실적 훈련 목표를 도입하여 텍스트, 감정, 화자가 말초리 (지속 시간, 피치, 에너지) 를 통해 음성 파형에 미치는 인과적 관계를 모델링함으로써, 언어적 내용과 감정적 프로소디를 분리하고 자연스러운 감정 표현과 정교한 프로소디 제어가 가능한 새로운 TTS 프레임워크를 제안합니다.
이 논문은 사전 정의와 문장 인코더만을 활용하여 자동적으로 생성되는 경량화되고 언어에 구애받지 않는 SemBench 프레임워크를 제안함으로써, 대규모 언어 모델의 의미적 이해 능력을 다양한 언어와 모델에 걸쳐 효율적으로 평가할 수 있음을 보여줍니다.
이 논문은 블랙박스 형태의 멀티모달 대규모 언어 모델 (MLLM) 의 제로샷 작업 성능을 검증하고 향상시키기 위해, 명시적 논리 추론 채널을 도입하여 일관성 지표를 통한 모델 선택과 신뢰할 수 있는 성능 개선을 가능하게 하는 프레임워크를 제안합니다.
이 논문은 다양한 에이전트 수와 미시적 관측 환경에서 장기적 시간 의존성과 에이전트 간 협력을 효과적으로 포착하기 위해 공간 및 시간 계층 구조와 인터리브드 재귀적 구조를 도입한 STAIRS-Former 를 제안하고, 이를 통해 오프라인 다중 작업 다중 에이전트 강화학습에서 기존 방법들을 능가하는 새로운 최고 성능을 달성했음을 보여줍니다.
이 논문은 텍스트 기반 비디오 생성 모델의 객체 상태 변화 (OSC) 능력을 평가하기 위해 요리 데이터를 기반으로 한 새로운 벤치마크인 OSCBench 를 제안하고, 기존 모델들이 의미적 정합성은 우수하지만 새로운 및 복합적인 상황에서의 객체 상태 변화 구현에는 여전히 한계가 있음을 밝힙니다.
이 논문은 모델 크기뿐만 아니라 역할 정의, 기술 깊이, 도구 완성도 등 구조적 차원을 체계적으로 확장하는 '에이전트 스케일링 법칙'을 제안하고, 이를 구현한 EduClaw 플랫폼을 통해 교육용 AI 에이전트의 성능이 프로필의 구조적 풍부함에 따라 예측 가능하게 향상됨을 실증합니다.
이 논문은 발화 및 무성 발화 중 얼굴과 목의 표면 근전도 (sEMG) 신호를 분석하여 좌절감을 포함한 감정을 0.845 AUC 의 정확도로 식별할 수 있음을 입증하고, 무성 발화에서도 감정 신호가 유지됨을 보여줌으로써 감성 인식 무성 발화 인터페이스의 가능성을 제시합니다.
이 논문은 안전성, 투명성, 감사 가능성을 보장하기 위해 제한된 실행 환경, 문서 중심 상호작용, 페이지 인덱싱 메모리, 그리고 커스텀 의료 기술 라이브러리를 통합하여 병원 환경에 적합한 '에이전트 운영체제'를 제안합니다.
이 논문은 정류장 대기 시간 (buffer time) 을 고려할 때 기존 Dijkstra 기반 필터링이 부적합하다는 점을 지적하고, 이를 해결하여 MR 알고리즘보다 2 배 이상 빠른 성능을 내는 '전송 인지 Dijkstra(TAD)' 알고리즘을 제안합니다.
이 논문은 GPT-5 를 활용한 시뮬레이션 연구를 통해 채용 과정에서 성별에 따른 직무 추천 차이는 없었으나, 여성에게는 감정적·공감적 특성을, 남성에게는 전략적·분석적 특성을 부여하는 언어적 편향이 존재함을 발견하고 Generative AI 의 채용 활용에 대한 윤리적 투명성과 공정성의 필요성을 강조합니다.
이 논문은 전력망과 같은 복잡한 시계열 데이터의 노이즈와 이상치를 처리하기 위해 이상 탐지와 결측치 보정을 단일 엔드투엔드 시스템으로 통합한 확률적 프레임워크 'CINDI'를 제안하고, 이를 통해 데이터의 물리적 및 통계적 특성을 보존하면서 강건한 성능을 입증합니다.