Sema: A High-performance System for LLM-based Semantic Query Processing
LLM 기반의 의미적 쿼리 처리를 위해 DuckDB 를 기반으로 구축된 Sema 는 자연어 표현을 SQL 에 통합하고 적응적 쿼리 실행 (AQE) 을 통해 토큰 소비와 지연 시간을 최적화함으로써 기존 시스템 대비 2~10 배의 성능 향상을 달성합니다.
8383 편의 논문
LLM 기반의 의미적 쿼리 처리를 위해 DuckDB 를 기반으로 구축된 Sema 는 자연어 표현을 SQL 에 통합하고 적응적 쿼리 실행 (AQE) 을 통해 토큰 소비와 지연 시간을 최적화함으로써 기존 시스템 대비 2~10 배의 성능 향상을 달성합니다.
이 논문은 3D 전신 PET 영상의 해부학적 대비 부족과 데이터 부족 문제를 해결하기 위해, 11,041 건의 스캔과 59,831 개의 마스크로 구성된 대규모 데이터셋을 기반으로 다양한 질병과 추적자에 대해 제로샷 성능을 보이는 범용 분할 기초 모델 'SegAnyPET'을 개발하고 그 임상적 유효성을 입증했습니다.
이 논문은 인간과 반려동물 간 상호작용 데이터를 기반으로 한 구조화된 참고 자료와 프로토타입 로봇, 제어 스튜디오를 통합한 'MojiKit' 툴킷을 개발하고, 이를 통해 비전문가도 기술적 장벽 없이 반려동물에서 영감을 받은 풍부하고 다양한 정서적 로봇 행위를 체계적으로 설계할 수 있음을 실증했습니다.
본 논문은 단일 이미지 기반의 레이아웃 인식 3D 생성을 넘어, 다중 뷰 일관성과 물리적 타당성을 보장하는 훈련 없는 프레임워크인 MV-SAM3D 를 제안하여 객체 간 침투나 공중 부양과 같은 비현실적 문제를 해결하고 생성 품질을 크게 향상시켰습니다.
이 논문은 시그니처 커널 기반 엔트로피를 도입하여 로봇 모방 학습 데이터셋의 다양성을 정량화하고, 이를 기반으로 모델 프리 방식으로 최적의 데이터 서브셋을 선택하는 FAKTUAL 알고리즘을 제안함으로써 다양한 벤치마크와 실제 작업에서 성공률을 향상시켰음을 보여줍니다.
이 논문은 물리 변수를 독립 토큰으로 처리하여 다중 스케일 역학을 분리하고, 잠재 공간에서의 온라인 적응을 통해 비정상적인 하중 변화에 실시간으로 대응하는 '분해된 역학 트랜스포머 (FDT)'와 '잠재 잔류 어댑터 (LRA)'를 기반으로 한 예측적 적응 프레임워크를 제안하여 무인 항공 매니퓰레이터의 제어 정밀도와 안정성을 크게 향상시켰습니다.
이 논문은 생성형 비전 - 모션 정책에서 작업 실패와 밀접하게 연관된 '조각 경계 아티팩트'가 단순한 실행 결함이 아니라 노이즈에 민감하고 방향성을 가진 개입이 가능한 실패 메커니즘임을 규명하고, 이를 통해 정책의 안정성을 개선할 수 있음을 보여줍니다.
이 논문은 고차원 및 멱법칙 그래프에서 기존 BFS 의 O(D) 단계 복잡도 한계를 극복하기 위해 GPU 에 최적화된 PR-RST 알고리즘과 GConn 기반의 오일러 투어 루팅 방식을 비교 분석한 결과, 후자가 최적화된 BFS 대비 최대 300 배의 속도 향상을 보여줌으로써 GPU 그래프 분석에서 RST 구성 전략의 재검토가 필요함을 시사합니다.
이 논문은 이진 방향성 주의 의존성으로 인한 높은 지연 시간을 해결하기 위해, 비동기적 블록 인과 정렬, 오디오 싱크 토큰 메커니즘, 그리고 결합 자기 강제 증류 기법을 도입하여 단일 GPU 에서 약 25 FPS 의 실시간 고품질 오디오 - 비디오 생성을 가능하게 한 'OmniForcing' 프레임워크를 제안합니다.
이 논문은 비시저리 푸시다운 오토마타의 대안으로서 서로 호출할 수 있는 오토마타 집합으로 구성된 '비시저리 재귀 오토마타 (VRAs)'를 제안하고, 그 언어 이론적 연산 및 결정 문제의 복잡성을 분석하며 표현력을 제한하지 않는 '코드터미니즘' 개념을 도입하여 VRAs 의 보충 연산 구현 등 알고리즘적 이점을 입증합니다.
이 논문은 시뮬레이션 데이터만으로 훈련된 심층 신경망을 통해 불확실성을 예측하여 기존 Unscented Kalman Filter 의 성능을 개선하고, 다양한 차량 및 환경 조건에서 내비게이션 정확도를 12.7% 향상시킨 하이브리드 추정 프레임워크를 제안합니다.
이 논문은 시연 데이터를 물체 중심 기술로 분해하고 불확실성 인식 추정기를 통해 정렬하는 'DexMulti'라는 효율적인 접근법을 제시하여, 기존 단일 정책 기반 방법보다 적은 시연 데이터로 복잡한 동시 조작 과제를 성공적으로 수행하고 높은 일반화 성능을 달성했습니다.
이 논문은 텐서 트라이 분해를 통해 고차원 구성 공간을 압축하고 이를 그래프 최적화 (GCS) 와 결합하여 효율적이고 확장 가능한 로봇 경로 계획 프레임워크인 TANGO 를 제안합니다.
이 논문은 의료 영상 분할을 위한 연합 학습의 공정한 평가를 위해 10 가지 영상 모달리티와 9 가지 분할 작업을 포괄하는 첫 번째 종합 벤치마크인 FL-MedSegBench 를 소개하고, 다양한 연합 학습 방법의 성능을 다각도로 분석하여 임상 적용을 위한 실증적 가이드라인을 제시합니다.
이 논문은 대규모 오디오 언어 모델 (LALM) 에서 도출된 온라인 피드백을 활용하여 텍스트 - 오디오 생성을 강화 학습 (GRPO) 으로 개선한 'Resonate' 모델을 제안하며, 이를 통해 오디오 품질과 의미적 정합성 측면에서 새로운 최첨단 성능을 달성했음을 보여줍니다.
이 논문은 사전 학습된 비전 인코더의 백도어 공격을 재학습 없이 추론 시에 탐지하는 제로샷 방법인 BackdoorIDS 를 제안하며, 점진적 마스킹 하에서의 어텐션 변화와 임베딩 클러스터링을 활용하여 기존 방어 기법보다 우수한 성능을 보입니다.
이 논문은 유동 매칭 기반의 DiT 아키텍처와 잠재 공간의 다중 모달 조건 결합 및 자기 참조 메커니즘을 활용하여, 기존 가상 의류 입기 (VTON) 방법들보다 높은 화질과 추론 효율성을 동시에 달성하는 프롬프트 기반 프레임워크 'PROMO'를 제안합니다.
이 논문은 국소 텍스처와 장기 의존성을 효율적으로 모델링하고 큰 커널 모듈과 교차 계층 매개변수 공유를 통해 계산 비용을 줄인 경량 초해상도 네트워크 UCAN 을 제안하여, 제한된 자원으로 높은 정확도와 확장성을 달성함을 보여줍니다.
이 논문은 YOLO11 아키텍처를 기반으로 어텐션 메커니즘과 CARAFE 등을 개선한 'COTONET'을 제안하여, 다양한 생육 단계의 목화 꼬투리를 정밀하게 탐지하고 엣지 디바이스에서도 효율적으로 작동할 수 있도록 함으로써 목화 수확 자동화의 정확도와 품질을 향상시켰습니다.
이 논문은 부분 관측 가능성과 반-밴딧 피드백 하에서 전략적 생태적 적대자 (예: 코끼리) 에 대한 적응형 자원 배분 정책을 학습하여 기존 균형 기반 접근법의 한계를 극복하고, HERDS 알고리즘을 통해 인간 - 코끼리 갈등을 효과적으로 완화하는 온라인 학습 프레임워크를 제시합니다.