DOCFORGE-BENCH: A Comprehensive 0-shot Benchmark for Document Forgery Detection and Analysis

이 논문은 학습 데이터 없이 다양한 문서 위조 검출 방법을 평가한 'DOCFORGE-BENCH' 벤치마크를 제시하며, 기존 방법들이 임계값 보정 실패로 인해 실제 배포 환경에서 성능이 크게 저하됨을 규명하고 문서 위조 탐지가 여전히 해결되지 않은 문제임을 강조합니다.

Zengqi Zhao, Weidi Xia, En Wei, Yan Zhang, Jane Mo, Tiannan Zhang, Yuanqin Dai, Zexi Chen, Yiran Tao, Simiao Ren2026-03-11💻 cs

Scaling Multilingual Semantic Search in Uber Eats Delivery

이 논문은 수억 개의 쿼리 - 문서 상호작용 데이터를 기반으로 Qwen2 기반의 양방향 모델과 Matryoshka 표현 학습을 활용하여 우버 이츠의 스토어, 메뉴, 식료품 등 다양한 카테고리와 다국어 검색을 통합한 대규모 의미 기반 검색 시스템을 구축하고 평가한 내용을 담고 있습니다.

Bo Ling, Zheng Liu, Haoyang Chen, Divya Nagar, Luting Yang, Mehul Parsana2026-03-11💻 cs

Self-hosted Lecture-to-Quiz: Local LLM MCQ Generation with Deterministic Quality Control

이 논문은 외부 API 없이 로컬 LLM 과 결정적 품질 관리 (QC) 를 통해 강의 PDF 를 다지선다형 문제로 변환하는 종단간 자체 호스팅 파이프라인을 제안하고, 정보이론·열역학·통계역학 등 세 가지 강의에서 생성된 24 개의 문제를 검증하여 프라이버시, 책임성, 친환경 AI 를 보장하는 교육 워크플로우를 입증합니다.

Seine A. Shintani2026-03-11💻 cs

Fair and Square: Replacing One Real Multiplication with a Single Square and One Complex Multiplication with Three Squares When Performing Matrix Multiplication and Convolutions

이 논문은 행렬 곱셈과 컨볼루션 연산에서 실수 곱셈을 제곱 연산으로, 복소수 곱셈을 세 번의 제곱 연산으로 대체함으로써 하드웨어 게이트 수를 대폭 줄일 수 있음을 보여주고 이를 구현하는 다양한 하드웨어 아키텍처를 제안합니다.

Vincenzo Liguori2026-03-11💻 cs

RSH-SpMM: A Row-Structured Hybrid Kernel for Sparse Matrix-Matrix Multiplication on GPUs

이 논문은 GPU 기반 희소 행렬 - 행렬 곱셈 (SpMM) 의 성능 저하를 해결하기 위해 적응형 행 분할, RS-Tile 표현, 그리고 부하 균형 하이브리드 커널을 도입한 RSH-SpMM 을 제안하며, 다양한 희소 작업에서 기존 최첨단 방법보다 1.27 배에서 6.13 배까지의 가속화를 달성함을 보여줍니다.

Aiying Li, Jingwei Sun, Han Li, Wence Ji, Guangzhong Sun2026-03-11💻 cs

FormalRTL: Verified RTL Synthesis at Scale

이 논문은 애매한 명세와 형식적 정확성 보장의 부재로 인해 산업 규모 데이터 경로 설계에 적용하기 어려웠던 대규모 언어 모델을 활용하여, 소프트웨어 참조 모델을 형식 명세로 통합하고 계획·합성·형식 등가성 검증을 긴밀하게 결합한 'FormalRTL'이라는 다중 에이전트 프레임워크를 제안하여 확장 가능하고 신뢰할 수 있는 하드웨어 코드 생성을 실현함을 보여줍니다.

Kezhi Li, Min Li, Xiangyu Wen, Shibo Zhao, Jieying Wu, Junhua Huang, Qiang Xu2026-03-11💻 cs

Adaptive Multi-Objective Tiered Storage Configuration for KV Cache in LLM Service

이 논문은 LLM 서비스의 KV 캐시 관리를 위해 다양한 저장 계층을 동적으로 최적화하여 비용, 처리량, 지연 시간 간의 파레토 최적 해를 찾는 'Kareto'라는 적응형 다목적 최적화 도구를 제안하고, 이를 통해 고정된 구성 대비 최대 9.3% 의 처리량 향상, 58.3% 의 지연 시간 감소, 또는 20.2% 의 비용 절감을 달성할 수 있음을 입증합니다.

Xianzhe Zheng, Zhengheng Wang, Ruiyan Ma, Rui Wang, Xiyu Wang, Rui Chen, Peng Zhang, Sicheng Pan, Zhangheng Huang, Chenxin Wu, Yi Zhang, Bo Cai, Kan Liu, Teng Ma, Yin Du, Dong Deng, Sai Wu, Guoyun Zhu, Wei Zhang, Feifei Li2026-03-11💻 cs

ChatNeuroSim: An LLM Agent Framework for Automated Compute-in-Memory Accelerator Deployment and Optimization

이 논문은 메모리-연산 간 데이터 전송 오버헤드를 줄이는 컴퓨트 인 메모리 (CIM) 아키텍처의 설계 공간 탐색 (DSE) 주기를 단축하고 최적 설계를 자동화하기 위해, 대규모 언어 모델 (LLM) 기반 에이전트 프레임워크인 ChatNeuroSim 과 설계 공간 가지치기 기법을 제안합니다.

Ming-Yen Lee, Shimeng Yu2026-03-11💻 cs

Electoral Systems Simulator: An Open Framework for Comparing Electoral Mechanisms Across Voter Distribution Scenarios

이 논문은 유권자 선호 분포 시나리오를 기반으로 다양한 선거 제도를 시뮬레이션하고 비교하는 오픈 소스 파이썬 프레임워크인 `electoral_sim`을 소개하며, 기존 제도부터 볼츠만 소프트맥스 커널을 활용한 새로운 가상의 메커니즘까지 다양한 방식의 선거 결과와 유권자 분포의 기하학적 중앙값 간 거리를 분석합니다.

Sumit Mukherjee2026-03-11💻 cs