cs.AI 편의 논문 | Gist.Science

BoxMind: Closed-loop AI strategy optimization for elite boxing validated in the 2024 Olympics

본 논문은 2024 파리 올림픽에서 중국 국가대표팀의 역사적인 메달 획득에 기여한 것으로 검증된, 박스마인드 (BoxMind) 라는 폐쇄 루프 AI 전략 최적화 시스템을 통해 격투기 종목의 비구조화된 비디오 데이터를 전술적 지능으로 변환하는 새로운 패러다임을 제시합니다.

Kaiwen Wang, Kaili Zheng, Rongrong Deng, Qingmin Fan, Milin Zhang, Zongrui Li, Xuesi Zhou, Bo Han, Liren Chen, Chenyi Guo, Ji Wu2026-03-10💻 cs

Multifaceted Scenario-Aware Hypergraph Learning for Next POI Recommendation

이 논문은 위치 기반 소셜 네트워크의 다음 방문지 추천 성능을 향상시키기 위해 다양한 상황별 이동 패턴을 포착하고 상황 간 충돌을 해결하는 '다면적 상황 인식 초그래프 학습 (MSAHG)' 프레임워크를 제안합니다.

Yuxi Lin, Yongkang Li, Jie Xing, Zipei Fan2026-03-10💻 cs

DevBench: A Realistic, Developer-Informed Benchmark for Code Generation Models

DevBench 는 실제 개발자 텔레메트리 데이터를 기반으로 6 개 프로그래밍 언어와 6 가지 작업 범주에 걸친 1,800 개의 평가 인스턴스를 포함하여, 기존 벤치마크의 한계를 극복하고 생태학적 타당성과 실용적 유용성을 중시하는 LLM 코드 생성 모델 평가를 위한 새로운 기준을 제시합니다.

Pareesa Ameneh Golnari, Adarsh Kumarappan, Wen Wen, Xiaoyu Liu, Gabriel Ryan, Yuting Sun, Shengyu Fu, Elsie Nallipogu2026-03-10🤖 cs.LG

MAS-Orchestra: Understanding and Improving Multi-Agent Reasoning Through Holistic Orchestration and Controlled Benchmarks

이 논문은 전역적 오케스트레이션을 강화학습 기반으로 구현한 'MAS-Orchestra' 프레임워크와 다중 에이전트 시스템의 효용을 체계적으로 분석하는 'MASBENCH' 벤치마크를 제안하여, 단일 에이전트 대비 다중 에이전트 시스템의 성능 향상을 효율적으로 달성하고 그 작동 원리를 규명합니다.

Zixuan Ke, Yifei Ming, Austin Xu, Ryan Chin, Xuan-Phi Nguyen, Prathyusha Jwalapuram, Jiayu Wang, Semih Yavuz, Caiming Xiong, Shafiq Joty2026-03-10💬 cs.CL

Replayable Financial Agents: A Determinism-Faithfulness Assurance Harness for Tool-Using LLM Agents

이 논문은 금융 서비스용 도구 활용 LLM 에이전트의 규제 감사 재현성을 보장하기 위해 결정론적 일관성과 정확도를 독립적으로 측정하는 '결정론-신뢰성 보장 하네스 (DFAH)' 프레임워크와 관련 벤치마크를 제안하며, 두 지표가 서로 상관관계가 없으므로 모두 독립적으로 평가해야 함을 실증합니다.

Raffi Khatchadourian2026-03-10💬 cs.CL

Continuous-Flow Data-Rate-Aware CNN Inference on FPGA

이 논문은 풀레이어 (fully parallel) 구현 시 발생하는 데이터 감소로 인한 하드웨어 비효율성을 해결하기 위해, CNN 의 데이터 흐름을 분석하여 저속 신호를 인터リーブ하고 하드웨어 유닛을 공유하는 새로운 데이터율 인지 연속 흐름 아키텍처를 제안하여 단일 FPGA 에서 MobileNet 과 같은 복잡한 CNN 을 높은 처리량으로 구현할 수 있음을 보여줍니다.

Tobias Habermann, Michael Mecik, Zhenyu Wang, César David Vera, Martin Kumm, Mario Garrido2026-03-10🤖 cs.LG

MeanCache: From Instantaneous to Average Velocity for Accelerating Flow Matching Inference

이 논문은 기존 캐싱 방법의 한계를 극복하고 Jacobian-벡터 곱을 활용한 평균 속도 관점과 궤적 안정성 스케줄링 전략을 통해 FLUX.1 및 HunyuanVideo 등 다양한 모델에서 고품질 생성을 유지하면서 3.5 배 이상 가속화를 실현하는 훈련 불필요한 MeanCache 프레임워크를 제안합니다.

Huanlin Gao, Ping Chen, Fuyuan Shi, Ruijia Wu, Li YanTao, Qiang Hui, Yuren You, Ting Lu, Chao Tan, Shaoan Zhao, Zhaoxiang Liu, Fang Zhao, Kai Wang, Shiguo Lian2026-03-10🤖 cs.LG

BioAgent Bench: An AI Agent Evaluation Suite for Bioinformatics

이 논문은 RNA 시퀀싱 및 변이 호출 등 생정보학 작업에서 AI 에이전트의 성능과 견고성을 평가하기 위해 설계된 'BioAgent Bench' 벤치마크 데이터셋과 평가 도구를 소개하고, 최첨단 모델이 복잡한 파이프라인을 완수할 수 있지만 교란 조건에서는 실패할 수 있으며 민감한 데이터 처리 시 오픈 가중치 모델이 더 적합할 수 있음을 규명합니다.

Dionizije Fa, Marko Čuljak, Bruno Pandža, Mateo Čupic2026-03-10💻 cs

RedSage: A Cybersecurity Generalist LLM

이 논문은 118 억 토큰 규모의 사이버 보안 데이터와 에이전트 기반 증강 파이프라인을 활용하여 훈련된 오픈소스 사이버 보안 특화 LLM 인 'RedSage'를 제안하고, 이를 통해 사이버 보안 전문성과 일반 추론 능력을 동시에 향상시켰음을 입증합니다.

Naufal Suryanto, Muzammal Naseer, Pengfei Li, Syed Talal Wasim, Jinhui Yi, Juergen Gall, Paolo Ceravolo, Ernesto Damiani2026-03-10💬 cs.CL

Real-Time Aligned Reward Model beyond Semantics

이 논문은 정책 모델의 실시간 분포 변화를 반영하기 위해 사전 훈련된 LLM 의 의미적 표현뿐만 아니라 정책의 진화하는 은닉 상태를 활용하는 새로운 경량 RLHF 프레임워크인 R2M 을 제안하여 보상 과최적화 문제를 해결합니다.

Zixuan Huang, Xin Xia, Yuxi Ren, Jianbin Zheng, Xuefeng Xiao, Hongyan Xie, Li Huaqiu, Songshi Liang, Zhongxiang Dai, Fuzhen Zhuang, Jianxin Li, Yikun Ban, Deqing Wang2026-03-10💻 cs

Bitcoin Price Prediction using Machine Learning and Combinatorial Fusion Analysis

이 논문은 랭크 - 스코어 특성 함수와 인지적 다양성을 활용한 조합 융합 분석 (CFA) 기법을 적용하여 개별 모델 및 기존 비트코인 가격 예측 모델보다 뛰어난 성능 (MAPE 0.19%) 을 달성한 새로운 예측 모델을 제안합니다.

Yuanhong Wu, Wei Ye, Jingyan Xu, D. Frank Hsu2026-03-10🤖 cs.LG

Impact of LLMs news Sentiment Analysis on Stock Price Movement Prediction

이 논문은 DeBERTa, RoBERTa, FinBERT 등 3 가지 LLM 기반 뉴스 감정 분석을 주식 가격 예측에 적용한 비교 평가 연구를 통해 DeBERTa 가 단일 모델로 75% 의 정확도를 보이며, 세 모델을 결합한 앙상블은 80% 까지 정확도를 높이고 감정 정보가 다양한 시계열 모델의 예측 성능을 소폭 향상시킨다는 것을 밝혔습니다.

Walid Siala (SnT, University of Luxembourg, Luxembourg), Ahmed Khanfir (RIADI, ENSI, University of Manouba, Tunisia, SnT, University of Luxembourg, Luxembourg), Mike Papadakis (SnT, University of Luxembourg, Luxembourg)2026-03-10💻 cs

In-Run Data Shapley for Adam Optimizer

본 논문은 SGD 기반의 기존 데이터 기여도 추정 방법이 Adam 최적화 환경에서는 신뢰성이 떨어진다는 점을 지적하고, 선형화된 유령 근사 (Linearized Ghost Approximation) 를 통해 Adam 의 특성을 반영하면서도 기존 학습 속도를 유지하며 높은 정확도로 데이터 기여도를 추정하는 'Adam-Aware In-Run Data Shapley'를 제안합니다.

Meng Ding, Zeqing Zhang, Di Wang, Lijie Hu2026-03-10🤖 cs.LG

Do Schwartz Higher-Order Values Help Sentence-Level Human Value Detection? A Study of Hierarchical Gating and Calibration

이 논문은 Schwartz 의 고차원 가치 범주가 단일 문장 기반 인간 가치 감지 작업에서 경성 계층적 게이트링보다는 인덕티브 바이어스나 보정 및 앙상블 기법과 결합될 때 더 유용함을 보여줍니다.

Víctor Yeste, Paolo Rosso2026-03-10🤖 cs.LG

← 이전 다음 →

cs.AI