cs.AI 件の論文 | Gist.Science

Self-Indexing KVCache: Predicting Sparse Attention from Compressed Keys

この論文は、1 ビットの符号ベースベクトル量子化を用いて圧縮キー表現を自己インデックス構造として機能させ、外部インデックスや学習型予測器を不要にすることで、LLM の推論における KV キャッシュのメモリボトルネックを効率的に解決する新しい手法を提案しています。

Xu Yang, Jiapeng Zhang, Dongyang Zhao, Guo Chen, Zhuo Tang2026-03-17🤖 cs.LG

I'm Not Reading All of That: Understanding Software Engineers' Level of Cognitive Engagement with Agentic Coding Assistants

この論文は、自律型コーディング支援ツールの利用に伴うソフトウェアエンジニアの認知的関与の低下を調査し、その設計が検証や意味付けを促す機能に欠けていることを明らかにした上で、より深い思考を維持するための具体的な設計機会を提案しています。

Carlos Rafael Catalan, Lheane Marie Dizon, Patricia Nicole Monderin + 1 more2026-03-17🤖 cs.AI

Agentic DAG-Orchestrated Planner Framework for Multi-Modal, Multi-Hop Question Answering in Hybrid Data Lakes

本論文は、構造化データと非構造化ドキュメントを融合したハイブリッドデータレイクにおける自然言語質問応答の課題を解決するため、クエリを有向非巡回グラフ（DAG）実行計画に変換し、マルチホップ推論と並列処理を可能にする「A.DOT Planner」というエージェント型フレームワークを提案し、その有効性を示したものである。

Kirushikesh D B, Manish Kesarwani, Nishtha Madaan, Sameep Mehta, Aldrin Dennis, Siddarth Ajay, Rakesh B R, Renu Rajagopal, Sudheesh Kairali2026-03-17🤖 cs.AI

QiMeng-CodeV-SVA: Training Specialized LLMs for Hardware Assertion Generation via RTL-Grounded Bidirectional Data Synthesis

この論文は、大規模なオープンソース RTL を活用した RTL 接地の双方向データ合成フレームワークを提案し、これにより生成されたデータで学習させた専用モデル「CodeV-SVA」が、自然言語からハードウェアアサーション（SVA）を生成するタスクにおいて、GPT-5 や DeepSeek-R1 などの最先端モデルと同等かそれ以上の性能を達成したことを報告しています。

Yutong Wu, Chenrui Cao, Pengwei Jin, Di Huang, Rui Zhang, Xishan Zhang, Zidong Du, Qi Guo, Xing Hu2026-03-17💬 cs.CL

← 前へ次へ →

cs.AI

Self-Indexing KVCache: Predicting Sparse Attention from Compressed Keys

I'm Not Reading All of That: Understanding Software Engineers' Level of Cognitive Engagement with Agentic Coding Assistants

Agentic DAG-Orchestrated Planner Framework for Multi-Modal, Multi-Hop Question Answering in Hybrid Data Lakes

QiMeng-CodeV-SVA: Training Specialized LLMs for Hardware Assertion Generation via RTL-Grounded Bidirectional Data Synthesis

GoldenStart: Q-Guided Priors and Entropy Control for Distilling Flow Policies

Why Do LLM-based Web Agents Fail? A Hierarchical Planning Perspective

Mitigating Overthinking in Large Reasoning Language Models via Reasoning Path Deviation Monitoring

Bringing Model Editing to Generative Recommendation in Cold-Start Scenarios

Controllable Accent Normalization via Discrete Diffusion

All-day Multi-scenes Lifelong Vision-and-Language Navigation with Tucker Adaptation

AEX: Non-Intrusive Multi-Hop Attestation and Provenance for LLM APIs

High-Fidelity Compression of Seismic Velocity Models via SIREN Auto-Decoders

Seeking Physics in Diffusion Noise

4D Synchronized Fields: Motion-Language Gaussian Splatting for Temporal Scene Understanding

Autonomous Agents Coordinating Distributed Discovery Through Emergent Artifact Exchange

How Do Medical MLLMs Fail? A Study on Visual Grounding in Medical Images

ECG-Reasoning-Benchmark: A Benchmark for Evaluating Clinical Reasoning Capabilities in ECG Interpretation

AgroNVILA: Perception-Reasoning Decoupling for Multi-view Agricultural Multimodal Large Language Models

Deconfounded Lifelong Learning for Autonomous Driving via Dynamic Knowledge Spaces

M $^2$ RNN: Non-Linear RNNs with Matrix-Valued States for Scalable Language Modeling

cs.AI

Self-Indexing KVCache: Predicting Sparse Attention from Compressed Keys

I'm Not Reading All of That: Understanding Software Engineers' Level of Cognitive Engagement with Agentic Coding Assistants

Agentic DAG-Orchestrated Planner Framework for Multi-Modal, Multi-Hop Question Answering in Hybrid Data Lakes

QiMeng-CodeV-SVA: Training Specialized LLMs for Hardware Assertion Generation via RTL-Grounded Bidirectional Data Synthesis

GoldenStart: Q-Guided Priors and Entropy Control for Distilling Flow Policies

Why Do LLM-based Web Agents Fail? A Hierarchical Planning Perspective

Mitigating Overthinking in Large Reasoning Language Models via Reasoning Path Deviation Monitoring

Bringing Model Editing to Generative Recommendation in Cold-Start Scenarios

Controllable Accent Normalization via Discrete Diffusion

All-day Multi-scenes Lifelong Vision-and-Language Navigation with Tucker Adaptation

AEX: Non-Intrusive Multi-Hop Attestation and Provenance for LLM APIs

High-Fidelity Compression of Seismic Velocity Models via SIREN Auto-Decoders

Seeking Physics in Diffusion Noise

4D Synchronized Fields: Motion-Language Gaussian Splatting for Temporal Scene Understanding

Autonomous Agents Coordinating Distributed Discovery Through Emergent Artifact Exchange

How Do Medical MLLMs Fail? A Study on Visual Grounding in Medical Images

ECG-Reasoning-Benchmark: A Benchmark for Evaluating Clinical Reasoning Capabilities in ECG Interpretation

AgroNVILA: Perception-Reasoning Decoupling for Multi-view Agricultural Multimodal Large Language Models

Deconfounded Lifelong Learning for Autonomous Driving via Dynamic Knowledge Spaces

M2^22RNN: Non-Linear RNNs with Matrix-Valued States for Scalable Language Modeling

M $^2$ RNN: Non-Linear RNNs with Matrix-Valued States for Scalable Language Modeling