cs.CL 편의 논문 | Gist.Science

COMI: Coarse-to-fine Context Compression via Marginal Information Gain

이 논문은 대규모 언어 모델의 긴 문맥 처리 효율성을 높이기 위해, 관련성과 중복성을 동시에 고려한 '주변 정보 이득 (MIG)' 지표를 기반으로 coarse-to-fine 방식으로 문맥을 압축하는 COMI 프레임워크를 제안하고 다양한 작업에서 기존 기법보다 뛰어난 성능을 입증합니다.

Jiwei Tang, Shilei Liu, Zhicheng Zhang, Yujin Yuan, Libin Zheng, Wenbo Su, Bo Zheng2026-03-09💬 cs.CL

Accelerating Scientific Research with Gemini: Case Studies and Common Techniques

본 논문은 구글의 제미니 (Gemini) 기반 모델을 활용하여 이론 컴퓨터 과학 및 물리학 등 다양한 분야에서 새로운 증명과 반례를 발견한 사례 연구와 반복적 정제, 문제 분해, 신경-상징적 루프 등 효과적인 인간-AI 협력 기법을 제시함으로써, 인공지능이 단순 자동화 도구를 넘어 과학적 발견의 진정한 파트너로 역할을 할 수 있음을 보여줍니다.

David P. Woodruff, Vincent Cohen-Addad, Lalit Jain, Jieming Mao, Song Zuo, MohammadHossein Bateni, Simina Branzei, Michael P. Brenner, Lin Chen, Ying Feng, Lance Fortnow, Gang Fu, Ziyi Guan, Zahra Hadizadeh, Mohammad T. Hajiaghayi, Mahdi JafariRaviz, Adel Javanmard, Karthik C. S., Ken-ichi Kawarabayashi, Ravi Kumar, Silvio Lattanzi, Euiwoong Lee, Yi Li, Ioannis Panageas, Dimitris Paparas, Benjamin Przybocki, Bernardo Subercaseaux, Ola Svensson, Shayan Taherijam, Xuan Wu, Eylon Yogev, Morteza Zadimoghaddam, Samson Zhou, Yossi Matias, James Manyika, Vahab Mirrokni2026-03-09🤖 cs.AI

Towards Autonomous Mathematics Research

이 논문은 자연어 기반의 반복적 생성·검증·수정 과정을 통해 수학 연구 전 과정을 자율적으로 수행하는 에이전트 'Aletheia'를 소개하고, 이를 통해 무인 자동 생성 논문, 인간-AI 협업 증명, 그리고 오픈 문제 해결 등 AI 와 수학 연구의 새로운 지평을 열었음을 보여줍니다.

Tony Feng, Trieu H. Trinh, Garrett Bingham, Dawsen Hwang, Yuri Chervonyi, Junehyuk Jung, Joonkyung Lee, Carlo Pagano, Sang-hyun Kim, Federico Pasqualotto, Sergei Gukov, Jonathan N. Lee, Junsu Kim, Kaiying Hou, Golnaz Ghiasi, Yi Tay, YaGuang Li, Chenkai Kuang, Yuan Liu, Hanzhao Lin, Evan Zheran Liu, Nigamaa Nayakanti, Xiaomeng Yang, Heng-Tze Cheng, Demis Hassabis, Koray Kavukcuoglu, Quoc V. Le, Thang Luong2026-03-09🤖 cs.AI

← 이전 다음 →

cs.CL

COMI: Coarse-to-fine Context Compression via Marginal Information Gain

Accelerating Scientific Research with Gemini: Case Studies and Common Techniques

Towards Autonomous Mathematics Research

DataChef: Cooking Up Optimal Data Recipes for LLM Adaptation via Reinforcement Learning

The Consensus Trap: Dissecting Subjectivity and the "Ground Truth" Illusion in Data Annotation

IntelliAsk: Learning to Ask High-Quality Research Questions via RLVR

Diverse Word Choices, Same Reference: Annotating Lexically-Rich Cross-Document Coreference

The Cascade Equivalence Hypothesis: When Do Speech LLMs Behave Like ASR $\rightarrow$ LLM Pipelines?

Both Ends Count! Just How Good are LLM Agents at "Text-to-Big SQL"?

Modality Collapse as Mismatched Decoding: Information-Theoretic Limits of Multimodal LLMs

CoME: Empowering Channel-of-Mobile-Experts with Informative Hybrid-Capabilities Reasoning

Verify as You Go: An LLM-Powered Browser Extension for Fake News Detection

Omni-C: Compressing Heterogeneous Modalities into a Single Dense Encoder

Attention Meets Reachability: Structural Equivalence and Efficiency in Grammar-Constrained LLM Decoding

EigenData: A Self-Evolving Multi-Agent Platform for Function-Calling Data Synthesis, Auditing, and Repair

Aligning the True Semantics: Constrained Decoupling and Distribution Sampling for Cross-Modal Alignment

CBR-to-SQL: Rethinking Retrieval-based Text-to-SQL using Case-based Reasoning in the Healthcare Domain

NOTAI.AI: Explainable Detection of Machine-Generated Text via Curvature and Feature Attribution

Safer Reasoning Traces: Measuring and Mitigating Chain-of-Thought Leakage in LLMs

RACAS: Controlling Diverse Robots With a Single Agentic System

cs.CL

COMI: Coarse-to-fine Context Compression via Marginal Information Gain

Accelerating Scientific Research with Gemini: Case Studies and Common Techniques

Towards Autonomous Mathematics Research

DataChef: Cooking Up Optimal Data Recipes for LLM Adaptation via Reinforcement Learning

The Consensus Trap: Dissecting Subjectivity and the "Ground Truth" Illusion in Data Annotation

IntelliAsk: Learning to Ask High-Quality Research Questions via RLVR

Diverse Word Choices, Same Reference: Annotating Lexically-Rich Cross-Document Coreference

The Cascade Equivalence Hypothesis: When Do Speech LLMs Behave Like ASR→\rightarrow→LLM Pipelines?

Both Ends Count! Just How Good are LLM Agents at "Text-to-Big SQL"?

Modality Collapse as Mismatched Decoding: Information-Theoretic Limits of Multimodal LLMs

CoME: Empowering Channel-of-Mobile-Experts with Informative Hybrid-Capabilities Reasoning

Verify as You Go: An LLM-Powered Browser Extension for Fake News Detection

Omni-C: Compressing Heterogeneous Modalities into a Single Dense Encoder

Attention Meets Reachability: Structural Equivalence and Efficiency in Grammar-Constrained LLM Decoding

EigenData: A Self-Evolving Multi-Agent Platform for Function-Calling Data Synthesis, Auditing, and Repair

Aligning the True Semantics: Constrained Decoupling and Distribution Sampling for Cross-Modal Alignment

CBR-to-SQL: Rethinking Retrieval-based Text-to-SQL using Case-based Reasoning in the Healthcare Domain

NOTAI.AI: Explainable Detection of Machine-Generated Text via Curvature and Feature Attribution

Safer Reasoning Traces: Measuring and Mitigating Chain-of-Thought Leakage in LLMs

RACAS: Controlling Diverse Robots With a Single Agentic System

The Cascade Equivalence Hypothesis: When Do Speech LLMs Behave Like ASR $\rightarrow$ LLM Pipelines?