PathoScribe: Transforming Pathology Data into a Living Library with a Unified LLM-Driven Framework for Semantic Retrieval and Clinical Integration
本文提出了 PathoScribe 框架,通过统一的检索增强大语言模型技术,将静态的病理报告档案转化为支持自然语言检索、自动队列构建及临床推理的“活体图书馆”,显著提升了病理数据的检索效率与临床决策价值。
16 篇论文
本文提出了 PathoScribe 框架,通过统一的检索增强大语言模型技术,将静态的病理报告档案转化为支持自然语言检索、自动队列构建及临床推理的“活体图书馆”,显著提升了病理数据的检索效率与临床决策价值。
本研究利用人工智能辅助技术,构建了涵盖 2005 至 2026 年社会社会工作与研究学会(SSWR)会议近 2.4 万篇摘要的数据库,揭示了该领域在作者协作、国际参与度及研究方法(以定量为主)等方面的显著演变趋势。
该论文通过案例研究展示了如何利用本地部署的 AI 模型分析四万余份招聘数据,从而为社会工作硕士(MSW)项目提供基于劳动力市场需求的课程规划情报,并强调了将数据洞察与利益相关者的情境知识相结合的重要性。
该论文提出了一种名为“变量替换”的领域特定图增强技术,旨在解决通用增强方法在数学公式检索中破坏语义结构的问题,实验表明该方法能显著提升基于图对比学习的检索性能。
该研究通过大规模文本分析比较了欧盟框架计划与美国国立卫生研究院的资助演变,发现欧盟资助显著转向人口与卫生系统导向的研究,而美国资助及欧盟基础研究项目则保持相对稳定,表明资助优先级的转变在科研产出中的转化程度有限。
本文介绍了一种基于人机交互设计、利用大语言模型函数调用能力与交互式地图相结合的自然语言对话系统,旨在通过实时查询澳大利亚博物馆约 170 万条数字化标本记录,解决大规模自然历史馆藏数据因规模复杂而难以被公众访问和理解的难题。
本文发布了一个包含英语和德语编目记录及机器可读 GND 本体的大型双语数据集,旨在通过支持本体感知的多标签分类和可复现的评估,推动权威锚定的人工智能在数字图书馆编目中的实际应用。
该论文介绍了利用 ChatGPT 等大型语言模型对科学文献中的引用进行情感分析,以揭示引用背后的细微态度并识别潜在偏见与利益冲突,从而提升学术评估的客观性与可靠性。
该博士论文旨在通过引入人工智能辅助工作流、知识图谱数字图书馆及利益相关者驱动接口等技术手段,解决科学传播与航空航天工程领域因数据异构、支持缺失及法律障碍而导致的知识基础设施碎片化问题,并强调未来需进一步突破社会与法律壁垒以全面促进跨领域知识网络的构建。
该研究提出了一种整合框架,通过将谱系重构嵌入与横截面检测相同的加权关系架构中,解决了现有纵向科学映射中主题检测与时间连接建模之间的结构性不一致问题,从而将科学演进概念化为关系结构的重组而非简单的词汇延续。
该研究通过分析海量资助与论文数据揭示了一个悖论:尽管跨学科资助旨在推动跨学科研究,但真正产生高影响力的跨学科成果往往更多源自深度学科资助,这表明跨学科创新离不开深厚的学科专长与投入。
该研究分析了加拿大科学出版(CSP)旗下 24 种期刊在 2010 至 2021 年间发表的 6.7 万余篇文章,发现女性作者占比不足三分之一且多处于非领导性署名位置,表明性别差异主要源于科研 workforce 的结构性失衡而非出版偏见,因此呼吁采取双重措施以消除系统性障碍并改革出版实践。
该研究基于 Web of Science 数据库对 2014 至 2023 年禽流感文献进行科学计量分析,揭示了全球发文量稳步增长、中美机构主导产出、核心期刊影响力显著以及国际合作日益紧密的研究格局。
本文提出了 SWARM-SLR AIssistant 统一框架,通过结合结构化方法论、基于代理的助手及集中式工具注册表,旨在解决系统性文献综述(SLR)自动化中的可扩展性与易用性挑战。
该研究提出了一种基于 Wikibase 构建的"Aerospace.Wikibase"平台,旨在通过提供包含 700 多个术语的开放知识基础设施,解决航空航天工程领域知识管理碎片化及数据冗余问题,从而促进跨项目的协作与可持续创新。
该研究发布了一套涵盖2001至2025年美国联邦及州级法医DNA数据库的标准化数据集,整合了全国索引系统(NDIS)的时间序列统计、各州采集政策元数据以及人口统计信息,为深入分析美国法医DNA系统的历史演变、规模增长及政策差异提供了基础资源。