Multi-view biclustering via non-negative matrix tri-factorisation
该论文提出了一种名为 ResNMTF 的新型多视图双聚类方法,基于非负矩阵三分解技术,能够在无需预设簇数量的情况下识别重叠且非完备的双聚类,并扩展了轮廓系数为“双轮廓系数”以辅助超参数调优与可视化。
259 篇论文
该论文提出了一种名为 ResNMTF 的新型多视图双聚类方法,基于非负矩阵三分解技术,能够在无需预设簇数量的情况下识别重叠且非完备的双聚类,并扩展了轮廓系数为“双轮廓系数”以辅助超参数调优与可视化。
该论文针对多中心随机试验中忽略中心聚类效应可能导致估计偏差和置信区间覆盖率下降的问题,提出了一种结合半参数高效估计与随机效应元分析思想的稳健协变量调整框架,通过纳入中心效应显著提升了反事实均值和平均处理效应的估计效率与推断准确性。
本文提出了一种非参数加权随机点积图(WRDPG)模型,该模型通过节点潜在位置的内积来刻画边权分布的各阶矩(而不仅限于均值),并推导了基于邻接谱嵌入的估计量的一致性与渐近正态性,同时构建了支持加权图生成与统计推断的完整框架。
本文通过研究控制流匹配向量场利普希茨常数依赖性的假设,推导出了在高维设置下优于以往结果且无需对数凹性条件的估计分布与目标分布间 Wasserstein 1 距离的收敛速率。
本文提出了一种区分“运营容量”与“极限容量”的框架,通过排队论和微分方程模型对多模态港口系统(以休斯顿港为例)进行容量估算,揭示了不同资源在稳定运行与扰动恢复情境下的瓶颈差异,从而为港口规划与韧性分析提供方法支持。
本文研究了 Wasserstein 空间中 Busemann 函数的存在性与计算,推导了一维分布和高斯测度下的闭式解,并据此提出了针对高斯混合模型及标注数据集的新型切片 Wasserstein 距离方案,在合成数据与迁移学习任务中验证了其高效性。
该论文提出了“裁判式学习”新范式,通过引入两个相互竞争的证明者(仅一人为诚实),使学习器仅需极少次对真实函数的查询和通信成本,即可在极高精度下选出优于单证明者方案的黑盒模型。
该论文从贝叶斯视角出发,提出了一种统一框架,将提示词(上下文学习)和激活干预解释为分别通过证据累积和先验改变来调整模型对潜在概念的信念,从而成功预测并解释了大语言模型在多种干预下的行为动态。
本文针对累积概率回归模型在大数据场景下贝叶斯推断计算效率低的问题,提出了三种基于变分贝叶斯和期望传播的可扩展近似算法,并通过模拟与犯罪网络案例研究证明了其在保持高精度的同时显著优于传统马尔可夫链蒙特卡洛方法的计算性能。
该论文提出了一种基于树集成和分布回归的自动机器学习框架,将冲突预测从传统的点估计转变为概率分布估计,从而有效量化了暴力冲突预测中的不确定性,并验证了其在 PRIO-GRID 月度数据上优于历史基准的预测性能。
该论文通过揭示优化动力学中曲率变化与噪声相互作用所产生的熵垒,解释了为何过参数化神经网络的损失景观中虽存在低损耗连通路径,但优化过程却倾向于局域化在单一凸盆地内的悖论。
本文系统评估了 GPT 和 Gemini 等大语言模型在构建二水平部分因子设计方面的能力,结果表明这些模型能够有效生成多达 8 个因子的 8、16 和 32 次试验的最优设计。
本文提出了一种结合贝叶斯后验分布的两阶段方法,通过将第一阶段模型估计的不确定性纳入第二阶段亚组治疗效应推断,解决了数据驱动亚组分析中常忽视估计不确定性的问题,从而在模拟和新冠临床试验中实现了更准确的置信区间校准。
该论文通过一种利用高斯随机几何图中特征函数级数近似所产生抵消效应的新型傅里叶分析框架,确定了在部分边被随机掩码遮挡的噪声观测下,二分潜在空间图几何结构可检测性的紧信息论阈值,证明了已知掩码时检测问题显著更易,并消除了计算与统计之间的差距。
该论文填补了现有高维拉普拉斯渐近展开在“高斯近似”阈值与“集中”阈值之间区域的理论空白,推导出了适用于任意接近集中阈值的显式渐近展开式及其定量余项界,并据此构建了用于计算期望值和采样的高效解析近似与多项式传输方法。
该论文提出了一种名为“随机克里金信徒”(Randomized Kriging Believer)的并行贝叶斯优化方法,该方法在保持低计算复杂度、实现简单及适用于异步并行等优势的同时,实现了贝叶斯期望后悔值的理论保证,并通过实验验证了其在合成、基准及真实数据上的有效性。
该论文研究了平衡二块随机块模型中基于 Lin-Lu-Yau Ricci 曲率的边重加权方法,证明了在中等密度下曲率的均匀集中性,表明单次重加权即可放大块内连接并提升谱聚类的特征间隙,同时给出了有限步迭代重加权过程与确定性递归的均匀跟踪理论,为社区检测提供了基于曲率流的有限时域解释。
该论文指出传统基于状态伪随机数生成器的“公共随机数”方法因执行路径依赖导致因果结构不连贯,并提出结合基于计数器的随机数生成器与事件标识符的解决方案,以通过事件索引恢复随机数生成的因果一致性。
该论文提出了一种基于划分的函数型岭回归框架,通过将系数函数分解为不同分量并实施差异化惩罚,有效解决了高维函数型线性模型中的多重共线性与过拟合问题,在提升数值稳定性与可解释性的同时实现了偏差与方差的最优权衡。
本文提出了 Co-Diffusion 框架,通过两阶段亲和性感知潜在扩散机制,有效解决了现有深度模型在冷启动场景下的表示崩溃问题,显著提升了药物 - 靶点亲和力预测在未见分子骨架和新蛋白家族上的泛化能力。