本文介绍了一篇由Janet van Niekerk和Håvard Rue撰写的预印本论文,题为《Correcting the Laplace Method with Variational Bayes》。该论文于2021年11月29日发布在arXiv平台上,隶属于King Abdullah University of Science and Technology (KAUST)的CEMSE部门。论文的主要研究领域是贝叶斯推断和统计机器学习,旨在解决在模型复杂或数据量庞大时,精确推断不可行的问题。
贝叶斯方法通过先验信念和数据学习来推导后验信念,广泛应用于小数据集、缺失数据或复杂模型的场景。然而,传统的贝叶斯推断方法,如马尔可夫链蒙特卡罗(MCMC)采样,虽然在上世纪90年代流行,但其计算速度慢且在大数据或复杂模型下收敛困难。因此,近似推断方法如拉普拉斯方法(Laplace Method)和变分贝叶斯(Variational Bayes, VB)等被提出,以近似后验密度。尽管拉普拉斯方法计算效率高,但其准确性较低,尤其是在后验密度复杂时。变分贝叶斯方法虽然计算效率较高,但其假设后验分布的简单分解,忽略了参数空间的后验依赖性。
本文提出了一种混合近似方法,称为低秩变分贝叶斯校正(Low-Rank Variational Bayes Correction, VBC)。该方法首先使用拉普拉斯方法进行初步推断,然后通过变分贝叶斯校正后验均值。具体流程如下:
拉普拉斯方法:拉普拉斯方法通过在函数模式处拟合多元高斯密度来近似积分。在贝叶斯推断中,它通过匹配后验密度的模式及其曲率来找到高斯近似。尽管这种近似在某些情况下不够准确,但其计算效率高,尤其适用于具有稀疏精度矩阵的模型。
变分高斯近似(VGA):变分高斯近似通过最小化变分自由能或最大化证据下界(ELBO)来找到后验密度的高斯近似。本文基于变分贝叶斯框架,提出了一种新的校正方法,通过优化后验均值来提高推断的准确性。
低秩变分贝叶斯校正(VBC):本文提出了一种低秩校正方法,通过显式校正泰勒展开的特定点,并将这些校正的效果传播到整个潜在场的后验均值。该方法通过优化一个低维参数集来实现对后验均值的校正,从而在保持计算效率的同时提高推断的准确性。
本文通过模拟数据和真实数据展示了VBC方法的优势。在小规模和大规模数据集上,VBC方法在计算效率和推断准确性方面均表现出色。具体结果如下:
小规模模拟数据:在低计数泊松回归模型中,VBC方法显著提高了拉普拉斯方法的准确性,且计算时间与拉普拉斯方法相当。
大规模模拟数据:在大规模数据集上,VBC方法在保持计算效率的同时,显著提高了推断的准确性,且计算时间远低于集成嵌套拉普拉斯近似(INLA)和MCMC方法。
真实数据应用:在东京降雨数据和白血病生存数据的应用中,VBC方法在计算效率和推断准确性方面均表现出色,尤其是在大规模数据集上,其计算效率显著优于INLA方法。
本文提出的低秩变分贝叶斯校正方法在保持拉普拉斯方法计算效率的同时,显著提高了推断的准确性。该方法适用于广义线性混合模型等复杂模型,尤其在大规模数据集上表现出色。本文的研究为近似贝叶斯推断领域提供了新的思路,具有重要的科学价值和应用前景。
本文还探讨了未来可能的研究方向,包括对后验分布偏度的校正以及将该方法应用于最大似然估计(MLE)的贝叶斯校正。这些研究方向有望进一步扩展本文方法的适用范围和实用性。
本文提出的低秩变分贝叶斯校正方法为近似贝叶斯推断领域提供了新的工具,具有重要的理论和应用价值。