从生物网络中学习蛋白质知识预测药物靶标亲和力

##基于生物网络学习蛋白质知识来预测药物-靶点亲和力 背景介绍 药物-靶点亲和力(drug-target affinity, DTA)预测在药物发现环节中占据重要地位。高效且准确的DTA预测可以显著缩短新药开发的时间和经济成本。近年来,深度学习技术的爆炸性发展为DTA预测提供了强大的支持。现有的DTA预测方法主要分为基于1D蛋白质序列和基于2D蛋白质结构图的方法。然而,这些方法仅关注靶蛋白的内在特性,忽略了过往研究中明确揭示的蛋白质交互的广泛先验知识。 针对上述问题,本文提出了一种名为MSF-DTA(基于多源特征融合的药物-靶点亲和力)的端到端DTA预测方法。MSF-DTA通过利用邻接蛋白的信息,增强蛋白质的表示,并使用高级图预训练框架VG-AE(变分图自动编码器)来学习这些表示,使得预测结...

基于知识图谱的可解释和个性化认知推理模型--助力全科医学决策

基于知识图谱的可解释和个性化认知推理模型--助力全科医学决策

面向全科诊断决策的基于知识图谱的可解释个性化认知推理模型 背景介绍 全科医学作为社区和家庭医疗的重要组成部分,覆盖了不同年龄、性别、器官系统及各类疾病。其核心理念是以人为中心、以家庭为单位,强调长期负责的综合健康维护和促进。然而,现有证据显示,中国的初级卫生保健(Primary Health Care, PHC)质量仍未达到令人满意的水平。在临床诊断和治疗准确性方面存在着显著需要提升的空间。为了应对这一问题,基于人工智能的决策工具逐渐成为全科医生诊断疾病的有力辅助。然而,现有的研究主要存在两个问题:一是缺乏足够的可扩展性和解释能力;二是现有模型大多操作复杂,难以适用于实际的全科医疗环境。 论文来源 这篇名为《An Explainable and Personalized Cognitive ...

基于知识增强图主题Transformer的可解释生物医学文本摘要

基于知识增强的图主题Transformer在可解释生物医学文本摘要中的应用 研究背景 由于生物医学文献发表量持续增加,自动生物医学文本摘要任务变得愈加重要。2021年,仅在PubMed数据库中就发表了1,767,637篇文章。现有的基于预训练语言模型(Pre-trained Language Models,简称PLMs)的摘要方法虽然提升了摘要性能,但在捕捉领域特定知识和结果可解释性方面存在显著局限。这可能导致生成的摘要缺乏连贯性,包括冗余句子或重要领域知识的遗漏。此外,变压器模型的黑箱特性使得用户难以理解摘要生成的原因和方式,因此在生物医学文本摘要中,包含领域特定知识和可解释性对提高准确性和透明度至关重要。 研究来源 本文的论文由Qianqian Xie、Prayag Tiwari(IEE...

结合多重先验知识的图神经网络用于多组学数据分析

结合多重先验知识的图神经网络用于多组学数据分析

医学多组学数据分析中的多重先验知识图神经网络 背景介绍 精确医学是未来医疗保健的重要领域,因为它为患者提供个性化的治疗方案,从而改善治疗效果并降低成本。例如,由于乳腺癌患者存在复杂的临床、病理和分子特征,相同的治疗可能表现出不同的效果。随着生物医学技术的高速发展,疾病的表征可以通过多组学数据来实现。多组学方法相较单组学方法能够在多个数据间捕捉一致和互补的信息,从而建立更加准确和深入的模型。例如,癌症基因组图谱(The Cancer Genome Atlas, TCGA)提供了包括mRNA表达、DNA甲基化和拷贝数变异(Copy Number Variation, CNV)在内的多组学数据。因此,在精确医学的各类任务中引入多组学数据变得必要,这些任务包括药物反应预测、基因发现和生存分析等。 作...

阶段感知分层注意力关系网络用于诊断预测

分层注意力关系网络在诊断预测中的应用 近年来,电子健康记录(Electronic Health Records,简称EHR)在提高医疗决策、在线疾病检测和监测方面变得极为有价值。同时,基于深度学习的方法在利用EHR进行健康风险预测和诊断预测方面也取得了巨大的成功。然而,深度学习模型通常需要大量的数据,由于参数的庞大数量。此外,EHR数据中存在大量罕见的医学代码,这对临床应用带来了巨大的挑战。因此,一些研究提出采用医学本体来增强预测性能并提供可解释的预测结果。然而,这些医学本体通常规模较小且粒度较粗,缺乏许多诊断和医学概念,更不用说这些概念之间的各种关系了。 为了克服这一限制,本文提出将现有的大规模医学知识图谱(Knowledge Graph,简称KG)结合到诊断预测中,并设计了一种名为HAR...

时间聚合与传播图神经网络用于动态表示

动态图表示的时间聚合和传播图神经网络 背景介绍 动态图(temporal graph)是一种在连续时间内节点间具有动态交互的图结构,图的拓扑结构随时间的推移不断演变。这种动态变化让节点在不同时刻展现出变化的偏好,这对捕捉用户偏好和检测异常行为非常关键。然而,现有的研究通常采用有限邻居生成动态表示,这不仅降低了性能,还引发了高延迟的在线推断问题。为了应对这些挑战,本文提出了一种全新的时间图卷积方法,即时间聚合和传播图神经网络(Temporal Aggregation and Propagation Graph Neural Networks,简称TAP-GNN)。该方法通过展开时间图以消息传递的姿态分析了动态表示问题的计算复杂度,并设计了一个聚合和传播模块(AP block),有效减少了历史邻...

AutoAlign: 由大型语言模型驱动的全自动知识图谱对齐

AutoAlign:由大规模语言模型驱动的全自动、高效知识图谱对齐方法 知识图谱(Knowledge Graph,简称KG)已经被广泛应用于问答系统、对话系统和推荐系统等多个领域。然而,不同的知识图谱中可能存在同一现实实体以不同形式存储的问题,这导致知识共同体和信息互补非常困难,尤其在实际应用中,这些知识图谱的合并是一项核心任务。这涉及实体对齐(Entity Alignment),即识别不同知识图谱中代表相同实体的实体对。然而,现有方法通常需要手工制作的种子对齐(Seed Alignments),其获取成本高、可移植性差,并且人工干预可能引入偏差,影响对齐效果。 为了应对上述挑战,来自Tsinghua University、University of Melbourne、Universita...

基于知识图谱的社交增强可解释推荐

基于知识图谱的社交增强可解释推荐系统 引言 随着互联网世界信息量的不断增加,用户和商品的相关信息也迅速扩展,导致信息过载问题日益严重。推荐系统通过为用户推荐少量符合其偏好的商品,能够有效缓解这一问题,不仅能帮助用户迅速获取感兴趣的内容,还能帮助企业实现精准营销,提升客户忠诚度。在电子商务、社交媒体和搜索引擎等多种平台上,推荐系统扮演着越来越重要的角色。 推荐系统的性能高度依赖于推荐技术。早期的协同过滤(Collaborative Filtering, CF)方法通过推荐与用户曾经互动过的物品相似的其他物品来实现推荐。然而,当用户与物品之间的互动稀疏时,CF方法效果不佳。为了解决这一限制,各种辅助信息如物品属性、用户信息和上下文被整合到模型中。尤其是,当侧信息被转化为特征向量并与用户和物品ID...

知识增强图神经网络用于可解释性推荐

知识增强图神经网络用于可解释性推荐

知识增强图神经网络用于可解释推荐 导言 随着线上信息爆炸式的增长,推荐系统在解决信息超载问题方面发挥着重要作用。传统推荐系统通常依赖协同过滤(Collaborative Filtering,简称CF)方法,这些方法依据用户的历史记录生成推荐。CF方法主要分为记忆型和模型型技术。记忆型方法包括基于用户和基于项目的CF,而模型型方法通过学习模型,例如矩阵分解来进行推荐。近年来,深度学习技术在信息检索和推荐系统研究中展现出了极高的有效性。许多基于深度学习的推荐方法取得了高推荐性能。然而,尽管这些方法在推荐准确性上表现出色,它们缺乏决策过程的可解释性和透明性。为了提升推荐系统的透明性和用户满意度,解释性推荐的研究逐渐受到关注。解释性推荐不仅使推荐更加透明和可解释,还提升了系统的可信度和用户满意度。 ...

面向遗忘-鲁棒知识追踪的深度图记忆网络

面向遗忘-鲁棒知识追踪的深度图记忆网络

面向遗忘-鲁棒知识追踪的深度图记忆网络 近年来,知识追踪(KT)作为个性化学习的重要方法吸引了广泛关注。知识追踪旨在预测学生回答新问题时的正确率,利用他们过往问题的回答历史来估计其知识状态。然而,当前的知识追踪方法仍面临一些挑战,包括对遗忘行为的建模和潜在概念之间关系的识别。为了解决这些问题,本文提出了一种全新的知识追踪模型,即深度图记忆网络(Deep Graph Memory Network, DGMN)。本文具体概述了DGMN模型的设计、实验过程及其在各类数据集上的表现。 研究背景 知识追踪问题自提出以来,一直是教育领域的一个重要研究方向。其核心目标是通过学生的历史回答数据,预测其未来回答问题的正确概率。早期的知识追踪方法主要包括基于贝叶斯方法和状态空间模型的方法,例如隐马尔可夫模型(H...