基于知识图谱推荐的生物医学关系提取

医学关系抽取与知识图谱推荐结合的研究报告 背景介绍 在医学领域,文献的爆炸式增长使得研究人员难以及时跟踪各自领域内的最新进展。从自然语言处理(NLP)领域来看,不断发展的自动化工具能够帮助识别和提取非结构化文本中的相关信息,这一任务被称为关系抽取(Relation Extraction,RE)。RE的主要目标是从文本中提取和分类医学实体之间的关系,增强我们对生物医学过程的理解。 目前,大多数尖端的医学RE系统使用深度学习方法,主要针对同类型实体间的关系,如基因和药物等实体。然而,这些系统大多仅限于从文本直接提取的信息,忽略了专门领域的知识库,如本体论(Ontology),这些本体论通常结构化为有向无环图(Directed Acyclic Graphs,DAG)。 另一方面,基于知识图谱(Kn...

双层交互感知的异构图神经网络用于药物包推荐

医学包推荐系统研究:基于双层次交互意识的异构图神经网络 随着电子健康记录(electronic health records, EHRs)在医疗领域中的广泛应用,如何从中挖掘潜在的、有价值的医学知识来支持临床决策,成为深度学习技术的重要研究方向之一。个性化医学包推荐是这一领域的重要任务之一,其目标是利用大量医疗记录帮助医生为每位患者选择更安全、有效的药物包。然而,现有的医学包推荐方法主要将任务建模为多标签分类或序列生成问题,主要关注的是个体药物与其他医学实体之间的关系,却普遍忽视了药物包与其他医学实体之间的交互,从而可能导致推荐的药物包不完整。此外,现有方法所考虑的医学常识知识相对有限,使得深入研究医生的决策过程变得非常困难。 来源概述 本文由山东大学软件学院的研究人员Fanglin Zhu...

从生物网络中学习蛋白质知识预测药物靶标亲和力

##基于生物网络学习蛋白质知识来预测药物-靶点亲和力 背景介绍 药物-靶点亲和力(drug-target affinity, DTA)预测在药物发现环节中占据重要地位。高效且准确的DTA预测可以显著缩短新药开发的时间和经济成本。近年来,深度学习技术的爆炸性发展为DTA预测提供了强大的支持。现有的DTA预测方法主要分为基于1D蛋白质序列和基于2D蛋白质结构图的方法。然而,这些方法仅关注靶蛋白的内在特性,忽略了过往研究中明确揭示的蛋白质交互的广泛先验知识。 针对上述问题,本文提出了一种名为MSF-DTA(基于多源特征融合的药物-靶点亲和力)的端到端DTA预测方法。MSF-DTA通过利用邻接蛋白的信息,增强蛋白质的表示,并使用高级图预训练框架VG-AE(变分图自动编码器)来学习这些表示,使得预测结...

基于知识图谱的可解释和个性化认知推理模型--助力全科医学决策

基于知识图谱的可解释和个性化认知推理模型--助力全科医学决策

面向全科诊断决策的基于知识图谱的可解释个性化认知推理模型 背景介绍 全科医学作为社区和家庭医疗的重要组成部分,覆盖了不同年龄、性别、器官系统及各类疾病。其核心理念是以人为中心、以家庭为单位,强调长期负责的综合健康维护和促进。然而,现有证据显示,中国的初级卫生保健(Primary Health Care, PHC)质量仍未达到令人满意的水平。在临床诊断和治疗准确性方面存在着显著需要提升的空间。为了应对这一问题,基于人工智能的决策工具逐渐成为全科医生诊断疾病的有力辅助。然而,现有的研究主要存在两个问题:一是缺乏足够的可扩展性和解释能力;二是现有模型大多操作复杂,难以适用于实际的全科医疗环境。 论文来源 这篇名为《An Explainable and Personalized Cognitive ...

基于知识增强图主题Transformer的可解释生物医学文本摘要

基于知识增强的图主题Transformer在可解释生物医学文本摘要中的应用 研究背景 由于生物医学文献发表量持续增加,自动生物医学文本摘要任务变得愈加重要。2021年,仅在PubMed数据库中就发表了1,767,637篇文章。现有的基于预训练语言模型(Pre-trained Language Models,简称PLMs)的摘要方法虽然提升了摘要性能,但在捕捉领域特定知识和结果可解释性方面存在显著局限。这可能导致生成的摘要缺乏连贯性,包括冗余句子或重要领域知识的遗漏。此外,变压器模型的黑箱特性使得用户难以理解摘要生成的原因和方式,因此在生物医学文本摘要中,包含领域特定知识和可解释性对提高准确性和透明度至关重要。 研究来源 本文的论文由Qianqian Xie、Prayag Tiwari(IEE...

结合多重先验知识的图神经网络用于多组学数据分析

结合多重先验知识的图神经网络用于多组学数据分析

医学多组学数据分析中的多重先验知识图神经网络 背景介绍 精确医学是未来医疗保健的重要领域,因为它为患者提供个性化的治疗方案,从而改善治疗效果并降低成本。例如,由于乳腺癌患者存在复杂的临床、病理和分子特征,相同的治疗可能表现出不同的效果。随着生物医学技术的高速发展,疾病的表征可以通过多组学数据来实现。多组学方法相较单组学方法能够在多个数据间捕捉一致和互补的信息,从而建立更加准确和深入的模型。例如,癌症基因组图谱(The Cancer Genome Atlas, TCGA)提供了包括mRNA表达、DNA甲基化和拷贝数变异(Copy Number Variation, CNV)在内的多组学数据。因此,在精确医学的各类任务中引入多组学数据变得必要,这些任务包括药物反应预测、基因发现和生存分析等。 作...

阶段感知分层注意力关系网络用于诊断预测

分层注意力关系网络在诊断预测中的应用 近年来,电子健康记录(Electronic Health Records,简称EHR)在提高医疗决策、在线疾病检测和监测方面变得极为有价值。同时,基于深度学习的方法在利用EHR进行健康风险预测和诊断预测方面也取得了巨大的成功。然而,深度学习模型通常需要大量的数据,由于参数的庞大数量。此外,EHR数据中存在大量罕见的医学代码,这对临床应用带来了巨大的挑战。因此,一些研究提出采用医学本体来增强预测性能并提供可解释的预测结果。然而,这些医学本体通常规模较小且粒度较粗,缺乏许多诊断和医学概念,更不用说这些概念之间的各种关系了。 为了克服这一限制,本文提出将现有的大规模医学知识图谱(Knowledge Graph,简称KG)结合到诊断预测中,并设计了一种名为HAR...

时间聚合与传播图神经网络用于动态表示

动态图表示的时间聚合和传播图神经网络 背景介绍 动态图(temporal graph)是一种在连续时间内节点间具有动态交互的图结构,图的拓扑结构随时间的推移不断演变。这种动态变化让节点在不同时刻展现出变化的偏好,这对捕捉用户偏好和检测异常行为非常关键。然而,现有的研究通常采用有限邻居生成动态表示,这不仅降低了性能,还引发了高延迟的在线推断问题。为了应对这些挑战,本文提出了一种全新的时间图卷积方法,即时间聚合和传播图神经网络(Temporal Aggregation and Propagation Graph Neural Networks,简称TAP-GNN)。该方法通过展开时间图以消息传递的姿态分析了动态表示问题的计算复杂度,并设计了一个聚合和传播模块(AP block),有效减少了历史邻...

AutoAlign: 由大型语言模型驱动的全自动知识图谱对齐

AutoAlign:由大规模语言模型驱动的全自动、高效知识图谱对齐方法 知识图谱(Knowledge Graph,简称KG)已经被广泛应用于问答系统、对话系统和推荐系统等多个领域。然而,不同的知识图谱中可能存在同一现实实体以不同形式存储的问题,这导致知识共同体和信息互补非常困难,尤其在实际应用中,这些知识图谱的合并是一项核心任务。这涉及实体对齐(Entity Alignment),即识别不同知识图谱中代表相同实体的实体对。然而,现有方法通常需要手工制作的种子对齐(Seed Alignments),其获取成本高、可移植性差,并且人工干预可能引入偏差,影响对齐效果。 为了应对上述挑战,来自Tsinghua University、University of Melbourne、Universita...

基于知识图谱的社交增强可解释推荐

基于知识图谱的社交增强可解释推荐系统 引言 随着互联网世界信息量的不断增加,用户和商品的相关信息也迅速扩展,导致信息过载问题日益严重。推荐系统通过为用户推荐少量符合其偏好的商品,能够有效缓解这一问题,不仅能帮助用户迅速获取感兴趣的内容,还能帮助企业实现精准营销,提升客户忠诚度。在电子商务、社交媒体和搜索引擎等多种平台上,推荐系统扮演着越来越重要的角色。 推荐系统的性能高度依赖于推荐技术。早期的协同过滤(Collaborative Filtering, CF)方法通过推荐与用户曾经互动过的物品相似的其他物品来实现推荐。然而,当用户与物品之间的互动稀疏时,CF方法效果不佳。为了解决这一限制,各种辅助信息如物品属性、用户信息和上下文被整合到模型中。尤其是,当侧信息被转化为特征向量并与用户和物品ID...