(通讯员刘婷)11月30日上午,华中师范大学计算机学院计算机科学与技术系主任蒋兴鹏教授来我院做题为《基于文本挖掘的微生物知识图谱构建》的讲座,信息管理科学系主任陆泉教授主持。
细菌之间的交互作用是探索微生态系统与人类健康关联的关键因素。蒋兴鹏围绕如何理解这一问题,介绍了其团队开展的如何快速准确的从海量医学文本中挖掘出细菌交互网络的一系列研究。从细菌文本中识别细菌的命名实体是难点之一,这主要是因为细菌命名实体的独特属性,如种类与写法繁多、更新快等,同时细菌间的交互作用关系极其复杂,从文本中自动抽取细菌间关系也缺少标准的语料库和正负样本集为参考。通过标注文本摘要的细菌实体和交互关系数据,研究了基于深度学习和自然语言模型方法的细菌命名实体识别以及关系抽取方法,该方法能够从PubMed文献库和维基百科等大规模数据中有效识别细菌实体以及交互关系,并构建为多层微生物知识图谱,为进一步的分析与预测奠定了基础。
讲座结束时,与会教师和研究生就自己感兴趣的问题与蒋兴鹏作了进一步的交流和讨论。