6月15日至16日,由我院和智能感知与计算安徽省高校重点实验室主办的“深度学习与智能生物信息”研讨会在稼先楼一楼学术研讨室举行,重点实验室部分教师和研究生参加了研讨会。研讨会邀请到美国密苏里大学许东教授、陕西师范大学谢娟英教授、湖北太和医院赵亮副研究员、安徽大学陈鹏教授、安徽工业大学王兵教授等国内外专家、学者到会主讲。bat365官网特聘教授悉尼科技大学李金燕(Jinyan Li)教授主持研讨会。学院院长王一宾教授向来宾简要介绍了bat365官网和best365官方网站登录入口发展概况。
研讨会上,许教授介绍了深度神经网络的类型和近期的发展状况。随后介绍了其课题组的研究工作:用卷积神经网络构成的Google Inception再构建复杂网络,预测蛋白质二级结构、蛋白质骨架二面角,用Dense Inception网络预测蛋白质beta转角结构。许教授团队用Inception胶囊网络预测蛋蛋白质Gamma转角结构。针对蛋白质结构缺失问题,许教授团队用对抗生成网络(GAN)补全缺失部分。最后,许教授介绍了用深度学习方法理解生物通道图。生物通道图包含了更多的文献描述信息,对理解分子结构和之间的相互作用非常有益;用计算方法理解生物通道图存在的困难较多。许教授介绍了其解决方案,如仅关于图中的短期依赖,分析图中文字信息、箭头和T型箭头等。最后给出了U-Net网络对通道图的理解方案。
湖北太和医院赵亮博士介绍了其在蛋白质结构预测和大规模基因数据压缩方面的工作。用双向LSTM网络结合CNN和注意力机制,从蛋白质一级序列出发预测蛋白质二级结构,对三维数据进行重表示从而用卷积神经网络来识别四级结构中的结合位点。此外,对深度学习模型的训练技巧进行了归纳整理。
谢娟英教授介绍了其课题组用迁移学习方法乳腺癌工作。乳腺癌是癌症中高死亡率的一种,但是乳腺癌早期诊断能提高病人的存活率。鉴于机器识别病理学图像分析难度大,设计出基于 Inception_V3 和 Inception_ResNet_V2的深度学习模型,预测乳腺癌;同时还用了一个自动编码解码器对图像进行聚类。
王兵教授介绍了用深度学习预测定量构效关系(QSAR)的研究进展。定量构效关系是一种借助分子的理化性质参数或结构参数,以数学和统计学手段定量研究有机小分子与生物大分子相互作用等。王兵教授提出了一种新的端到端深度学习模型,将编码器-解码器模型和卷积神经网络结构相结合,实现了基于QSAR的预测。编码器-解码器模型主要用于生成固定尺寸的潜在特征来表示化学分子;而CNN框架则通过这些特征来训练一个健壮、稳定的模型来预测化学活性。这种基于深度学习的模型能够成功地识别化学分子是否具有活性。
陈鹏教授报告了其课程组在药物靶向预测方面的研究进展。生物靶点是最常见的蛋白质,如酶、离子通道和受体。探索潜在的药物靶向相互作用(DTI)对药物发现和有效药物开发至关重要。陈教授提出了一种新的基于卷计算机网络的预测方法DrugCNN,该方法能有效识别药物与靶点之间的相互作用。
研讨会上,与会人员就各位专家的报告中有关深度学习的网络结构、超参优化、特征提取、数据集分割等热点问题展开讨论,并就深度学习和生物信息处理结合的前瞻性研究进行了交流。(张步忠)