重磅!机器学习与分子对接技术在食品科学领域中的应用培训!

近年来,随着机器学习技术的不断发展,其在各个领域的应用也越来越广泛。其中,食品科学领域也逐渐开始探索机器学习的应用,有望为食品行业带来新的机遇和变革。

一、什么是机器学习?

机器学习是一种自动化技术,通过对大量数据进行分析和学习,丛而让计算机系统自主地学习和提高,并且可以根据学习结果进行决策或预测。换句话说,机器学习就是让计算机模仿人类的学习过程,从数据中挖掘并提取有用信息,并能自主地识别和解决问题的能力。

二、机器学习在食品科学中的应用

随着食品安全问题的不断出现,越来越多的国家开始尝试采用机器学习技术来监管食品卫生质量。利用机器学习算法,可以对大量的食品安全数据进行学习和分析,并从中挖掘出不同批次产品之间的联系和相似性,从而可以更加准确地判断某一批次的产品是否合格。

总的来说,机器学习技术在食品科学中的应用,仍然处于摸索和研究的初级阶段。面对科学前沿的挑战和困难,我们期待更多的科学家和技术人员加入进来,共同推进食品科学和机器学习技术的交叉应用,创造更多的机遇和变革。

由于该项研究资料和学习平台较少,信息技术公开度低,培训学习迫在眉睫,特此诚挚邀请您参加下述专题线上培训课程

CADD计算机辅助药物设计

机器学习代谢组学

AIDD人工智能药物发现与设计

机器学习微生物组学

蛋白晶体结构解析

机器学习在生物医学中的应用

CRISPR-Cas9基因编辑技术

深度学习基因组学

课程内容

Part.专题一

CADD计算机辅助药物设计课表

第一天

上午

导论与基础

1.蛋白质三维结构的预测对于药物发现的重要性

1.1同源建模

1.2从头建模

2.蛋白质(酶/靶点)活性位点在药物发现的重要性

3.药物发现中的关键结构特征(特别是小分子)

4.药物辅助发现常用的计算方法

4.1分子对接

4.2虚拟筛选

4.3分子动力学模拟

4.4其他

下午

1.PDB数据库的介绍

1.1检索蛋白

1.2页面功能及解读

1.3数据的下载

1.4PDB文件格式的解读

2.PyMol

2.1软件介绍

2.2基本操作介绍

2.3蛋白及小分子表面图、静电势表示

2.4绘制相互作用图及制作简单动画

第二天

同源建模

1.同源建模原理介绍

1.1同源建模的功能及使用场景

1.2同源建模的方法

2.Swiss-Model同源建模;

2.1同源蛋白的搜索(blast等方法)

2.2蛋白序列比对

2.3蛋白模板选择

2.4蛋白模型搭建

2.5模型评价(蛋白拉曼图)

2.6蛋白模型优化

实例讲解与练习:用2019-nCoVspike蛋白序列建模,根据相应参数和方法评价模型

小分子构建

1.ChemDraw软件介绍

1.1小分子结构构建

1.2小分子理化性质(如分子量、clogP等)计算

1.3分别构建大环、氨基酸、DNA、RNA等分子

小分子化合物库

2小分子数据库

2.1DrugBank、ZINC、ChEMBL等数据库介绍及使用

2.2天然产物、中药成分数据库介绍及使用

第三天

1.分子对接基础

1.1分子对接原理

1.2分子对接分类

1.3分子对接打分函数

2.常规分子对接实践

2.1对接的执行

2.1.1药物分子配体的准备

2.1.2蛋白受体的准备

2.1.3受体格点计算

2.1.3执行半柔性对接

1.2对接结果评价

1.2.1晶体结构构象进行对比

1.2.2能量角度评价对接结果

1.2.3聚类分析评价对接结果

1.2.4最优结合构象的选择

2对接其他方式的实现

第四天

1柔性对接

1.1小分子配体优化准备

1.2蛋白受体的准备

1.3柔性残基的定义

1.4蛋白受体格点计算

1.5柔性对接计算及结果评价

1.6半柔性对接与柔性对接比较与选择

2柔性对接其他方式的实现

基于受体的药物发现

1虚拟筛选的准备

1.1小分子文件的不同格式

1.2openbabel最实用功能的介绍

1.3小分子不同格式的转化

2.基于对接的虚拟筛选

2.1虚拟筛选定义、流程构建及演示

2.2靶点蛋白选择、化合物库获取

2.3虚拟筛选

2.4结果分析(打分值、能量及相互作用分析)

第五天

一些特殊的分子对接

1.小分子-小分子对接

1.1小分子-小分子相互作用简介

1.2小分子结构预处理

1.3小分子-小分子对接(糖-小分子为例)

1.4对接结果展示与分析

2.蛋白-核酸对接

3.蛋白-蛋白对接

基于配体的药物发现

1.3D-QSAR模型构建(Sybyl软件)

1.1小分子构建

1.2创建小分子数据库

1.3小分子加电荷及能量优化

1.4分子活性构象确定及叠合

1.5创建3D-QSAR模型

1.6CoMFA和CoMSIA模型构建

1.7测试集验证模型

1.8模型参数分析

1.9模型等势图分析

1.103D-QSAR模型指导药物设计

第六天

1.linux系统介绍

2.常用命令介绍

3.linux上程序的安装(gromacs)

MD实践一:溶剂化下蛋白质分子动力学模拟

全面熟悉分子动力学模拟的一般流程

第七天

MD实践二:溶剂化下蛋白质-配体的分子动力学模拟

掌握处理非标准残基的力场拟合

分子动力学模拟中的常用分析命令

蛋白-配体结合自由能的结算

Part.专题二

机器学习微生物组学课表

1.微生物学基础知识回顾

2.机器学习基本概念介绍

a.什么是机器学习

b.监督学习、无监督学习

c.常用机器学习模型介绍

3.混淆矩阵

4.ROC曲线

R语言简介与实操

1.R语言概述

2.Rstudio软件与R包安装

3.R语言语法及数据类型

4.条件语句和循环

Linux实操

1.Linux操作系统

2.Linux操作系统的安装与设置

3.网络配置与服务进程管理

5.常用的Linux命令

6.在Linux下获取基因数据

7.Shellscript与Vim编辑器

微生物组常用分析方法(实操)

1.微生物丰度分析

2.转录组丰度分析

3.进化树分析

4.降维分析

1.疾病预测应用:利用机器学习基于微生物组学数据预测疾病状态

2.肠道菌群研究:机器学习研究饮食对肠道微生物的影响

机器学习模型训练和分析(实操)

1.加载数据及数据归一化

2.构建训练模型(GLM,RF,SVM)

3.模型参数优化

4.模型错误率曲线绘制

5.混淆矩阵计算

6.重要特征筛选

7.模型验证,ROC曲线绘制利用模型进行预测

利用机器学习基于微生物组学数据预测宿主表型

1.加载数据

2.数据归一化

3.OUT特征处理

4.机器学习模型构建(RF,KNN,SVM,Lasso等多种机器学习方法)

5.绘制ROC曲线,比较不同机器学习模型模型性能评估

利用机器学习基于临床特征和肠道菌群预测疾病风险

2.机器学习模型构建(RF,gbm,SVM等等)

3.交叉验证

4.模型性能评估

上下滑动查看更多内容

Part.专题三

AIDD人工智能药物发现与设计课表

1人工智能药物发现(AIDD)简介

2机器学习和深度学习在药物发现领域的应用

2.1分子属性预测与优化

2.2虚拟筛选

2.3药物副作用预测与安全性评估

2.4新药分子设计

3工具介绍与安装

3.1Anaconda3/Pycharm安装

3.2Numpy基础

3.3Pandas基础

3.4Matplotlib基础

3.5Scikit-learn基础

3.6Pytorch基础

3.7RDKit基础

1机器学习简介

1.1机器学习四要素

1.2数据模块

1.3核心和高级API

2回归算法与应用

2.1线性回归

2.2Lasso回归

2.3Ridge回归

2.4ElasticNset弹性网络

3分类算法与应用

3.1逻辑回归

3.2朴素贝叶斯

3.3KNN

3.4SVC

3.5决策树

3.6随机森林

3.7集成学习

4聚类算法

4.1KMeans

4.2密度聚类DBSCAN

5降维

5.1奇异值分解SVD

5.2主成分分析PCA

5.3非负矩阵分解NMF

6模型的评估方法和评价指标

6.1超参数优化

6.2交叉验证

6.3评价指标

7特征工程

8机器学习药物发现案例(一)

——化合物生物活性分类模型

9机器学习药物发现案例(二)

——化合物生物活性回归模型

10机器学习药物发现案例(三)

——药物副作用预测模型

1深度学习与药物发现(一)

1.1深度神经网络

1.2正向和反向传播

1.3优化方法

1.3.1梯度下降增加动力

1.3.2自适应学习

1.3.3Adam

1.4损失函数

1.4.1平均绝对误差

1.4.2均方误差损失函数

1.4.3交叉熵损失函数

1.5卷积神经网络

1.5.1卷

1.5.2填充和步幅

1.5.3池化层

1.5.4LeNet网络

1.5.5AlexNet网络

2深度学习药物发现案例(一)

——药物-药物相互作用预测模型

1深度学习与药物发现(二)

1.1循环神经网络

1.2消息传递神经网络

1.3图卷积神经网络

1.4图注意力神经网络

1.5图采样和聚合

2深度学习药物发现案例(二)

——药物靶标相互作用预测模型

3深度学习药物发现案例(三)

——药物重定位模型

1深度学习与药物发现(三)

1.1注意力机制

1.2自注意力模型

1.3多头自注意力模型

1.4交叉注意力模型

1.5Transformer模型

2深度学习药物发现案例(四)

3深度学习药物发现案例(五)

——药物靶标结合亲和力预测模型

副作用在药物-药物相似性网络中传播

利用药物关联网络特征和深度神经网络识别药物之间潜在相互作用事件

通过深度学习整合来自异构网络的邻接信息以发现新的药物靶点相互作用

将药物和蛋白质信息关联起来的带有注意力区块的AttentionDTA模型

Part.专题四

机器学习代谢组学课表

A1代谢物及代谢组学的发展与应用

(1)代谢生理功能;

(2)代谢疾病;

(3)非靶向与靶向代谢组学;

(4)空间代谢组学与质谱成像(MSI);

(5)代谢流与机制研究;

(6)代谢组学与药物和生物标志物。

A2代谢组学实验流程简介

A3色谱、质谱硬件原理

(1)色谱分析原理;

(2)色谱的气相、液相和固相;

(3)色谱仪和色谱柱的选择;

(4)质谱分析原理及动画演示;

(5)正、负离子电离模式;

(6)色谱质谱联用技术;

(7)LC-MS的液相系统

A4代谢通路及代谢数据库

(1)几种经典代谢通路简介;

(2)能量代谢通路;

(3)三大常见代谢物库:HMDB、METLIN和KEGG;

(4)代谢组学原始数据库:MetabolomicsWorkbench和Metabolights.

B1代谢物样本处理与抽提

(1)组织、血液和体液样本的提取流程与注意事项;

(2)用ACN抽提代谢物的流程与注意事项;

(3)样本及代谢物的运输与保存问题;

B2LC-MS数据质控与搜库

(1)LC-MS实验过程中QC样本的设置方法;

(2)LC-MS上机过程的数据质控监测和分析;

(3)XCMS软件数据转换与提峰;

B3R软件基础

(1)R和Rstudio的安装;

(2)Rstudio的界面配置;

(3)R的基本数据结构和语法;

(4)下载与加载包;

(5)函数调用和debug;

B4ggplot2

(1)安装并使用ggplot2

(2)ggplot2的画图哲学;

(3)ggplot2的配色系统;

(4)ggplot2画组合图和火山图;

机器学习

C1无监督式机器学习在代谢组学数据处理中的应用

(1)大数据处理中的降维;

(2)PCA分析作图;

(3)三种常见的聚类分析:K-means、层次分析与SOM

(4)热图和hcluster图的R语言实现;

C2一组代谢组学数据的降维与聚类分析的R演练

(1)数据解析;

(2)演练与操作;

C3有监督式机器学习在代谢组学数据处理中的应用

(1)数据用PCA降维处理后仍然无法找到差异怎么办?

(2)PLS-DA找出最可能影响差异的代谢物;

(3)VIPscore和coef的意义及选择;

(4)分类算法:支持向量机,随机森林

C4一组代谢组学数据的分类算法实现的R演练

(1)数据解读;

D1代谢组学数据清洗与R语言进阶

(1)代谢组学中的t、fold-change和响应值;

(2)数据清洗流程;

(3)R语言tidyverse

(4)R语言正则表达式;

(5)代谢组学数据过滤;

(6)代谢组学数据Scaling原理与R实现;

(7)代谢组学数据的Normalization;

(8)代谢组学数据清洗演练;

D2在线代谢组分析网页Metaboanalyst操作

(1)用R将数据清洗成网页需要的格式;

(2)独立组、配对组和多组的数据格式问题;

(3)Metaboanalyst的pipeline和注意事项;

(4)Metaboanalyst的结果查看和导出;

(5)Metaboanalyst的数据编辑;

(6)全流程演练与操作

E1机器学习与代谢组学顶刊解读(2-3篇);

(1)NatureCommunication一篇代谢组学小鼠脑组织样本database类型的文献;

(2)Cell一篇代谢组学患者血液样本的机器学习与疾病判断的文献;

(3)1-2篇代谢组学与转录组学和蛋白组学结合的文献。

E2文献数据分析部分复现(1篇)

(1)文献深度解读;

(2)实操:从原始数据下载到图片复现;

(3)学员实操。

Part.专题五

蛋白质晶体结构解析课表

蛋白质结晶前准备

课程介绍和蛋白质结构功能基本介绍

提纯蛋白质,确定浓度、pH值、缓冲液等条件,控制蛋白质稳定性等。

1、目的蛋白质信息检索与调查

-利用生物信息学工具搜集目标蛋白质的基因序列、结构域、同源蛋白质的信息

-分析目标蛋白质的理化性质,如分子量、等电点、聚合程度、稳定性等

2、质粒制备

-设计引物,克隆目标基因到表达载体

-转化表达宿主,提取重组质粒

-质粒测序验证目标基因插入

3、蛋白质纯化

-选择合适的诱导条件,表达可溶性或不溶性重组蛋白

-裂解菌体,释放重组蛋白质

-蛋白质纯化:亲和层析、离子交换层析、凝胶过滤等

4、蛋白质不表达和包涵体问题

-分析不表达的原因,优化诱导条件

-改进溶解缓冲液条件,提高蛋白从包涵体中释放

5、蛋白质活性鉴定

-进行WesternBlot或酶活性实验验证蛋白质活性

6、蛋白质结晶前分析

-测定蛋白质的纯度、聚合状态、稳定性

-优化缓冲液条件,调整蛋白质到适宜的pH和离子浓度

蛋白质结晶与衍射数据收集

利用协同结晶筛选获得蛋白质结晶,在同步辐射光源下收集衍射数据。

1、蛋白质结晶

-蛋白质结晶的基本原理

-蛋白质结晶的影响因素

-蛋白质结晶的基本方法

-结晶条件筛选策略

2、SSRF(同步辐射光源)的介绍

-SSRF简介

-SSRF的光源优势

-SSRF的实验站介绍

3、蛋白质晶体衍射数据收集

-X射线结晶学基本原理

-晶体探针和晶体定位

-晶体测试和优化

-衍射数据收集参数设定

-衍射数据处理和分析

蛋白质晶体结构解析软件安装

1、Linux系统安装

-Linux系统选择和安装

-Linux系统基本命令

-Linux系统环境配置

2、蛋白质晶体结构解析软件安装

-CCP4安装

-Phenix安装

-Coot安装

-PyMol安装

-其他结构解析支持软件安装

蛋白质结构解析的各种软件主要在Linux系统下使用。建议使用Linux系统。首先需要对Linux系统进行简单的介绍,包括选择发行版本、基本命令使用、环境变量配置等。然后依次介绍CCP4、Phenix、Coot、PyMol等主要的结构解析软件的下载、编译和安装方法。也可以介绍一些结构解析中需要的其他软件工具的安装。通过这个章节的学习,学生可以掌握在Linux系统上配置蛋白质结构解析的软件环境。

Index、integrate与scale软件使用和介绍

利用软件index及integrate衍射点,scale衍射数据以校正强度。

1、晶体结构学知识

-晶体学中的衍射理论基础

-布拉格定律和倒易格向量

-晶体的对称性

2、蛋白质晶体结构解析流程

-蛋白质的表达与纯化

-蛋白质的结晶

-X射线晶体学数据收集

-晶体结构解析流程概述

3、Index和integrate

-Indexing的目的和原理

-Integration的目的和过程

4、Scale

-Scale的目的——校正数据

-Scale常用方法

5、使用XSCALE功能进行scale

-XSCALE软件介绍

-使用XSCALE进行数据scale的步骤

6、使用HKL2000进行index、integrate和scale

-HKL2000软件介绍

-使用HKL2000进行indexing

-使用HKL2000进行integration

-使用HKL2000进行scaling

分子置换、构建优化与结构提交

利用分子置换法确定蛋白质框架,手动构建余下结构,进行优化后提交蛋白质坐标库。

1、分子置换

(1)分子置换的概念

(2)分子置换的目的

(3)常用的分子置换软件介绍

(4)分子置换的具体操作步骤

2、蛋白质晶体结构构建

(1)蛋白质序列比对确定构建起始模型

(2)主链构建方法

(3)侧链构建方法

(4)构建完成后的模型检查

3、蛋白质晶体结构优化

(1)能量最小化原理

(2)模拟退火原理

(3)分子动力学模拟原理

(4)优化过程中的评估标准

4、蛋白质晶体结构验证

(1)Ramachandran图分析

(2)各类键长和键角分布

(3)密接点分析

(4)B因子分布

(5)电子密度匹配度评价

5、蛋白质晶体结构提交到PDB

(1)PDB数据提交要求

(2)各项验证确认无误后压缩需提交文件

(3)在PDB网站提交表单,上传文件,等待审核结果

蛋白质晶体结构展示

利用Pymol等软件分析并展示蛋白质的二级结构、三级结构,活性口袋等结构信息。

1、pdb格式文件简介

-pdb文件概述:包含蛋白质晶体学数据的标准格式

-原子坐标:记录每个原子的xyz坐标

-温度因子:记录每个原子的热运动参数

-二级结构:记录α螺旋和β片层的位置

-结构注解:记录配体、酶活性中心等重要结构信息2、PyMOL制作蛋白质晶体结构图

-PyMOL简介:流行的分子可视化软件

-加载pdb文件

-显示蛋白质链、α螺旋和β片层

-调整视角、变色和放大关键结构

-导出高质量图像3、使用PyMOL制作蛋白质配体结合位点信息

-识别蛋白质与配体的相互作用

-突出显示配体结合位点残基

-在结合位点生成表面模型

-制作配体结合位点的特写图4、使用PyMOL调查蛋白质的温度因子B-factors

-显示温度因子putty图

-分析柔性域和稳定域

-与酶活性中心和功能位点的关系5、使用PyMOL重叠对比不同的蛋白质晶体结构

-载入不同状态的pdb文件

-重叠对齐蛋白质结构

-比较构象变化,如酶动力学过程中的不同中间状态6、使用PyMOL显示蛋白质晶体结构中配体的电子密度图

-加载包含配体密度的pdb文件

-显示2Fo-Fc和Fo-Fc电子密度图

-检查配体与电子密度的匹配程度

-评估配体定位和取向的准确性7、使用PyMOL结合Chimera实现同步显示非对称单元的蛋白质分子

-在PyMOL中显示蛋白质非对称单元

-在Chimera中同步显示非对称单元

-细节对比不同分子中的相同结构

-分析蛋白质多聚体形成的分子间相互作用

Part.专题六

CRISPR-Cas9基因编辑技术课表

基因编辑简介

1.基因编辑基本概念介绍

2.单基因遗传病数据库(实操)

3.基因编辑历史

4.TALEN

5.Zincfinger

6.Baseeditor

7.Primeeditor

1.如何选择正确Cas9蛋白类型

2.gRNA设计和软件(实操)

3.sgRNA修饰

4.手动设计PegRNA的八个要点(实操)

5.七种PegRNA辅助设计软件

1.AAV递送(组织靶向)

2.脂质体递送

3.核糖核蛋白递送

4.高分子递送

5.Virallikeparticles递送

6.外泌体递送

7.无机纳米粒递送

8.电转

9.超声

10.显微注射

1.动物模型

2.质粒

3.分子克隆基础

4.AAV设计(实操)

7.如何提高Primeediting效率

1.基因编辑已经批准的药物

2.临床试验

3.主要公司、科学家和专利

4.副作用和退市的产品

5.FDA政策

6.CRISPR在诊断中的应用

7.CRISPRlibrary

8.CRISPR与单细胞测序

9.CRISPR与表观遗传学

10.CIRPSR在植物学中的应用

11.设计课题与评价(实操)

Part.专题七

机器学习在生物医学中应用专题

机器学习基本概念介绍

常用机器学习模型介绍

主成分分析

一致性聚类分析

生存分析及生存曲线

预后模型介绍

R语言入门

R语言概述

R软件及R包安装

R语言语法及数据类型

条件语句

循环

函数

机器学习+生存分析预测患病风险

机器学习+生存分析预测患者预后

常用生物医学公共数据库介绍

TCGA数据库介绍

TCGA数据库表达谱数据下载

TCGA临床数据下载

合并TCGA表达谱数据

GEO数据库介绍

GEO数据库检索

GEO数据下载

差异表达分析

机器学习模型构建

特征筛选及重要性评估

模型评估及ROC曲线绘制

构建nomogram模型,绘制列线图

矫准曲线绘制

决策曲线绘制

GSEA分析

火山图,热图绘制

GO和KEGG富集分析及可视化

生存分析,生存曲线绘制

训练集,测试集拆分

单因素,多因素cox分析

Lasso回归分析

风险评估模型构建

riskscore计算

Nomogram模型构建,绘制列线图

矫准曲线,决策曲线绘制

ceRNA网格构建

miRNA,lncRNA,circRNA介绍

实操部分

差异mRNA,lncRNA,miRNA分析

火山图,热图,聚类图,柱状图

差异表达基因GO,KEGG富集分析,气泡图,柱状图,KEGG通路图展示

mRNA,lncRNA,miRNA网络构建

cytoscape展示ceRNA网络,hub基因筛选

结果展示:

差异表达分析热图

Part:专题八

深度学习在基因组学中的应用

理论部分

深度学习算法介绍

1.有监督学习的神经网络算法

1.1全连接深度神经网络DNN在基因组学中的应用举例

1.2卷积神经网络CNN在基因组学中的应用举例

1.3循环神经网络RNN在基因组学中的应用举例

1.4图卷积神经网络GCN在基因组学中的应用举例

2.无监督的神经网络算法

2.1自动编码器AE在基因组学中的应用举例

2.2生成对抗网络GAN在基因组学中的应用举例

实操内容

1.1常用的Linux命令

1.2Vim编辑器

1.3基因组数据文件管理,修改文件权限

1.4查看探索基因组区域

2.Python语言基础

2.1.Python包安装和环境搭建

2.2.常见的数据结构和数据类型

基因组学基础

1.基因组数据库

2.表观基因组

3.转录基因组

4.蛋白质组

5.功能基因组

基因组常用深度学习框架

1.安装并介绍深度学习工具包tensorflow,keras,pytorch

2.在工具包中识别深度学习模型要素

2.1.数据表示

2.2.张量运算

2.3.神经网络中的“层”

2.4.由层构成的模型

2.5.损失函数与优化器

2.6.数据集分割

2.7.过拟合与欠拟合

3.基因组数据处理

3.1安装并使用keras_dna处理各种基因序列数据如BED、GFF、GTF、BIGWIG、BEDGRAPH、WIG等

3.2使用keras_dna设计深度学习模型

3.3使用keras_dna分割训练集、测试集

3.4使用keras_dna选取特定染色体的基因序列等

卷积神经网络CNN在基因调控预测中的应用

1.Chip-Seq中识别基序特征G4,如DeepG4

2.Chip-Seq中预测DNA甲基化,DeepSEA

3.Chip-Seq中预测转录调控因子结合,DeepSEA

复现卷积神经网络CNN识别基序特征DeepG4、非编码基因突变DeepSEA复现DeepG4从Chip-Seq中识别G4特征

1.安装selene_sdk,复现DeepSEA从Chip-Seq中预测DNA甲基化,非编码基因突变

深度学习在识别拷贝数变异DeepCNV

1.SNP微阵列中预测拷贝数变异CNV,DeepCNV

2.RNA-Seq中预测premiRNA,dnnMiRPre

1.复现DeepCNV利用SNP微阵列联合图像分析识别拷贝数变异

2.复现循环神经网络RNN工具dnnMiRPre,从RNA-Seq中预测premiRNA

深度学习在识别及疾病表型及生物标志物上的应用

1.从基因表达数据中识别乳腺癌分型的深度学习工具DeepType

1.复现DeepType,从METABRIC乳腺癌数据中区分乳腺癌亚型

深度学习在预测药物反应机制上的应用

1.联合肿瘤基因标记及药物分子结构预测药物反应机制的深度学习工具SWnet

1.预处理药物分子结构信息

2.计算药物相似性

3.在不同数据集上构建self-attentionSWnet

4.评估self-attentionSWnet

5.构建多任务的SWnet

6.构建单层SWnet

7.构建带权值层的SWnet

上下滑动查看更多

三、

讲师介绍

CADD主讲老师来自国内高校、中科院等单位,老师主要擅长深度学习、机器学习、药物虚拟筛选、计算机辅助药物设计、人工智能药物发现、分子对接、分子动力学等方面的研究

AIDD授课老师余老师,有十余年的计算机算法研究和程序设计经验。研究方向涉及生物信息学,深度学习,药物靶标识别,药物不良反应等。参与了国自然基金2项,主持了省厅级科研项目3项。一作身份发表SCI论文数篇,包括BMCBioinformatics,JournalofBiomedicalInformatics,InternationalJournalofMolecularSciences等知名期刊。

蛋白晶体结构解析主讲老师顾博士来自基础医学院医学药理学系教师。具有十年以上的高校教学经验,承担本科生、研究生的教学任务。主持省自然科学基金1项(已结题),发表SCI论文10余篇。参与编写教材5部,担任人民卫生出版社配套教材编委,高等教育出版社数字教材编委,另外主编教辅教材2部。获省教学成果奖二等奖(排名第9),省一流本科课程(排名3),省在线开放课程(排名3),担任省药理学会教学专委会委员,学系教学副主任。

机器学习代谢组学主讲老师来自985高校神经科学博士,主要利用代谢组学、转录组学和分子生物学等技术研究神经内科慢性病的发病机制和生物标志物。擅长高效液相色谱-质谱联用(LC-MS)技术进行非靶向和靶向代谢组学从样本制备到数据分析的全流程研究,以及多组学大数据的生物信息学整合分析。5年内在JClinInvest,EBioMedicine,CellDeathDis,CellDeathDiscov,Nanotoxicology等杂志发表SCI论文10篇。

机器学习微生物组学主讲老师来自生物科技公司核心高管,曾在麻省理工学院、加州大学旧金山分校等机构工作,过去5年科研工作发表于Cell,PNAS等杂志

机器学习生物医学主讲老师生物信息学博士,有十余年的测序数据分析经验。研究领域涉及机器学习,芯片数据分析,核酸及蛋白序列分析,DNA,RNA,甲基化测序数据分析,单细胞测序数据分析,miRNA及靶基因分析,生存分析及预后模型构建等。具有5年培训经验,对常用公共数据库TCGA,NCBI,UCSC,GEO等非常熟悉。发表SCI论文30余篇,其中一作及并列一作15篇。

深度学习基因组学主讲老师刘老师,生物信息学博士,有十余年的测序数据分析经验。研究领域涉及人工智能、自然语言处理、功能基因组学、转录组学、miRNA及靶基因网络分析,单细胞测序数据分析,基因调控网络时序分析,蛋白质互作网络分析,多组学联合分析等。主持省自然科学基金等项目4项,发表SCI论文23篇,论著一部。

培训对象

全国各大高校、企业、科研院所从事人工智能、生命科学、代谢工程、有机合成、天然产物、药物、生物信息学、植物学,动物学、化学化工,医学、基因组学、农业科学、植物学、动物学,临床医学、食品科学与工程、肿瘤免疫与靶向治疗、全基因组泛癌分析、人黏连蛋白折叠基因组机、病毒检测、功能基因组、遗传图谱、基因挖掘变异、代谢组学、蛋白质组学、转录组学、生物医学、核酸、毒物学等研究科研人员及爱好者

学习目标

CADD计算机辅助药物设计:让学员能够掌握包括PDB数据库、靶点蛋白、蛋白质-配体、蛋白-配体小分子、蛋白-配体结构、notepad的介绍和使用、分子对接、蛋白-配体对接、虚拟筛选、蛋白-蛋白对接、蛋白-多糖分子对接、蛋白-水合对接、Linux安装、gromacs分子动力学全程实操、溶剂化分子动力学模拟

蛋白质晶体结构解析:近年来结构生物学发展迅速并和其他学科相互渗透交叉,特别是受到结构基因组学等热点学科的极大带动。作为结构生物学的基本手段和技术,蛋白质晶体学从解析简单的蛋白质三维结构延伸到解决各类生物大分子及复合物结构,并更加注重研究结构与功能之间的相互关系,派生出诸如基于结构的药物设计等应用性很强的分支。生物技术及计算机技术的飞速发展,尤其是高通量技术在生物学领域的应用,为蛋白质晶体学带来了全新的概念和更加广阔的前景。

机器学习微生物组学:通过本次培训多个案例的系统讲解让参会学员学会机器学习在微生物组数据分析流程,能够快速运用到自己的科研项目和课题上

机器学习生物医学:通过本次学习,你将了解机器学习基本概念及常用机器学习模型的原理;生存分析及风险模型的构建;R语言构建常用机器学习模型;机器学习常见图,表的绘制;生存分析,预后模型常见图,表的绘制

深度学习基因组学:适于对深度学习、课程通过基础入门+应用案例实操演练的方式,从初学及应用研究的角度出发,带大家实战演练多种深度学习模型(深度神经网络DNN、卷积神经网络CNN、循环神经网络RNN、可变自动编码器VAE、图卷积神经网络GCN)在基因组学分析中的各种应用:通过对这些深度学习在基因组学中的应用案例进行深度讲解和实操,让学员能够掌握深度学习分析高维基因组学、转录组学、蛋白组学等多组学数据流程,系统学习深度学习及基因组学理论知识及熟悉软件代码实操,熟练掌握这些前沿的分析工具的使用以及研究创新深度学习算法解决生物学及临床疾病问题与需求。

课程特色

报名费用及福利

CADD计算机辅助药物设计;

AIDD人工智能药物发现;

蛋白晶体结构解析;

深度学习基因组学;

公费价:5880自费价:5480

每班价格

机器学习代谢组学;

机器学习微生物组学;

机器学习生物医学;

CRISPR-Cas9基因编辑技术;

公费价4880自费价4480

优惠一

两班同报9880元另外赠送一个课程

(赠送一个班任选)

优惠二

三班同报13880元

四班同报17880元

(赠送两个班任选)

特惠三

五班同报22880

(赠送三个班任选)

一年内可免费参加本公司举办的任何课程(不限次数及课程)

证书:参加培训并通过考试的学员,可以申请获得工业和信息化部工业文化发展中心颁发的“工业强国建设素质素养提升尚工行动”岗位能力适应评测证书。该证书可在中心官网查询,可作为能力评价,考核和任职的重要依据。评测证书查询网址:www.miit-icdc.org(自愿申请,须另行缴纳考试费500元/人)

THE END
1.课程预告利用生信数据库进行疾病模型构建的创新策略01知识要点提前掉落 1常用生信数据库的现状与挑战 2AI赋能的创新型数据库——罕见病数据中心(RDDC) 3RDDC「生物大数据」及「AI+生信工具」使用指南 4如何应用RDDC开展疾病研究和药物发现 5在线答疑 02讲师简介https://www.lascn.net/Item/108899.aspx
2.中国临床试验注册中心研究设计: 横断面 Study design: Cross-sectional 研究目的: (1)构建皮肤鳞状细胞癌多重免疫荧光病理图像数据库。(2)建立多重免疫荧光病理图像细胞核分割方法。(3)建立智能恶性程度分析及靶向治疗方案评估模型。 Objectives of Study: (1) Establish the multi-immunofluorescence pathological image database ofhttps://www.chictr.org.cn/showproj.html?proj=234427
3.转化医学网2024-11-23 15:04 【Adv. Sci.】中山大学合作发文:骨转移癌症治疗的潜在靶点 2024-11-23 15:04 液体活检重大进展!河北医科大学发文:胃癌早期复发检测的开创性方法 2024-11-22 18:35 【Lancet子刊】儿童肥胖危机:北京大学宋逸团队揭露关键因素 2024-11-22 18:34https://www.163.com/dy/media/T1608556126673.html
4.SiLCYB调控番茄红素等谷子类胡萝卜素合成代谢的功能及应用68.1.2、silcyb基因编辑靶点设计 69.根据谷子silcyb基因组序列,通过在线靶点预测网站(http://crispor.tefor.net/)生成靶点列表,最终选定序列表中序列2第843bp到862bp之间20bp序 列,即5 ′? gcccacaaggatcttcctcg ?3′ 为靶标序列。 70.实施例2、pylcrispr/cas9pubi http://mip.xjishu.com/zhuanli/27/202111177080.html
5.利用CRISPR/Cas9技术构建MLH1基因敲除结肠癌细胞Mc38和乳腺癌细胞2.1 lentiCRISPRv2-SgRNA质粒载体的鉴定 构建的MLH1基因敲除lentiCRISPRv2-SgRNA质粒载体进行一代测序获得基因碱基序列,经过比对,构建的质粒载体分别含有设计的靶点序列SgRNA1和SgRNA2,证明本研究成功构建了MLH1基因敲除lentiCRISPRv2-SgRNA1和lentiCRISPRv2-SgRNA2质粒载体(图2)。 https://www.fx361.com/page/2022/0505/11515408.shtml
6.多靶点pCRISPR载体(单子叶和双子叶植物用)使用方法.docx多靶点pCRISPR载体(单子叶和双子叶植物用)使用方法.docx,CRISPR/Cas9-based genome editing technology A robust CRISPR/Cas9 vector system for multiplex targeting of genomic sites in monocot and dicot plants 亚热带农业生物资源保护与利用国家重点实验室 华南农业大https://max.book118.com/html/2020/1217/8035114052003027.shtm
7.深度学习辅助CRISPR系统设计方法总结腾讯云开发者社区因此,设计有效的sgRNA用于可靠的基因敲除实验至关重要。理想的gRNA应该最大限度地提高靶上活性(诱导效率),同时最大限度地减少潜在的脱靶效应(诱导特异性)。近年来,涌现出一些辅助gRNA设计的计算工具,这些工具旨在帮助研究人员选择可用的最佳靶点。本文关注范围仅是利用深度学习方法解决该问题的计算工具。https://cloud.tencent.com/developer/article/2177923
8.纳米人具有较强双光子吸收特性(TPA)的荧光材料在非线性光学、生物成像和光学治疗等领域有着广泛的应用前景。而制备具有高TPA性能的荧光材料的方法之一是将生色团分子进行聚合以形成π-共轭的结构。 武汉大学张先正教授团队报道了一种合理设计基于苯并噻唑的共价有机骨架(COF)的策略并可有效提高其TPA性能,进而可实现高效的双http://www.nanoer.net/phone/showinfo-4-13342.html
9.一种高效无选择标记的黑曲霉基因组编辑方法CRISPR/Cas9技术是一种被广泛采用的黑曲霉基因组编辑技术,但由于需要在基因组中整合选择标记或基因编辑效率还有待提高,影响了其在工业菌株改造中的应用。本研究建立了一种基于CRISPR/Cas9技术的高效无选择标记的基因编辑方法。首先,利用5S rRNA启动子启动sgRNA的表达,构建了一个含有AMA1 (autonomously maintained in https://cjb.ijournals.cn/html/cjbcn/2022/12/gc22124744.htm
10.sgRNAs&基因编辑sgrna设计网站从图1可以看到,CRISPR locus由这些元件构成:一开始是个反式激活的RNA基因,编码特异的非编码RNA(trancrRNA,trans-activating CRISPR RNA,橙色矩形),与重复序列具有同源性,后面是各种cas基因(多种颜色的箭头),接着是CRISPR array(棕色的菱形是重复序列,彩色的是间隔)。而这些间隔序列是细菌从噬菌体DNA中获得的遗传元件https://blog.csdn.net/geekfocus/article/details/128613082
11.NatureBiotechnology:CRISPR介绍因传统CRISPR筛选在体内模型面临瓶颈与数据噪声问题,研究开发的CRISPR-StAR新方法,阐述其原理、在黑色素瘤研究中的应用、提高数据可靠性的方式、揭示的治疗靶点及对精准医学发展的推动作用。 引言 CRISPR-Cas9技术因其高效的基因编辑能力成为功能基因组学的重要工具。然而,传统CRISPR筛选在复杂的体内模型(in vivo)中https://www.medsci.cn/article/show_article.do?id=c8eb855e05a5
12.国际国内公共卫生情报信息2023年第18期lPharmacol Res:科学家揭示了GPR41是肺纤维化的潜在治疗靶点 lnpj Precis Onc:科学家成功预测癌症患者对化疗制剂顺铂的反应 lBlood Cancer Discov:科学家发现对于淋巴瘤发生非常重要的分子通路 l电子耳蜗可像人耳一样适应噪音 l首例非人灵长类动物介入式脑机接口试验成功 https://www.pzhcdc.com/Article/View?id=7245
13.CRISPR/Cas9基因敲入试验步骤(二)sgRNA的设计及退火因此,我强烈推荐基于重组整合方法设计的CRISPR载体,使用难度低,可靠性强,而且成本上也不会增加。其实验步骤分三步:1、使用XbaI、EcoI等其他稳定可靠的内切酶酶切载体,回收载体;2、使用PCR将靶点做到特定片段上,回收片段;3,重组整合反应,转化即可。 2017-01-29· IP浙江 回复 lixwei20121 请问: BbsI 是不是用于https://3g.dxy.cn/bbs/topic/36958027
14.教你用20多种方法来交叉验证你的实验结果,必看必收藏!如何用20多种方法来交叉验证你的实验结果?这和验证抗体如出一辙,看完这篇软文,你的科研思路也会被开拓。CST自1999年成立以来,一直以提供最高质量抗体为使命,进行严格的多种方法交叉验证,最终帮助用户以最少的时间、样本和试剂获得可靠可信和可重复的结果,同时,为了帮助科研者顺利地完成投稿,CST还会提供抗体的验证数https://www.biomart.cn/news/16/2906325.htm
15.长文2022年全球科技进展100项,生命科技超过30%在该项研究中,研究人员放弃了传统的基于DNA的方法,而是选择使用核糖核酸(RNA)来构建新型生物计算机。研究人员需要证明RNA也具有和DNA同样的“锁门”和“开门”功能。为了实现这一目标,研究人员通过设计DNA并将其插入细胞的基因组,细胞通过转录过程产生RNA,RNA链随后发生折叠成为双链结构,表现为“锁门”。研究人员在细胞https://new.qq.com/rain/a/20230220A00RTU00
16.使用指南粒曼CRISPREasyKO试剂盒(RNP法)收藏由于RNP 在细胞内 72h 内完成基因组编辑后就会被降解,不引入外源序列,尽可能保持细胞表型,是目前脱靶效应最低的方式,可有效避免病毒基因组随机整合,而影响后续功能性实验,避免传统方法中Cas9 和 sgRNA 持续表达造成细胞基因组不稳定及高脱靶风险。CRISPR/Cas9 RNP 法进行基因敲除细胞系构建已经在路上,将全面替代传统http://www.elem-bio.cn/news_details/28.html
17.致病性嗜水气单胞菌检测新方法:dRAACRISPR/Cas12a核心提示:嗜水气单胞菌作为一种新型水源性和食源性病原体,严重威胁人类健康、食品安全和水产养殖。为此,开发了一种新的快速、便捷、准确、灵敏、实用和可视化的检测方法,即dRAA-CRISPR/Cas12a,用于针对以aerA和hlyA基因为靶点的致病性嗜水气单胞菌进行检测。 https://www.mbiosh.com/kxg/zbwsw/1026.html
18.CRISPR/Cas基因组编辑在木本植物性状改良中的应用植物基因组编辑专辑 评述 CRISPR/Cas基因组编辑在木本植物性状改良中的应用 袁雪宁?, 姚凤鸽?, 安轶, 江成, 陈宁宁, 黄李超, 卢孟柱, 张进* 浙江农林大学林业与生物技术学院, 省部共建亚热带森林培育国家重点实验室, 杭州 311300 ? 同等贡献 * 联系人, E-mail: zhangj@zafu.edu.cn 2023-11-01 https://engine.scichina.com/doi/pdf/C155C9F6748C4905B749EDF5E8382F71
19.世界首个完全由AI设计的CRISPR基因编辑器来了!医药新闻CRISPR基因编辑技术是21世纪最受关注的生命科学突破之一。去年,首款基于CRISPR的基因编辑疗法获批上市,标志着遗传疾病治疗的新纪元。与此同时,人工智能的进步也为设计更强大的基因编辑器带来了希望。 2024年4月22日,AI蛋白质设计公司 Profluent在预印本平台bioRxiv上发表了题为:Design of highly functional genome edithttps://bydrug.pharmcube.com/news/detail/caaf4f23c9805c777a3c7947e7f137f4
20.名刊论文精选受体信号转导的笛子模型描述了介导受体内吞,并为设计基于GPCR的药物提供指导。 中国建立世界首个基因敲除狗模型 中国科学院广州生物医药与健康研究院赖学良、南京大学南京生物医药研究院高翔、广州医药研究总院应军等研究组合作,利用CRISPR/Cas9技术成功培育两只肌肉生长抑制素(MSTN)基因敲除狗,在世界上首次建立了狗的基因http://www.scichi.cn/zinecontent.php?id=1586
21.利用CRISPR/Cas9基因编辑技术构建水稻ospin9突变体以日本晴基因组序列为模板序列,以水稻OsPIN9(Os01g0802700)的第1外显子为靶点,利用CRISPR- GE在线分析工具设计20 bp的靶位点序列(图2-A),通过退火形成Oligo二聚体,将其与CRISPR-RICE连接,通过引物M13-F和PIN9-CRISPR-R扩增OsU6启动子筛选获得阳性克隆,目的片段长度为291 bp(图2-B),进一步提取质粒通过测序确http://school.freekaoyan.com/bj/caas/lunwen/2021/12-26/1640516612335073.shtml