世界首例!Nature公布最新成果,助力药物研发冲破困境,彻底改写历史! 点击上方的 行舟Drug ▲ 添加关注 在现代医疗领域,药物发现一直是最具挑战性和最昂贵的过程之一。传统的药物开发方法耗... 

最近,MichiganStateUniversity的研究团队在NatureMachineIntelligence期刊上发表了一篇重要论文,提出了一种名为TopoFormer的创新模型,巧妙地将拓扑学与深度学习相结合,为药物发现开辟了一条崭新的道路。这项研究不仅在理论上很有创意,在实际应用中也展现出了卓越的性能,有望大大加速新药研发进程。让我们一起深入了解这项激动人心的研究。

01

深度学习蛋白质设计

02

CADD计算机辅助药物设计

03

AIDD人工智能药物发现与设计

04

机器学习代谢组学

05

机器学习微生物组学

06

CRISPR-Cas9基因编辑技术

07

深度学习基因组学

08

单细胞测序及空间多组学

具体课程内容都可滑动查看

课程一、深度学习蛋白质设计

第一天

蛋白质结构及分子动力学基础

a)蛋白质设计概述

b)蛋白质结构基础

pdb文件格式详解

数据库详解

同源建模

c)分子动力学基础

分子-蛋白对接

蛋白-蛋白对接

可视化软件pymol使用

AMBER分子动力学模拟

高斯加速分子动力学模拟

模拟轨迹RG,RMSD,RMSF,二级结构变化,PCA分析

实践范例:蛋白和小分子配体的分子动力学模拟

第二天

机器学习与深度学习基本知识

a)经典模型

线性及非线性映射:线性回归、逻辑回归

聚类:K-近邻聚类

核方法:支持向量机

树方法:决策树、随机森林

神经网络:多层感知机

机器学习药物筛选分类案例实操

b)深度学习

深度神经网络DNN

卷积神经网络CNN

循环神经网络RNN

深度学习常用的loss介绍

模型评估与优化方法

评估指标:准确率、召回率、F1分数等

优化方法:正则化、Dropout等

超参数调优

超参数对于模型的影响

网格搜索、随机搜索

基于蛋白和分子图结构的深度学习案例实操

c)前沿架构原理及实操

Transformer

BERT

GPT

ViT

第三天

蛋白结构预测及其下游应用

a)蛋白结构预测背景介绍

b)Rosettafold和alphafold

AF和AF2的差异与创新

AF3的差异与创新

Alphafold使用详解

AlphaFold3和AlphaFold2的区别(包含实践示范:如何使用AlphaFold3大模型开源服务器进行蛋白质结构预测以及相互作用预测)

Rosettafold详解

c)基于Alphafold的下游应用

基于AF的蛋白-蛋白对接/蛋白-多肽对接

利用AF2做多构象预测和功能发现

基于AF2的环肽设计

d)trrosetta幻想设计

e)基于ProteinMPNN的蛋白质设计

MPNN模型简介

设计流程

方法比较

第四天

蛋白质的从头生成模型

a)扩散模型

b)RFdiffusion实现蛋白结构设计

蛋白Binder生成

蛋白骨架设计

单体蛋白从头生成

多聚体蛋白从头生成

RoseTTAFoldAll-Atom大模型的介绍

c)Chroma的基本构架与实现

蛋白构象空间全空间采样

d)ProteinGenerator蛋白质骨架与序列设计

与rfdiffusion的异同

e)蛋白设计案例实操

第五天

lecture5蛋白大语言模型的应用

a)ProGEN与ProGEN2

模型构架讲解

与基于结构方法的比较

性能与改进

b)ESM-fold

ESM-fold的基本架构

ESMfold网络讲解

ESMFold大模型的实操

与alphafold方法的对比

ESM-fold的性能评估

c)基于大语言模型的下游应用

孤儿蛋白结构的预测

大型蛋白复合物结构预测

d)多肽设计概览

基于RFdiffusion实现多肽设计

e)妙用ChatGPT

GPT直接用于生物体系的探索

-------------------------------------------------

课程二、CADD计算机辅助药物设计

导论与基础

1.蛋白质三维结构的预测对于药物发现的重要性

1.1同源建模

1.2从头建模

2.蛋白质(酶/靶点)活性位点在药物发现的重要性

3.药物发现中的关键结构特征(特别是小分子)

4.药物辅助发现常用的计算方法

4.1分子对接

4.2虚拟筛选

4.3分子动力学模拟

4.4其他

PDB数据库的介绍

1.1检索蛋白

1.2页面功能及解读

1.3数据的下载

1.4PDB文件格式的解读

2.PyMol

2.1软件介绍

2.2基本操作介绍

2.3蛋白及小分子表面图、静电势表示

2.4绘制相互作用图及制作简单动画

1.同源建模原理介绍

1.1同源建模的功能及使用场景

1.2同源建模的方法

2.Swiss-Model同源建模;

2.1同源蛋白的搜索(blast等方法)

2.2蛋白序列比对

2.3蛋白模板选择

2.4蛋白模型搭建

2.5模型评价(蛋白拉曼图)

2.6蛋白模型优化

实例讲解与练习:用2019-nCoVspike蛋白序列建模,根据相应参数和方法评价模型

小分子构建

1.ChemDraw软件介绍

1.1小分子结构构建

1.2小分子理化性质(如分子量、clogP等)计算

1.3分别构建大环、氨基酸、DNA、RNA等分子

小分子化合物库

2小分子数据库

2.1DrugBank、ZINC、ChEMBL等数据库介绍及使用

2.2天然产物、中药成分数据库介绍及使用

分子对接基础

1.1分子对接原理

1.2分子对接分类

1.3分子对接打分函数

2.常规分子对接实践

2.1对接的执行

2.1.1药物分子配体的准备

2.1.2蛋白受体的准备

2.1.3受体格点计算

2.1.3执行半柔性对接

对接结果评价

1.2.1晶体结构构象进行对比

1.2.2能量角度评价对接结果

1.2.3聚类分析评价对接结果

1.2.4最优结合构象的选择

2对接其他方式的实现

1柔性对接

1.1小分子配体优化准备

1.2蛋白受体的准备

1.3柔性残基的定义

1.4蛋白受体格点计算

1.5柔性对接计算及结果评价

1.6半柔性对接与柔性对接比较与选择

2柔性对接其他方式的实现

下午

基于受体的药物发现

1虚拟筛选的准备

1.1小分子文件的不同格式

1.2openbabel最实用功能的介绍

1.3小分子不同格式的转化

2.基于对接的虚拟筛选

2.1虚拟筛选定义、流程构建及演示

2.2靶点蛋白选择、化合物库获取

2.3虚拟筛选

2.4结果分析(打分值、能量及相互作用分析)

一些特殊的分子对接

1.小分子-小分子对接

1.1小分子-小分子相互作用简介

1.2小分子结构预处理

1.3小分子-小分子对接(糖-小分子为例)

1.4对接结果展示与分析

2.蛋白-核酸对接

3.蛋白-蛋白对接

基于配体的药物发现

1.3D-QSAR模型构建(Sybyl软件)

1.1小分子构建

1.2创建小分子数据库

1.3小分子加电荷及能量优化

1.4分子活性构象确定及叠合

1.5创建3D-QSAR模型

1.6CoMFA和CoMSIA模型构建

1.7测试集验证模型

1.8模型参数分析

1.9模型等势图分析

1.103D-QSAR模型指导药物设计

第六天

1.linux系统介绍

2.常用命令介绍

3.linux上程序的安装(gromacs)

MD实践一:溶剂化下蛋白质分子动力学模拟

全面熟悉分子动力学模拟的一般流程

第七天

MD实践二:溶剂化下蛋白质-配体的分子动力学模拟

掌握处理非标准残基的力场拟合

分子动力学模拟中的常用分析命令

-----------------------------------------

案例图片:

课程三、AIDD人工智能药物发现

1人工智能药物发现(AIDD)简介

2机器学习和深度学习在药物发现领域的应用

2.1分子属性预测与优化

2.2虚拟筛选

2.3药物副作用预测与安全性评估

2.4新药分子设计

3工具介绍与安装

3.1Anaconda3/Pycharm安装

3.2Numpy基础

3.3Pandas基础

3.4Matplotlib基础

3.5Scikit-learn基础

3.6Pytorch基础

3.7RDKit基础

1机器学习简介

1.1机器学习四要素

1.2数据模块

1.3核心和高级API

2回归算法与应用

2.1线性回归

2.2Lasso回归

2.3Ridge回归

2.4ElasticNset弹性网络

3分类算法与应用

3.1逻辑回归

3.2朴素贝叶斯

3.3KNN

3.4SVC

3.5决策树

3.6随机森林

3.7集成学习

4聚类算法

4.1KMeans

4.2密度聚类DBSCAN

5降维

5.1奇异值分解SVD

5.2主成分分析PCA

5.3非负矩阵分解NMF

6模型的评估方法和评价指标

6.1超参数优化

6.2交叉验证

6.3评价指标

7特征工程

8机器学习药物发现案例(一)

——化合物生物活性分类模型

9机器学习药物发现案例(二)

——化合物生物活性回归模型

10机器学习药物发现案例(三)

——药物副作用预测模型

1深度学习与药物发现(一)

1.1深度神经网络

1.2正向和反向传播

1.3优化方法

1.3.1梯度下降增加动力

1.3.2自适应学习

1.3.3Adam

1.4损失函数

1.4.1平均绝对误差

1.4.2均方误差损失函数

1.4.3交叉熵损失函数

1.5卷积神经网络

1.5.1卷积层

1.5.2填充和步幅

1.5.3池化层

1.5.4LeNet网络

1.5.5AlexNet网络

2深度学习药物发现案例(一)

——药物-药物相互作用预测模型

1深度学习与药物发现(二)

1.1循环神经网络

1.2消息传递神经网络

1.3图卷积神经网络

1.4图注意力神经网络

1.5图采样和聚合

2深度学习药物发现案例(二)

——药物靶标相互作用预测模型

3深度学习药物发现案例(三)

——药物重定位模型

1深度学习与药物发现(三)

1.1注意力机制

1.2自注意力模型

1.3多头自注意力模型

1.4交叉注意力模型

1.5Transformer模型

2深度学习药物发现案例(四)

3深度学习药物发现案例(五)

——药物靶标结合亲和力预测模型

课程四、机器学习代谢组学

A1代谢物及代谢组学的发展与应用

(1)代谢与生理过程;

(2)代谢与疾病;

(3)非靶向与靶向代谢组学;

(4)空间代谢组学与质谱成像(MSI);

(5)代谢组学与药物和生物标志物;

(6)代谢流与机制研究。

A2代谢通路及代谢数据库

(1)几种经典代谢通路简介;

(2)三大常见代谢物库:HMDB、METLIN和KEGG;

(3)代谢组学原始数据库:MetabolomicsWorkbench和Metabolights.

A3参考资料推荐

A4代谢组学实验流程简介

A5色谱、质谱硬件与原理解析

(1)色谱分析原理与构造;

(2)色谱仪和色谱柱的选择;

(3)色谱的流动相:梯度洗脱法;

(4)离子源、质量分析器与质量检测器解析;

(5)质谱分析原理及动画演示;

(6)色谱质谱联用技术(LC-MS);

B1代谢物样本处理与抽提

(1)各种组织、血液和体液等样本的提取流程与注意事项;

(2)代谢物抽提流程与注意事项;

(3)样本及代谢物的运输与保存问题;

B2LC-MS数据质控与搜库

(1)LC-MS实验过程中QC和Blank样本的设置方法;

(2)LC-MS上机过程的数据质控监测和分析;

(3)代谢组学上游分析原理——基于CompoundDiscoverer与Xcms软件;

(4)Xcms软件数据转换、提峰、峰对齐与搜库;

B3R软件基础

(1)R和Rstudio的安装;

(2)Rstudio的界面配置;

(3)R中的基础运算和统计计算;

(4)R中的包:包,函数与参数的使用;

(5)R语言语法,数据类型与数据结构;

(6)R基础画图;

B4ggplot2

(1)ggplot2简介

(2)ggplot2的画图哲学;

(3)ggplot2的配色系统;

(4)ggplot2数据挖掘与作图实战;

机器学习

C1有监督式机器学习在代谢组学数据处理中的应用

(1)人工智能、机器学习、深度学习的关系;

(2)回归算法:从线性回归、Logistic回归与Cox回归讲起;

(3)PLS-DA算法:PCA降维后没有差异的数据还有救吗?

(4)VIPscore的意义及选择;

(5)分类算法:决策树,随机森林和贝叶斯网络模型;

C2一组代谢组学数据的分类算法实现的R演练

(1)数据解读;

(2)演练与操作;

C3无监督式机器学习在代谢组学数据处理中的应用

(1)大数据处理中的降维;

(2)PCA分析作图;

(3)三种常见的聚类分析:K-means、层次分析与SOM

(4)热图和hcluster图的R语言实现;

C4一组代谢组学数据的降维与聚类分析的R演练

(1)数据解析;

D1在线代谢组分析网页Metaboanalyst操作

(1)用R将数据清洗成网页需要的格式;

(2)独立组、配对组和多组的数据格式问题;

(3)Metaboanalyst中的上游分析(原始数据峰提取、峰对齐与搜库)(4)Metaboanalyst的pipeline以及参数设置和注意事项;

(5)Metaboanalyst的结果查看和导出;

(6)Metaboanalyst的数据编辑;

(7)全流程演练与操作。

D2代谢组学数据清洗与R语言进阶

(1)代谢组学中的t、fold-change和响应值;

(2)数据清洗流程;

(3)R语言tidyverse;

(4)数据预处理:数据过滤与数据标准化(样本的Normalization和代谢物的Scaling);

(5)代谢组学数据清洗演练;

E1文献数据分析部分复现(1篇)

(1)文献深度解读;

(2)实操:从原始数据下载到图片复现;

(3)学员实操。

E2机器学习与代谢组学顶刊解读(3篇);

(1)SignalTransductionandTargetedTherapy一篇有关饥饿对不同脑区代谢组学影响变化的小鼠脑组织代谢图谱类的文献;(数据库型)

(2)Cell一篇代谢组学孕妇全程血液代谢组学分析得出对孕周和孕产期预测的代谢标志物的文献;(生物标志物型)

(3)Nature一篇对胰腺癌患者肠道菌群的代谢组学分析找到可以提高化疗效果的代谢物的文献。(机制研究型)

课程五、机器学习微生物组学

1.微生物学基础知识回顾

2.机器学习基本概念介绍

a.什么是机器学习

b.监督学习、无监督学习

c.常用机器学习模型介绍

3.混淆矩阵

4.ROC曲线

R语言简介与实操

1.R语言概述

2.Rstudio软件与R包安装

3.R语言语法及数据类型

4.条件语句和循环

Linux实操

1.Linux操作系统

2.Linux操作系统的安装与设置

3.网络配置与服务进程管理

5.常用的Linux命令

6.在Linux下获取基因数据

7.Shellscript与Vim编辑器下·

微生物组常用分析方法(实操)

1.微生物丰度分析

2.转录组丰度分析

3.进化树分析

4.降维分析

1.疾病预测应用:利用机器学习基于微生物组学数据预测疾病状态

2.肠道菌群研究:机器学习研究饮食对肠道微生物的影响

机器学习模型训练和分析(实操)

1.加载数据及数据归一化

2.构建训练模型(GLM,RF,SVM)

3.模型参数优化

4.模型错误率曲线绘制

5.混淆矩阵计算

6.重要特征筛选

7.模型验证,ROC曲线绘制利用模型进行预测

利用机器学习基于微生物组学数据预测宿主表型

1.加载数据

2.数据归一化

3.OUT特征处理

4.机器学习模型构建(RF,KNN,SVM,Lasso等多种机器学习方法)

5.绘制ROC曲线,比较不同机器学习模型模型性能评估

利用机器学习基于临床特征和肠道菌群预测疾病风险

2.机器学习模型构建(RF,gbm,SVM等等)

3.交叉验证

4.模型性能评估

课程六、CRISPR-Cas9基因编辑

基因编辑简介

1.基因编辑基本概念介绍

2.使用单基因遗传病数据库(实操)

3.5524种单基因遗传病的发病率及对应基因

4.使用网站查找突变位点周围碱基选择基因编辑工具(实操)

5.基因编辑历史

6.TALEN

7.Zincfinger

8.Baseeditor

9.Primeeditor

1.如何选择正确Cas9蛋白类型

2.单碱基编辑(baseeditor)gRNA设计和软件(实操)

3.sgRNA修饰

4.手动设计PegRNA的八个要点(实操)

5.七种PegRNA辅助设计软件

6.查找不同PAM的Cas9的碱基序列

8.如何设计深度测序(NSG)所需的引物

9.如何准备深度测序(NGS)所需样品

10.Sleepingbeauty

11.PiggyBac

12.肽核酸Peptidenucleicacids

13.外显子跳读Exonskipping

14.介绍CRISPRknockout库(GeCKOv2.0)

15.简单介绍Baseediting在微生物中的应用

1.AAV递送(组织靶向)

2.脂质体递送

3.核糖核蛋白递送

4.高分子递送

5.Virallikeparticles递送

6.外泌体递送

7.无机纳米粒递送

8.电转

9.超声

10.显微注射

12.Cas9-DNA-gRNA晶体结构

13.单基因遗传病细胞订制

14.单基因遗传病动物模型定制

1.动物模型

2.质粒

3.分子克隆基础

4.AAV设计(实操)

7.如何提高Primeediting效率

9.如何提高Primeediting效率

10.NGS引物设计

11.NGS测序结果分析

1.基因编辑已经批准的药物

2.临床试验

3.主要公司、科学家和专利

4.副作用和退市的产品

5.FDA政策

6.CRISPR在诊断中的应用

7.CRISPRlibrary

8.CRISPR与单细胞测序

9.CRISPR与表观遗传学

10.CIRPSR在植物学中的应用

11.CRISPR在微生物学中的应用

12.NGS类型及原理

13.3个基因序列的数据库(涵植物基因)

14.2023年BE和PE领域热点

15.设计课题与评价(实操)

课程七、深度学习基因组学

理论部分

深度学习算法介绍

1.有监督学习的神经网络算法

1.1全连接深度神经网络DNN在基因组学中的应用举例

1.2卷积神经网络CNN在基因组学中的应用举例

1.3循环神经网络RNN在基因组学中的应用举例

1.4图卷积神经网络GCN在基因组学中的应用举例

2.无监督的神经网络算法

2.1自动编码器AE在基因组学中的应用举例

2.2生成对抗网络GAN在基因组学中的应用举例

实操内容

1.1常用的Linux命令

1.2Vim编辑器

1.3基因组数据文件管理,修改文件权限

1.4查看探索基因组区域

2.Python语言基础

2.1.Python包安装和环境搭建

2.2.常见的数据结构和数据类型

基因组学基础

1.基因组数据库

2.表观基因组

3.转录基因组

4.蛋白质组

5.功能基因组

基因组常用深度学习框架

1.安装并介绍深度学习工具包tensorflow,keras,pytorch

2.在工具包中识别深度学习模型要素

2.1.数据表示

2.2.张量运算

2.3.神经网络中的“层”

2.4.由层构成的模型

2.5.损失函数与优化器

2.6.数据集分割

2.7.过拟合与欠拟合

3.基因组数据处理

3.1安装并使用keras_dna处理各种基因序列数据如BED、GFF、GTF、BIGWIG、BEDGRAPH、WIG等

3.2使用keras_dna设计深度学习模型

3.3使用keras_dna分割训练集、测试集

3.4使用keras_dna选取特定染色体的基因序列等

卷积神经网络CNN在基因调控预测中的应用

1.Chip-Seq中识别基序特征G4,如DeepG4

2.Chip-Seq中预测DNA甲基化,DeepSEA

3.Chip-Seq中预测转录调控因子结合,DeepSEA

复现卷积神经网络CNN识别基序特征DeepG4、非编码基因突变DeepSEA复现DeepG4从Chip-Seq中识别G4特征

1.安装selene_sdk,复现DeepSEA从Chip-Seq中预测DNA甲基化,非编码基因突变

深度学习在识别拷贝数变异DeepCNV

1.SNP微阵列中预测拷贝数变异CNV,DeepCNV

2.RNA-Seq中预测premiRNA,dnnMiRPre

1.复现DeepCNV利用SNP微阵列联合图像分析识别拷贝数变异

2.复现循环神经网络RNN工具dnnMiRPre,从RNA-Seq中预测premiRNA

深度学习在识别及疾病表型及生物标志物上的应用

1.从基因表达数据中识别乳腺癌分型的深度学习工具DeepType

1.复现DeepType,从METABRIC乳腺癌数据中区分乳腺癌亚型

深度学习在预测药物反应机制上的应用

1.联合肿瘤基因标记及药物分子结构预测药物反应机制的深度学习工具SWnet

1.预处理药物分子结构信息

2.计算药物相似性

3.在不同数据集上构建self-attentionSWnet

4.评估self-attentionSWnet

5.构建多任务的SWnet

6.构建单层SWnet

7.构建带权值层的SWnet

课程八、单细胞测序及空间多组学

信基础培训basicsofbioinforma,c

什么是单细胞测序技术(以10X为例)?单细胞测序技术的应。

Commandline基础知识,什么是commandline

Commandline的基本语法

Shellscripts

如何在HPC(highperformancecluster)上提交作业

R基础知识与单细胞数据分析具的准备

RandRStudio的安装

常R包的安装

Seurat,ggplot2等常包的语法介绍

单细胞基础理论知识与质控分析

单细胞实验设计

单细胞数据产

Cellranger的使以及结果件的解析

单细胞数据的读写,质量图谱解析

单细胞数据质控参数的选择与质控分析

质控后单细胞数据质量图谱展示及结果分析

单细胞数据下游分析I

单细胞数据标准化过程以及降维分析

单细胞数据的ScMransforma5on分析

标准化后的单细胞数据的聚类分析

Doublet检测

细胞注释

单细胞数据下游分析II

样品间的基因表达差异分析

富集分析

Markergenes识别

不同批次数据的整合分析

实际案例解析

学习目标

基于深度学习的蛋白设计模型近几年来发展如火如荼,本课程围绕计算结构生物学与蛋白设计基础与前沿工作展开讲述,从蛋白结构的预测与优化到蛋白的从头设计进行深度教学,本课程面向不同类型的学员,既会对基础知识进行详细讲解,又会结合前沿文献和案例讲解技术的实操落地。通过本次培训学员将理解蛋白质设计的底层逻辑,掌握多种计算生物学技能,具备将蛋白质设计算法与湿实验结合的基础能力,助力学员的科研工作更上一层楼。

掌握包括PDB数据库、靶点蛋白、蛋白质-配体、蛋白-配体小分子、蛋白-配体结构、notepad的介绍和使用、分子对接、蛋白-配体对接、虚拟筛选、蛋白-蛋白对接、蛋白-多糖分子对接、蛋白-水合对接、Linux安装、gromacs分子动力学全程实操、溶剂化分子动力学模拟

深入学习与了解深度学习基本框架与逻辑,同时掌握基本的生物信息学软件(Linux、R、python等)的使用,让学员能更好的应对基因组数据,挖掘出超越已有知识的新知识。而构建好的深度学习模型去探求新的研究思路和寻找新的潜在生物学机制,更好的服务于自身的科学研究和探索的过程中。

课程将涵盖机器学习技术在微生物数据分析中的应用,包括基因组序列分析、基因调控网络构建和多组学数据整合等,并带领学员们深度使用R语言,Python语言实地操作演示。

CRISPR-Cas9基因编辑

本课程聚焦单细胞测序技术,以10x为例,通过讲解单细胞测序技术原理及应,单细胞测序技术的产,数据的质控,分析。通过实例分析深学习基本物信息分析的基本具,常规物信息领域的数据格式解读与分析,单细胞测序数据的分析与出图。经过本课程学习,学员将有能独任何类型的单细胞数据。并将结果应于相应的学术章的发表以及指导实际临床研究。

讲师介绍

主讲老师及团队来自于top2顶尖AI开发课题组以及985高校计算生物学课题组,发表JCIM,CIBM等权威计算期刊以及ACL等顶会20余篇,拥有多个计算方法助力实验的课题经验,曾担任Iscience,CIBM,TBSD等多个期刊审稿人。

主讲老师来自国内高校、中科院等单位,老师主要擅长深度学习、机器学习、药物虚拟筛选、计算机辅助药物设计、人工智能药物发现、分子对接、分子动力学等方面的研究

主讲老师刘老师,生物信息学PI,有十余年的测序数据分析经验。研究领域涉及人工智能、自然语言处理、功能基因组学、转录组学、miRNA及靶基因网络分析,单细胞测序数据分析,基因调控网络时序分析,蛋白质互作网络分析,多组学联合分析等。主持省自然科学基金等项目4项,发表SCI论文23篇,论著一部。

主讲老师来自清华大学博士,研究方向包括生物信息学、机器学习与微生物基因组学,大模型与蛋白质定向进化等。同时他在图神经网络和疾病药物靶向等知识图谱技术方面有丰富的经验,带领并指导多次团队在国际基因工程竞赛(iGEM)中获得国际金牌,并一作发表了多篇一区高水平SCI论文。

主讲师陈师,加州学戴维斯分校物信息学领域博,加州学旧分校物信息学博后。前在知名物公司从事物信息分析。具有多年的微物全基因组,微物遗传抗病分析,肿瘤遗传变异分析(soma5cmuta5onsandgermlinemuta5ons),单细胞以及空间转录组学数据分析等,并开发了检测肿瘤样品CNVs。以第或共同作者发表章在GenomeBiology,Cell等知名期刊。

2024.08.13-2024.08.14全天授课(上午9:00-11:30下午13:30-17:00)2024.08.15-2024.08.16晚上授课(晚19:00—晚22:00)

2024.08.20-2024.08.21全天授课(上午9:00-11:30下午13:30-17:00)

2024.08.08-2024.08.09全天授课(上午9:00-11:30下午13:30-17:00)2024.08.17-2024.08.19全天授课(上午9:00-11:30下午13:30-17:00)

2024.08.24-2024.08.25全天授课(上午9:00-11:30下午13:30-17:00)

AIDD人工智能药物发现

2024.08.03-2024.08.04全天授课(上午9:00-11:30下午13:30-17:00)2024.08.06-2024.08.07晚上授课(晚19:00—晚22:00)

2024.08.08-2024.08.09全天授课(上午9:00-11:30下午13:30-17:00)

2024.08.10-2024.08.11全天授课(上午9:00-11:30下午13:30-17:00)2024.08.17-2024.08.18晚上授课(晚19:00—晚22:00)

2024.08.10-2024.08.11全天授课(上午9:00-11:30下午13:30-17:00)2024.08.17-2024.08.18全天授课(上午9:00-11:30下午13:30-17:00)

2024.08.04-2024.08.05全天授课(上午9:00-11:30下午13:30-17:00)2024.08.10-2024.08.11全天授课(上午9:00-11:30下午13:30-17:00)

2024.08.12全天授课(上午9:00-11:30下午13:30-17:00)

2024.08.13-2024.08.14全天授课(上午9:00-11:30下午13:30-17:00)2024.08.17-2024.08.18全天授课(上午9:00-11:30下午13:30-17:00)

2024.08.24全天授课(上午9:00-11:30下午13:30-17:00)

报名费用

深度学习蛋白质设计课程价格:

公费价:每人每班¥6380元(含报名费、培训费、资料费)

自费价:每人每班¥5880元(含报名费、培训费、资料费)

CADD计算机辅助药物设计;AIDD人工智能药物发现;机器学习与代谢组学;深度学习基因组学;机器学习微生物;CRISPR-Cas9基因编辑;单细胞测序及空间多组学课程价格:

公费价:每人每班¥5880元(含报名费、培训费、资料费)

自费价:每人每班¥5480元(含报名费、培训费、资料费)

优惠政策:

优惠一:报二赠一10880元(原价17140,可任选三门课学习)

优惠二:报四赠二18880元(原价35280,可任选六门课学习)

特惠:全部报名25880元(两年内可免费学习本公司举办的任何课程,不限次数)

早鸟福利:转发朋友圈或转发50人以上群聊即可获得300元现金红包(只限前15名)

THE END
1.数据挖掘概念(AnalysisServices有关如何将 SQL Server 工具应用于业务方案的示例,请参阅数据挖掘基础教程。 定义问题 与以下关系图的突出显示相同,数据挖掘过程的第一步就是明确定义业务问题,并考虑解答该问题的方法。 该步骤包括分析业务需求,定义问题的范围,定义计算模型所使用的度量,以及定义数据挖掘项目的特定目标。这些任务转换为下列问题: https://technet.microsoft.com/zh-cn/library/ms174949(en-us,sql.105).aspx
2.网络资源:数据挖掘实战1(电力窃漏电用户识别)本次学习我们将使用“什么是数据挖掘”中的挖掘过程:根据实际问题定义挖掘目标、取什么样的原始数据、对原始数据的探索分析、如何对数据进行处理、建立合适的模型完成目标、评估模型完成的好不好。 问题背景:实际生活中,有很多人可能会偷别人的电用,或者计量电量的设备坏了,造成无法根据实际用电情况计价,可能导致用户多https://nonlinear.wtu.edu.cn/info/1117/1665.htm
3.艺术档案数字化民间艺术的数字化涉及信息的采集、处理和储存,这其中包含采集设备的选择、数据处理方式、储存格式和数据库技术。但是截止到目前,并没有一个全国统一的数据加工规范或标准,无论在民间艺术普查阶段还是在名录项目申过程中,都不同程度存在一些问题,具体表现在:数据资料保存很好,但标示和描述很差,以至于使潜在的用户无法了解https://www.zboao.com/cgal/8068.html
4.AI知识图谱:机器学习深度学习数据分析数据挖掘「附脑图」数据挖掘与数据分析两者紧密相连,具有循环递归的关系,数据分析结果需要进一步进行数据挖掘才能指导决策,而数据挖掘进行价值评估的过程也需要调整先验约束而再次进行数据分析。 数据量上:数据分析的数据量可能并不大,而数据挖掘的数据量极大。 约束上:数据分析是从一个假设出发,需要自行建立方程或模型来与假设吻合,而数据挖https://www.iyong.com/displaynews.html?id=2974432318981056
5.科学网—一门新的学说《逻辑结构与逻辑工程学》逻辑方程通过代入海量常量求出海量变量的值,实现海量数据方程挖掘。方程由方程项、连接符和等号组成,一个方程项就是一个逻辑函数。逻辑函数第一步把不同类型的函数项通过求指数和加权转化成同一类型,用同一类型的连接符连接,逻辑函数仍然通过求指数和加权形成方程项,用同一类型连接符连接。求逻辑变量的过程是构建逻辑https://blog.sciencenet.cn/blog-3482188-1294934.html
6.15个热门开源免费的数据挖掘数据分析数据质量管理工具数据分析旨在从海量业务数据中获得有用信息,以便更好地为决策服务。 数据分析的完整流程图 数据挖掘,顾名思义,就像从沙子中挖掘黄金。 数据挖掘全过程 数据质量含义还是比较好理解的。简单一点来说,就是对数据进行的质量检测。这个就不过多解释。 数据质量问题 https://www.51cto.com/article/777596.html
7.王树森ReinforcementLearning学习笔记(ing)(2)马尔可夫决策过程的状态转移概率和奖励函数不仅取决于智能体当前状体,还取决于智能体选取的动作。 例子:学生马尔可夫决策过程 解释:黄色字体表示学生采取的动作,框图表示MRP的状态名(避免混淆隐去),R表示奖励函数,其与学生所采取的动作有关。注意:当学生选择“去查阅文献pub”这个动作时,则将进入一个临时状态(图https://zhuanlan.zhihu.com/p/10389734563
8.深度详解:对象检测和图像分割的数据探索过程数据挖掘对于图像分割和目标检测的需要 数据探索是很多机器学习过程的关键。也就是说,当涉及到目标检测和图像分割数据集时,没有直接的方法进行系统地数据探索。 在处理常规图像数据集和分割图像数据集时,有很多东西是可以区分的: 标签被强绑定在图像上。您必须非常小心对图像所做的任何操作,因为它可能破坏图像-标签-https://www.flyai.com/article/703
9.图像分类综述医学图像数据挖掘 图像检测 遥感图像分类 1.5 图像分类的基本过程 基本操作是建立 图像内容的描述,然后利用机器学习方法学习图像类别,最后利用学习得到的模型对未知图像进行分类。 一般来说,图像分类性能主要与图像特征提取和分类方法密切相关。图像特征提取是图像分类的基础,提取的图像特征应能代表各种不同的图像属性; https://www.jianshu.com/p/dc1c81e42897
10.数据挖掘简介数据挖掘是指一个完整的过程,该过程从大型数据库中挖掘先前未知的,有效的,可实用的信息,并使用这些信息做出决策或丰富知识. 数据挖掘环境可示意如下图: 数据挖掘环境框图.gif 2、数据挖掘过程图 下图描述了数据挖掘的基本过程和主要步骤 数据挖掘的基本过程和主要步骤 https://blog.csdn.net/quanzaiwoxin1/article/details/108234828
11.图挖掘算法gSpan元気森林近年来,图挖掘作为,数据挖掘的重要组成部分引起了社会各界的极大关注。图挖掘(Graph Mining)是指利用图模型从海量数据中发现和提起有用知识和信息的过程。通过图挖掘所获取的知识和信息已广泛应用于各种领域,如商务管理、市场分析、生产控制、科学探索和工程设计。 https://www.cnblogs.com/-402/p/16450309.html
12.数据挖掘原理算法及应用章(8)第8章复杂类型数据挖掘 1.空间数据来源和类型繁多,概括起来主要有以下几种类型:(1)地图数据:来源于各种类型的普通地图和专题地图,这些地图的内容丰富,图上实体间的空间关系直观,实体的类别和属性清晰,实测地形图还具有很高的精度。(2)影像数据:主要来源于卫星遥感和航空遥感,包括多平台、多层面、多种https://wenku.baidu.com/view/3328fe8c81c4bb4cf7ec4afe04a1b0717ed5b317.html
13.网络图的motif发现算法研究网络图的motif发现算法研究,图挖掘,数据挖掘,图同构,并行计算,网络图中的motif是一种连通的导出子图,并且满足在原图中出现的次数比它在随机图中出现的次数多很多。这种性质可以解释成这种子图https://wap.cnki.net/lunwen-1015559524.html
14.低代码RPA和AI,有什么区别腾讯云开发者社区头图| 下载于视觉中国 在To B领域,低代码、RPA和AI可谓是“流量担当”,它们自带To B基因,搭载快速发展的企业服务赛道,在企业级IT服务这一细分市场崭露头角。以这三者为代表的前沿理念和科技引领IT产业升级将是To B领域重要的长期趋势。 本文我们将通过对低代码、RPA、AI当下火热背后的观察,以微知著,探索企业级https://cloud.tencent.com/developer/article/2282164
15.图数据库发展综述典型的图挖掘算法包括频繁子图、三角形计数等. 频繁子图算法用于枚举在图中所有出现次数超过设定阈值的子图, 一般采用自底向上(即扩展图规模)的挖掘策略, 包括基于Apriori的Apriori-MaxGraph算法、基于FP-增长的MARGIN算法等. 该类算法缺点在于挖掘过程中需经过多次迭代及多次子图同构的判断, 且子图同构的判断属于NPhttps://c-s-a.org.cn/html/2022/8/8713.html
16.图挖掘技术在京东广告流量风控上的应用与实践目前初步设计出图挖掘算法平台的框架并在不断的进行优化和建设中,未来希望能够建设成为一个具有支持较多主流图挖掘算法的基础算法平台,能够支持 billion 量级、超大规模风控场景下的图挖掘应用需求,设计初期的图挖掘算法平台的架构(图5)。 图5:图挖掘算法平台主要包含六层,从下到上依次为数据层(由业务数据封装成的https://maimai.cn/article/detail?fid=1567807199&efid=OaWNb5R1UOE_ZaDNI3D1mg