临床生信公共数据库数据挖掘与可视化及文章套路研讨会2024年2月线上班

公共数据库的数据样本量大,免费而且选择范围广。常见的数据库有TCGA数据库和NCBIGEO数据库,里面含有大量的不同研究方向的样本高通量数据。

癌症是临床医学中非常重要的疾病方向。TCGA数据库中包含了常见了40种癌症方向的高通量数据及临床信息。大家对TCGA数据库的使用近几年也在逐渐增加!另外,其他疾病的研究可以通过GEO数据库进行。

本次培训不仅仅要大家了解多种不同的生信分析思路,学会TCGA&GEO数据库的基础操作,比如数据筛选,下载,差异分析,功能通路分析,预后分析等等,还有复杂的预后模型构建筛选风险基因的实操内容。可以说是基础分析与高级分析并存。

培训班针对生信0基础的学员进行教学,包教包会。

讲师简介:宋伟博士

成果:参与完成了近百篇软件著作权和发明专利的撰写和申请;肺癌、胰腺癌、骨肉瘤、胃癌等数据库的分析和构建;完成个体基因检测流程和无创唐筛流程的开发。

研究方向:有近十年的生信分析经验,擅长方向有转录组测序分析、芯片数据分析、疾病机理研究分析、疾病预后与基因关联分析、项目分析思路设计以及个性化分析等,精通perl、R等编程语言。

培训经历:在上海、北京、广州、沈阳、南京等城市举办过几十场培训班。

主办方:上海统循会务咨询有限公司

第1天晚上19:00-22:00(线上)

第2、3天白天9:00-18:00

会议地点:线上:腾讯网络会议室

会务费用:3200元/人

优惠政策:

1.提前确认报名及转账的,可以提前拿到学习材料

2.三人组团报名,每人优惠100元

3.四人组团报名,每人优惠200元,

4.六人组团报名缴费,可免1人参会费!

可以开正规会务发票,纸质邀请函(盖红章)。

注意事项:使用win7以上系统的电脑,现场不得录音录像。上课软件为Cytoscape,Heml,GSEA,R和Rstudio。

另外需安装腾讯会议软件。

详细日程参见日程表

TCGA&GEO数据分析及癌症预后模型构建靶标筛选日程

大纲

详细内容

第一天

晚上

19:00~20:30

生信与临床关联,以及文献解读

生物信息介绍,与临床的密切关联;

国自然前期基础研究中生信的作用。

高通量:测序及芯片介绍——不同组学:转录组学、基因组学、表观组学、顺反组学、宏基因组学等。

20:45-22:00

R语言学习

R软件与Rstudio软件下载、安装、界面。

R语言基础:元素、向量、矩阵、数组

R语言函数:计算函数、统计函数等

R语言路径确认及修改

R语言文件(图、表)的导入和导出

R语言包:常见R包的下载安装方法

第二天

9:00~10:20

TCGA数据库

NCBIGEO数据库

TCGA数据库:最全的癌症高通量数据公共库(简介)

TCGA数据库的介绍和使用(包含了转录组、基因组、表观组和临床信息数据)

GEO数据库介绍:数据量最大的高通量公共数据库。

GEO数据库的高通量芯片数据查找、筛选、探针转换、差异分析等。

茶歇

10:30~12:00

TCGA数据库癌症数据下载:RNA-seq数据、miRNA-seq数据、甲基化数据、基因组数据及临床信息数据的下载TCGA数据书库癌症数据的处理,获得关键mRNA、miRNA的表达谱矩阵。

午饭休息

13:30~15:20

差异分析及作图

GEO2R工具

R语言:差异分析limma包使用、火山图制作

15:30~17:30

数据的后续高级分析工具实战

聚类热图制作

R语言pheatmap包做聚类热图

DAVID功能富集分析——GO富集和KEGGpathway富集分析

第三天

蛋白互作分析及网络图构建美化

蛋白与蛋白互作分析(PPI)——STRING数据库

cytoscape软件:网络图构建及网络拓补学分析

筛选关键hub基因

癌症预后模型构建R语言实操

单因素及多因素cox回归分析

LASSO回归分析筛选特征因子基因

生存预后风险预测模型效能评估和比较分析

独立生存预后因素的生存率模型的构建

TCGA数据分析——突变分析、差异分析、关联分析、生存分析、miRNA调控靶基因分析等。Cbioportal数据库学习

Ualcan数据库学习

GEPIA数据库学习

15:35~17:00

思路讨论

基于GEO数据库多套数据整合(meta)分析思路

基于TCGA的lncRNA-miRNA-mRNA全转录组整合分析思路

基于TCGA的甲基化与转录组整合分析思路

基于TCGA的基因组与转录组整合分析思路

串讲

实操大串讲

备注:讲师基于windows系统讲解,请尽量使用windows电脑参加

THE END
1.[数据挖掘]对TCGA数据库的五种癌症的数据挖掘与分析1.目的通过实际数据集上的编程实践,掌握高维数据常用的数据探索与可视化技术,观察和理解“维数灾难”问题的涵义、以及相似性度量和维归约的重要性。 2.数据癌症基因图谱(The Cancer Genome Atlas Program, TCGA…https://zhuanlan.zhihu.com/p/693479933
2.生信算数据挖掘技能吗mob64ca12f062df的技术博客生信数据挖掘技能教程 数据挖掘在生物信息学(生信)领域中的应用日益受到重视,掌握一定的生信数据挖掘技能将有助于深入理解生物数据,并从中提取有价值的信息。本文旨在帮助刚入行的小白理解生信数据挖掘的流程,并提供具体的实现步骤与代码示例。 生信数据挖掘的整体流程 https://blog.51cto.com/u_16213431/11800583
3.生信技能树数据挖掘week11/4感谢生信技能树小洁老师[https://www.jianshu.com/u/c93ac360691a] 新建一个项目 在开始一项新的工作时,在R studio中新建R prohttps://www.jianshu.com/p/0e0c44b8db2f
4.生信技能树数据挖掘Day2腾讯云开发者社区生信技能树-数据挖掘Day2 Day2主要内容:向量 一、向量生成 二、单个向量操作 三、两个向量操作 四、向量筛选(取子集) 数据结构 脚本乱码了怎么办 单个向量操作 运算两个向量 1、比较运算 2、数学计算 3、连接 循环补齐原则 循环补齐发生的条件:等位运算;两个向量长度不相等https://cloud.tencent.com/developer/article/2309795
5.生信&数据挖掘——人工神经网络篇(3)差异分析生信&数据挖掘——人工神经网络篇(3)差异分析 本文介绍了基因表达差异分析(DEA)的基本原理和方法,包括logFC、P值等关键指标。文章详细展示了如何通过R语言的limma和pheatmap包对多个基因表达数据集进行合并、差异分析和可视化,最终生成差异基因的火山图和热图。https://blog.csdn.net/qq_62932195/article/details/128743699
6.微生物多样性数据挖掘生信课程百迈客基因学院微生物多样性数据挖掘生信课程 扫二维码继续学习二维码时效为半小时 47人加入学习 (0人评价) 价格 ¥1888.00 教学计划 默认教学计划 学习有效期 365 天(随到随学) 购买课程 介绍 目录 笔记(0) 评价(0) 课程介绍 本课程主要介绍基于R语言对微生物多样性基础分析结果进行基础绘图和高级分析,课程http://live.biocloud.net/course/275
7.生信大数据分析服务机构的行业四、数据挖掘 生信大数据分析服务机构通过数据挖掘技术,挖掘出隐藏在大数据中的有价值的信息。他们利用机器学习、深度学习和人工智能等技术,建立预测模型,预测基因功能、蛋白质结构和药物靶点等重要信息。这些预测结果可以为药物研发、疾病诊断和治疗提供重要参考。 http://chatgpt.cmpy.cn/article/4835242.html
8.00后博士生一作兼通讯,最新NC:转录组学分析全生态算法框架由于测序平台的技术限制以及酶解过程造成的细胞丢失,某些细胞类型在单细胞测序中有时会被遗漏,例如足细胞、中间祖细胞、神经元等。因此,开发能够应对单细胞数据中“遗漏”情况的算法工具,对于推动单细胞组学分析具有极其重要的意义。 此外,尽管组学算https://mp.weixin.qq.com/s?__biz=MzAxNzEwNjY2MA==&mid=2651134746&idx=3&sn=40a475040bceb893797fd132dc9bafc2&chksm=813aa790d0e2427f7fcdf119545e07103b578a5fd810f3cfcc83b23559c1fd9cc5913659d0a6&scene=27
9.生信技能树day9GEO数据挖掘从我们生信技能树历年的几千个马拉松授课学员里面募集了一些优秀的创作者,某种意义来说是传承了我们生信技能树的知识整理和分享的思想! 今天的是三周合计15天的数据挖掘授课学员一点一滴整理的授课知识点笔记哦,还有互动练习题哈,欢迎大家点击文末的阅读原文去关注我们学员的公众号哦! https://github.com/ixxmu/mp_duty/issues/5127
10.直播回顾单细胞测序:从样本制备到数据挖掘的全流程探讨6月8日,达普生物、高级科学家肖之夏老师为大家分享“单细胞测序生信分析及数据挖掘”的主题内容,详解生信分析概要、生信报告解读、生信数据挖掘及案例展示以及如何搭建一个好的生信平台。 其中,肖之夏老师在线仔细解读“Scaling of scRNA-seq experiments”“scRNA-seq Workflow & Application”“Reads Quality & Mappinghttps://www.yiqi.com/news/detail_23958.html
11.生信分析强助攻药物敏感性分析之oncoPredict包药物敏感性分析是生信数据挖掘常用的技能之一,目前做药敏分析最常见的就是两个R包:pRRophetic和oncoPredict。pRRophetic只适用于旧版本的R平台,最新版R平台使用这个包时可能会报错。这两个包的作者都是同一个人,oncoPredict可以看做是pRRophetic的升级版。两个R包的使用基本上思路一样,但使用的训练数据集不同。https://3g.dxy.cn/bbs/topic/50171296
12.从投稿到接收只用26天,这本出版纯生信的期刊值得关注有粉丝想找一本明确接收纯生信数据挖掘的,而且影响因子在2-3分左右,知名度不高而又不在中科院《国际期刊预警名单(试行)》名单( 2021年1月发布版)上的期刊,还有就是审稿速度比较快一点的,现在安排上了,这本期刊符合这些要求:Mathematical Biosciences and Engineering https://weibo.com/ttarticle/p/show?id=2309404664585553838188
13.生信数据挖掘软件哪个好帆软数字化转型知识库在选择生信数据挖掘软件时,可以考虑R和Bioconductor、Python和BioPython、Galaxy、GenePattern等工具。Python和BioPython是一对非常强大的工具组合,Python语言的广泛应用和丰富的库资源使其在生物信息学领域占有重要地位。BioPython库提供了大量的函数和模块,能够处理序列分析、结构生物信息学、基因组数据等多种生物信息学任务。https://www.fanruan.com/blog/article/600733/
14.生信自学网速科生物生信自学网-速科生物-免费生信视频教程,提供全方位生信数据挖掘学习,有TCGA数据挖掘,GEO表达谱芯片,SEER数据库,TARGET儿童肿瘤数据库,TCGA甲基化,网络药理学,中药复方网络药理学,16s测序,R语言,Perl语言学习,Cytoscape软件,GDSC数据库,GO富集,KEGG富集通路,https://www.biowolf.cn/
15.生信软件BioMercatorV4.2.3的详细的操作说明生信软件 BioMercator4V4.2.3最新版,进行QTL定位及其遗传图谱的构建。Biomercator用于对多个QTL 分析结果进行综合的Meta 分析,帮助育种家对数量性状的多个QTL研究结果进行综合分析,便于找到的对应基因 上传者:weixin_50905290时间:2020-10-12 医学和生信笔记公众号“生信数据挖掘”合集_R_bioinformatics.zip https://www.iteye.com/resource/weixin_50905290-12919370
16.生信分析和meta分析有什么不同生信分析和meta分析有什么不同;;生信分析是原始数据挖掘,基于高通量大数据挖掘分析,比如差异分析、富集分析、聚类分析、蛋白互做分析、预后分析等,是基础生物科研范畴,主要数据是原始芯片、测序等的高通量数据。meta分析属于文献二次挖掘,各领https://pro.biomart.cn/lab-web/que/316nrkago406q/32l4sqmgo2g85.html
17.一文带你走进单基因免疫浸润生信分析的殿堂知识中心2.如今纯生信数据挖掘不像最开始那几年随便挖一个表型都能发一篇文章,现在水涨船高,如果你挖掘到一个未曾报道的功能强大的基因,编辑第一反应就是这个表型是否可靠,第二反应就是让你拿实验进行验证。 所以,做单基因纯生信最好的打开方式就是阅读最新的文献,尤其是单细胞转录组的文章,它们会在单个细胞水平上发现很https://www.gaptech.cn/docs/ffe5ecc7-2bcd-4aed-ad14-c0a078d77fc4/
18.非肿瘤生信:与急性心肌梗死相关的关键miRNAs和靶基因的生物标志物。干生信文章中,除了基本的功能基因mRNA,以miRNA,lncRNA作为研究类型的生信文章也有很多,与mRNA生信数据挖掘的套路类似,属于花样翻新。 值得注意的是这篇文章并不是全生信,作者也做了一些湿实验。干湿结合,省去了被reviewer怼没有实验验证的情况。纯生信文章总是会落下不做实验怎能发文章的诟病。如果干湿结合,也能堵住一https://www.cnblogs.com/Ixiaozhu/p/17128712.html
19.临床生信之家临床生信之家由几位一线的临床医生和生物信息学(生信)大咖共同开发,目前已收录多达40种疾病类型数据。全站无需R语言基础,鼠标点击即可完成各种生信分析,分析结果可以用于丰富国自然标书内容,也可与湿实验结合,或进行纯生信的数据挖掘SCI文章发表。https://www.aclbi.com/
20.数据+基因组学(WGSWES和RNAseq)数据挖掘和生信分析~总结来说,CPTAC数据库是一个强大且综合性的资源,提供了丰富的肿瘤相关数据,可用于挖掘和验证差异表达基因及基因表达情况。根据不同的研究需求,结合多组学分析方法,可以深入挖掘潜在的标志物或靶点。对于生信分析有创新思路需求的小伙伴,可以随时联系番茄君,获取更多关于数据库的使用指导和分析建议。https://zhidao.baidu.com/question/1766972538563965028.html