lncRNA实战项目第六步

因为样本数量比较可观,所以可以进行WGCNA分析。这里是并不需要选取所有的基因来做WGCNA分析,挑选的标准可以是top变异程度大的基因集合,或者显著差异表达的基因集合等等。

google搜索或在生信技能树和生信菜鸟团搜索WGCNA,能找到很多教程,下面列出几个中文教程和英文教程,强烈推荐中文教程1和英文教程3。

WGCNA输入文件需要一个表达矩阵,最好是RPKM或其他归一化好的表达量,还需要一个矩阵关于临床信息或者其它关于样本属性的信息。

原始数据包含64个样本,9904个lncRNA表达量,这时的矩阵行为基因,列为样本信息,其中第一列是lncRNAID,(这里的lncRNAID是cufflinks组装时给的自由的ID,是需要和已有的ID对应,对于新的转录本再通过nr/nt等数据库注释),第66列是作者给出的注释(我查了几个注释有的也查不出来是什么意思)。

这里有64个样本,包含猕猴脑不同空间区域,不同发育时期,以及性别,因为每个样本都交叉包含着三种不同的信息,如果选择全部表型信息,我试了试,后续的模块和性状完全看不清关系,所以我这里仅选择脑不同区域的表型信息,包括CB、DG、PFC、PCC、CA1、OC、PC、TC。

WGCNA针对的是基因进行聚类,而一般我们的聚类是针对样本用hclust即可,也就是说要转置为行表示样本,列表示基因。

datExpr和datTraits准备好后,接下来就是构建基因网络,鉴定模块。网络构建有三种方法:1)一步法构建网络;2)多步法构建网络;3)block-wise构建网络(主要针对大数据集)。下面的介绍的步骤是一步法构建网络。

选择合适的“软阀值(softthresholdingpower)”beta,用到的函数是pickSoftThreshold,pickSoftThreshold(datExpr,powerVector=powers,verbose=5),powerVector可以是一系列数值,从而选择最优值。这个函数返回一个列表,第一项是powerEstimate是估计的最优power;第二项是fitIndices是详细的矩阵数据,其中第五列是mean.k表示平均“连接度(connectivity)”。

Constructingaweightedgenenetworkentailsthechoiceofthesoftthresholdingpowertowhichco-expressionsimilarityisraisedtocalculateadjacency.

最佳beta值是3。

一步法构建网络,使用函数blockwiseModules(),这个函数包含很多参数,其中power=sft$powerEstimate=3即上一步得到的最佳软阈值;maxBlockSize默认为5000,表示在这个数值内的基因将整体被计算,如果调大需要更多的内存;numerricLabels默认为返回颜色,设置为TRUE则返回数字;mergeCutHeight是合并模块阈值的一个参数。

上一步的返回结果是一个列表,可以用table()函数查看,0表示没有任何module接受。table(net$colors)可以看总共有多少模块,每个模块的大小,这里共有9个模块,从1-9每个模块的大小是递减的,从2254-115,0表示这些基因不在所有模块内。

dendrograms表示在一个block中所有基因的进化树图,使用函数plotDendroAndColors()查看系统发生树;blockGenes是一个block中所有的基因。

MEs是一个关于modules的特征量矩阵,行数等于筛选的modules数,列数等于样本数;

提取基因信息,可以做GO/KEGG等分析,进而解释这些module的生物学意义。这里的lncRNAID转换着有点麻烦,这一步先略过,之后再看看。

主要模块里面的基因直接的相互作用关系信息可以导出到cytoscape,VisANT等网络可视化软件。

THE END
1.(持续更新)数据分析实战项目100+例王小王123的博客以数据分析实战项目为主,包含大数据分析案例、机器学习项目、数据分析项目、预处理、可视化、数据库等实际应用项目、其中项目来源于:毕设选题、课程设计、业务需求、专业辅导1V1项目、日常接单、专业书籍案例项目等,项目来源于生活。旨在大量的实战,快速上手并应用于工作开发,为工作提供大量经验! 关注https://blog.csdn.net/weixin_47723732/category_12180011.html
2.熬夜整理出20个免费又实用的数据源网站!再也不愁找不到数据练手可要做项目,首先得有数据,要上哪去找数据来练手? 大家也都知道,平时我做数据分析实战时都会把数据集发给大家练习,但毕竟我精力有限,不能一直给大家提供数据集,所以今天老李给大家整理了20个我平常做数据分析、数据挖掘练习的时候经常用到的数据集网站,对急需数据练手的朋友非常有用。 https://blog.itpub.net/21472864/viewspace-2840739/
3.优途UX教育怎么样?2023年课程介绍,深圳UX+UI设计培训机构我们课程结构的差异在于以用户体验、交互设计、UI界面设计为核心,深入讲解互联网大厂研发全流程,从用户体验设计、用户研究、场景分析、痛点分析、用户画像、数据分析、竞品分析、产品定位、业务流程图、产品信息架构、产品原型、DRD文档、UI规范、UI组件搭建、UI界面设计和开发对接、项目提案等多个真实项目环节进行教学,不https://www.yoojia.com/ask/17-11562387145828738598.html
4.2024年招投标数据分析与实战实训心得3篇.docx师资质要求2.3项目经理职责与权限2.4实战实训导师职责与要求3.1项目进度安排与节点3.2数据收集与整理流程3.3数据分析方法培训与实操3.4实战实训任务分配与执行4.1数据来源与处理规范4.2数据安全与保密措施4.3数据分析工具与软件使用4.4数据质量监控与评估5.1实战实训案例选择与准备5.2案例分析与讨论5.3案例解决方案设计5.4案例实施https://www.renrendoc.com/paper/370473976.html
5.Python数据分析优秀案例&项目经历总之,本次项目干货满满,除了通过绘图等常规手段之外,也用到了t检验等假设检验的方法来力求让结论更具说服力。 下面开始项目的正式介绍。 目录 前言 1.项目介绍 1.1 项目介绍 1.2 数据介绍 2. 数据整理 3. 学生成绩分析 3.1 学生整体成绩分布 3.2 不同学科成绩间的关联度以及不同学生人群擅长科目 https://cloud.tencent.com/developer/article/2124430
6.Python数据分析实战项目介绍南鹤Python 语言是数据分析领域最常用的编程语言,因此本文将向大家介绍一个Python数据分析实战项目,学完这个项目大家可以使用 Pandas 进行数据准备、清洗、整理、计算与可视化,以及掌握最主流的数据可视化框架Seaborn和Echarts,并利用Bokeh实现动态可视化图表与控制面板。如果对学习Python数据分析的相关内容感兴趣就接着看下去吧! https://www.cnblogs.com/nanhe/p/13508805.html
7.Java是否适合运维会java可以做运维吗ctaxnews的技术博客数据离线数据仓库,企业级在线教育项目实战(Hive数仓项目完整流程) 本课程会、建立集团数据仓库,统一集团数据中心,把分散的业务数据集中存储和处理 ;目从需求调研、设计、版本控制、研发、测试到落地上线,涵盖了项目的完整工序 ;掘分析海量用户行为数据,定制多维数据集合,形成数据集市,供各个场景主题使用。 https://blog.51cto.com/u_14850/6765228
8.寻找接地气的Python实战项目基于股票的金融数据量化分析而是说如果你学习了Python,同时你对数据分析感兴趣,或是对金融量化交易感兴趣,或是计划开发属于自己的量化交易系统,或是准备从事金融数据分析领域,那么恭喜你,你可以把量化交易作为Python实战项目来练手。 一方面可以提高自己的Python实战能力,因为这个项目是一个多技术综合的项目,包括爬虫、数据分析、可视化、WEB开发、https://www.imooc.com/article/290298
9.R语言数据分析项目精解:理论方法实战高清pdf完整版[43MB]电《R 语言数据分析项目精解:理论、方法、实战》以互联网电商企业为背景,抽象出工作中常见的数据分析问题,利用R 语言和统计学列出了详细的解决方案和过程。《R 语言数据分析项目精解:理论、方法、实战》共9 章,前两章分别为总论和R 语言入门知识,之后各章分别介绍了运营指标的建立、指标监控系统、假设检验及AB 测试https://www.jb51.net/books/697401.html
10.《Excel数据分析师突击—从入门到精通到项目实战》快班报名:【快班】Excel数据分析师突击—从入门到精通到项目实战(随报随学) 大数据时代的到来,机器学习算法的不断发展,各种高深的算法也成了数据分析员日常讨论的话题,然而,并不是每一个岗位的数据分析都需要用到各种高深的机器学习算法,很多职场中的数据分析往往只涉及基础的部分,无需用到各种复杂难懂的算法,只需要http://www.dataguru.cn/article-10127-1.html
11.成功大数据项目实战案例福特汽车用这些方法把所有的数据都界定好了以后,第二步是把项目交给了一个差不多200人的大数据分析专业团队,他们获取和搜索所需的外部数据,比方说第三方合同网站,区域经济数据、就业数据等等。 第三步是他们获得数据以后,就开始对数据进行建模分析、挖掘,为销售和决策部门提供精准可靠的角色选择和效果分析,也就是说https://cda.pinggu.org/view/20251.html
12.项目小组介绍1.项目小组简介: 本项目小组主要研究方向为药物重定位平台的构建、基于药物重定位平台与生物组学数据库的药物预测、基于GEO、TCGA、GTEx等多种组学数据库及整合机器学习方法的生物信息挖掘与分析、python、R语言编程基础学习及项目实战、高分SCI论文的学习及复现。本小组旨在通过文献学习、论文撰写和数据分析项目实战等方式http://www.sxmu.edu.cn/bdcd/info/1098/1302.htm
13.《R语言数据分析与可视化从入门到精通》(程乾)简介书评本篇介绍R语言数据管理、数据分析和数据可视化的三大威力,包括通过数据获取、导出、整合和清理等操作将零散的数据整合为可以分析处理的数据集的多种方法;并介绍一些常用基础统计和高级统计的实现方法,以及R语言的图形生成、图形修饰、外部绘图插件和图形展示等功能。 第3篇:实战篇(第12章)。本篇通过一个实战案例,综合http://product.dangdang.com/29136211.html
14.职业方向定位职业生涯规划书(通用10篇)再之后去了xx,在那里兼职了一个多月,参与了大众汽车销量数据短期预测的项目,一个小项目下来,数据分析的方法流程掌握了不少,也了解了企业是如何用一些时间序列模型去参与预测的,如何选取某个拟合曲线作为预测值。现在,我来到新的地方实习,也非常幸运的参加了一个央企的码头堆场优化系统设计,其实也算数据分析的一种吧https://www.yjbys.com/jiuyezhidao/zhiyeguihua/2957515.html