gct考试很容易 gct考试是什么考试( 八 )

以上参数都设置好后点击参数设置栏下方的一个绿色按钮Run，若软件左下方GSEA reports处的状态显示Running的话则表示运行成功，此过程大概需要十分钟左右，视数据大小而定。

文章插图

Command：显示运行这个分析的命令行，以后就可以批量运行类似分析了。

数据分析完后的结果会保存到我们设置的路径下，点开文件夹中的index.html就可以查看网页版结果，更加方便。
结果报告分为多个子项目，其中最重要的是前面两部分，基因富集结果就在这里。从第三部分开始其实是软件在分析数据的过程产生的中间文件，也很重要，读懂后可以加深对GSEA分析的认识，理解我们是如何从最初的基因表达矩阵得到最终的结果（即报告的前两个项目）。建议先从Dataset details看起，然后再返回看第一部分的结果报告。
1. Enrichment in phenotype
以正常人组NGT的17个样本数据为例解析最终结果。

文章插图

报告首页文字总结信息表示：

经过条件筛选后还剩下3953个GO条目，其中1697个GO条目在NGT组中富集；
有36个GO基因条目在FDR<25%的条件下显著富集，这部分基因最有可能用于推进后续实验；
在统计检验p<0.01, p<0.05的条件下分别有19和114个GO条目显著富集；
结果有多种显示方式：图片快照（snapshot）、网页（html）和表格（Excel）形式；
点击Guide to可以查看官方帮助解读结果的文档。

1）点击enrichment results in html，在网页查看富集结果，如下：

文章插图

GS：基因集的名字，GO条目的名字
SIZE：GO条目中包含表达数据集文中的基因数目（经过条件筛选后的值）；
ES：富集评分；
NES：校正后的归一化的ES值。
由于不同用户输入的基因数据库文件中的基因集数目可能不同，富集评分的标准化考虑了基因集个数和大小。
其绝对值大于1为一条富集标准。
计算公式如下：
NOM p-val：即p-value，是对富集得分ES的统计学分析，用来表征富集结果的可信度；
FDR q-val：即q-value，是多重假设检验校正之后的p-value，即对NES可能存在的假阳性结果的概率估计，因此FDR越小说明富集越显著；
RANK AT MAX：当ES值最大时，对应基因所在排序好的基因列表中所处的位置；（注：GSEA采用p-value<5%，q-value<25%进行数据过滤）
LEADING EDGE：该处有3个统计值，tags=59%表示核心基因占该基因集中基因总数的百分比；list=21%表示核心基因占所有基因的百分比；signal=74%，将前两项统计数据结合在一起计算出的富集信号强度，计算公式如下：
其中n是列表中的基因数目，nh是基因集中的基因数目

2）Details for gene set

文章插图

首先是一个选定GOset下的汇总信息表，每一部分意思在上面已做解释，其中Upregulated in class表示该基因集在哪个组别中高表达，这个主要看富集分析后的leading edge分布位置。

特别声明：本站内容均来自网友提供或互联网，仅供参考，请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系，我们将在24小时内删除。