gct考试很容易 gct考试是什么考试( 四 )


Phenotype labels
Contains phenotype labels and associates each sample with a phenotype.
cls
You create the file or have GSEA create it for you. 一般是样品分组信息或样品属性度量值或时间序列信息 。
Gene sets
Contains one or more gene sets. For each gene set, gives the gene set name and list of features (genes or probes) in that gene set.
gmx or gmt
You use the files on the Broad ftp site, export gene sets from the Molecular Signature Database (MSigDb) or create your own gene sets file. 欲检测是否富集的基因集列表 。注意基因ID与表达矩阵基因ID一致 。自己准备的基因集注意格式与官网提供的gmt格式一致 。
Chip annotations
Lists each probe on a DNA chip and its matching HUGO gene symbol. Optional for the gene set enrichment analysis.
Chip
You use the files on the Broad ftp site, download the files from the GSEA web site, or create your own chip file. 主要是为芯片探针设计的转换文件 。如果表达矩阵的基因名与注释集基因名一致,不需要这个文件 。
Data File
Content
【gct考试很容易 gct考试是什么考试】Format
Source
Expression dataset
Contains features (genes or probes), samples, and an expression value for each feature in each sample. Expression data can come from any source (Affymetrix, Stanford cDNA, and so on).
res, gct, pcl, or txt
You create the file. 一般的基因表达矩阵整理下格式就可以 。如果是其它类型数据或自己计算rank也可以,后面有更多示例 。(如果后缀为txt格式,传统的基因表达矩阵就可以,第一列为基因名字,名字与待分析的功能注释数据集一致,同为GeneSymbol或EntrezID或其它自定义名字,第一行为标题行,含样品信息 。gct文件需要符合下面的格式要求 。)
Phenotype labels
Contains phenotype labels and associates each sample with a phenotype.
cls
You create the file or have GSEA create it for you. 一般是样品分组信息或样品属性度量值或时间序列信息 。
Gene sets
Contains one or more gene sets. For each gene set, gives the gene set name and list of features (genes or probes) in that gene set.
gmx or gmt
You use the files on the Broad ftp site, export gene sets from the Molecular Signature Database (MSigDb) or create your own gene sets file. 欲检测是否富集的基因集列表 。注意基因ID与表达矩阵基因ID一致 。自己准备的基因集注意格式与官网提供的gmt格式一致 。
Chip annotations
Lists each probe on a DNA chip and its matching HUGO gene symbol. Optional for the gene set enrichment analysis.
Chip
You use the files on the Broad ftp site, download the files from the GSEA web site, or create your own chip file. 主要是为芯片探针设计的转换文件 。如果表达矩阵的基因名与注释集基因名一致,不需要这个文件 。
1. 表达数据集文件
GESA提供有Example Datasets,下载地址:
http://software.broadinstitute.org/gsea/datasets.jsp 。
在这里可以下载表达矩阵Expression dataset(gct文件,常见txt格式也可以)和样品分组信息Phenotype labels(cls文件)

gct考试很容易 gct考试是什么考试

文章插图

数据示例中两个gct文件都是表达矩阵,其中*hgu133a.gct文件第一列是探针名字,*collapsed.gct文件的第一列是gene symbol 。