Phenotype labels
Contains phenotype labels and associates each sample with a phenotype.
cls
You create the file or have GSEA create it for you. 一般是样品分组信息或样品属性度量值或时间序列信息 。
Gene sets
Contains one or more gene sets. For each gene set, gives the gene set name and list of features (genes or probes) in that gene set.
gmx or gmt
You use the files on the Broad ftp site, export gene sets from the Molecular Signature Database (MSigDb) or create your own gene sets file. 欲检测是否富集的基因集列表 。注意基因ID与表达矩阵基因ID一致 。自己准备的基因集注意格式与官网提供的gmt格式一致 。
Chip annotations
Lists each probe on a DNA chip and its matching HUGO gene symbol. Optional for the gene set enrichment analysis.
Chip
You use the files on the Broad ftp site, download the files from the GSEA web site, or create your own chip file. 主要是为芯片探针设计的转换文件 。如果表达矩阵的基因名与注释集基因名一致,不需要这个文件 。
Data File
Content
【gct考试很容易 gct考试是什么考试】Format
Source
Expression dataset
Contains features (genes or probes), samples, and an expression value for each feature in each sample. Expression data can come from any source (Affymetrix, Stanford cDNA, and so on).
res, gct, pcl, or txt
You create the file. 一般的基因表达矩阵整理下格式就可以 。如果是其它类型数据或自己计算rank也可以,后面有更多示例 。(如果后缀为txt格式,传统的基因表达矩阵就可以,第一列为基因名字,名字与待分析的功能注释数据集一致,同为GeneSymbol或EntrezID或其它自定义名字,第一行为标题行,含样品信息 。gct文件需要符合下面的格式要求 。)
Phenotype labels
Contains phenotype labels and associates each sample with a phenotype.
cls
You create the file or have GSEA create it for you. 一般是样品分组信息或样品属性度量值或时间序列信息 。
Gene sets
Contains one or more gene sets. For each gene set, gives the gene set name and list of features (genes or probes) in that gene set.
gmx or gmt
You use the files on the Broad ftp site, export gene sets from the Molecular Signature Database (MSigDb) or create your own gene sets file. 欲检测是否富集的基因集列表 。注意基因ID与表达矩阵基因ID一致 。自己准备的基因集注意格式与官网提供的gmt格式一致 。
Chip annotations
Lists each probe on a DNA chip and its matching HUGO gene symbol. Optional for the gene set enrichment analysis.
Chip
You use the files on the Broad ftp site, download the files from the GSEA web site, or create your own chip file. 主要是为芯片探针设计的转换文件 。如果表达矩阵的基因名与注释集基因名一致,不需要这个文件 。
1. 表达数据集文件
GESA提供有Example Datasets,下载地址:
http://software.broadinstitute.org/gsea/datasets.jsp 。
在这里可以下载表达矩阵Expression dataset(gct文件,常见txt格式也可以)和样品分组信息Phenotype labels(cls文件)

文章插图
数据示例中两个gct文件都是表达矩阵,其中*hgu133a.gct文件第一列是探针名字,*collapsed.gct文件的第一列是gene symbol 。
- 第一行:#1.2,表示版本号,自己准备文件时照抄就行;
- 第二行:两个数分别表示gene NAME的数量和样本数量(矩阵列数-2);
- 矩阵:第一列是NAME;第二列Description,没有的话可以全用na或任意字符串填充;后面的就是基因在不同样本中标准化后的表达数据了 (部分统计量metrics for ranking genes计算需要log转换后的数据,后面会有提及 。其它情况是否为log转换的数据都可用,GSEA关注的是差异,只要可比即可) 。
- 中国研究生准考证打印 研究生考试准考证打印要求
- 英语四级考试考什么 四级英语总分多少
- 天津会计初级考试 天津会计考试
- 四级考试时间 四级考试报名条件
- 英语口语考试常用对话 英语口语考试对话内容
- 公共英语等级有几级 全国公共英语等级考试
- 会计初级证书报名条件 会计初级职称考试报考条件
- 造价工程师入门手册书籍 造价师考试用书
- 幼儿教师招聘考试试题及答案?
- 广东省公务员考试成绩怎么查询?
特别声明:本站内容均来自网友提供或互联网,仅供参考,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
