写在前面
IGV能够将基因组的变异情况可视化,因此广泛应用于基因组学的研究中。
下面我以windows下的IGV为例,介绍一下IGV在查看基因组变异方面的应用。
一.下载
下载链接如下:https://software.broadinstitute.org/software/igv/download
和一般的软件下载情况类似,不同的是,需要在电脑上安装JAVA,这个应该难不倒各位看官老爷,因此不再赘述。
二.用户使用手册
官网的使用手册包含以下18个方面,我主要关注的是 Viewing Data和Viewing Alignments。
- User Interface
- Navigating the View
- Loading a Genome
- External Control of IGV
- Viewing the Reference Genome
- Loading Data and Attributes
- Viewing Data
- Viewing Alignments
- Viewing Variants
- Multi-Locus View
- Regions of Interest
- Sample Attributes
- Sorting, Grouping, and Filtering
- Saving and Restoring Sessions
- Server Configuration
- Motif Finder
- igvtools
- BLAT search
1. Viewing Data
1.1 Default Display
IGV的一条track代表一个样本或试验,每条track,IGV都会展示track identifier,一个或多个属性,和track数据,如图所示。
当导入文件时,IGV会根据文件的后缀名自动识别文件。如下图所示。
1.2 Changing the Display
1.3 Segmented Data
1.4 GWAS Data
IGV可以像曼哈顿图那样展示GWAS数据。
1.5 RNA Secondary Structure
2. Viewing Alignments
看的最多的比对文件就是下机数据比对到基因组的sam/bam文件。
导入IGV的bam要附带着它的索引文件,这个可以由samtools
生成。
Tracks
当你导入bam文件时,IGV会自动搜索该路径下的索引文件。
导入bam文件后,会生成3个相关的tracks。
- Alignment Track(看单条比对reads)
- Coverage Track(看测序覆盖的深度)
- Splice Junction Track(提供跨越剪接连接的读取的另一种视角)
默认情况下展示Alignment Track
和Coverage Track
。
Coverage Track
如果一个核苷酸与参考序列的差异大于20%的加权质量reads, IGV会根据每个碱基的reads数的比例赋予染色。
- 通过右键单击跟踪并选择设置等位基因频率阈值来覆盖单个覆盖track的默认阈值。
-
要更改所有覆盖轨迹的默认值,请在视图> Preferences下的Alignments选项卡中设置覆盖等位基因-分数阈值。
将鼠标悬停在覆盖栏上查看计数细节。从右键菜单中复制计数细节到计算机的剪贴板。
Alignment Track
默认情况下,匹配参考基因组的碱基展示为灰色。碱基的插入用紫色表示,碱基的删除用黑色横线表示。
-
Transparency for Mapped Reads
注意,如屏幕截图所示,以浅灰色边框和透明或白色填充显示的对齐,其映射质量为零。
在这种情况下,reads也映射到另一个同样好的位置。
也有可能reads不能被唯一地放置,但其他的放置不一定能带来同样高质量的得分。
-
Insertions
IGV用紫色或红色表示碱基的插入,鼠标悬浮能够看到该碱基的详细信息。
-
Deletions
在有gap的reads中,IGV用黑色短线表示相对于参考基因组的删除。
Paired-End Alignments -
View As Pairs
默认情况下,IGV显示单独的reads,因为它们紧密地打包在一起。
从右键菜单中选择View as pairs,以如下图所示的方式显示连接两端的成对。鼠标悬停(2)也会显示在普通视图(左)的单个reads或成对读取视图(右)的成对reads。
2.1 Interpreting Color by Insert Size
IGV使用不同的颜色来标志异常的插入。当你在弹出菜单中通过插入大小选择颜色对齐>
时,默认的着色方案是:
-
Deletions
单端的缺失。
双端的缺失。
在IGV中展示的结果。
-
Insertions
单端示意图。
双端示意图。
检测到异常插入大小受片段大小的限制。读长必须足够长,以跨越插入位置,并包含两端映射到参考基因组的序列,能检测到的最大插入大小为:fragment length - (2x read length)。
IGV示意图。
-
Inter-chromosomal Rearrangement
下面这个例子中,reads一端在染色体1上,另一端在染色体6上。
2.2 Interpreting Color by Pair Orientation
成对reads的方向可用于检测结构变异事件,包括染色体倒置,复制和易位。
绿色、蓝绿色和深蓝色的阴影表示倒置、复制和易位的结构事件;不同的颜色取决于不同的平台。
Inversions
染色体上的倒置。
双末端测序揭示的倒置。
在IGV上展示如下。
Inverted Duplication
当一大段DNA被复制并以与原始序列相反的构型插入基因组时,这被称为反向复制。
这将会有重叠的左边和右边的reads,并且有可能由覆盖深度/拷贝数所决定。
在IGV中展示如下。
Tandem Duplication
当一大段DNA被复制并插入到基因组中原始序列的旁边时,这被称为串联复制。
IGV展示如下。
Translocation on the Same Chromosome
当一大段DNA从一个位置移除并插入到其他位置时,这就是易位。
同一染色体上的易位可通过对取向的颜色编码检测,而两个染色体之间的易位可通过插入大小的染色检测。
2.3 Interpreting Color by Bisulfite Mode
2.4 Splice Junctions
2.5 Sashimi Plot
未完待续~
参考链接:
http://software.broadinstitute.org/software/igv/UserGuide