•
contig
英:
美:
n.
毗连群
1 、
contig
sequence───连续体序列
2 、cosmid
contig
───cosmid连续克隆体
3 、
contig
maps───跨叠片段图谱
4 、Sequencing analysis of the 323 kb
contig
of rice chromosome 4 identified a gene cluster encoding 7 dihydroflavonol-4-reductase (DFR)-like proteins within a 56 kb region.───通过对水稻 4号染色体一段 32 3kb的序列测定和分析 ,在其中 56kb的区域内发现了一个由 7个编码二氢黄酮醇还原酶 (DFR)类似蛋白基因组成的基因簇。
5 、RAD is a
contig
-oriented database for high-quality manual annotation of RGP, which can present non-redundant
contig
analyses by merging the accumulated PAC/BAC clones.───**详情:RAD是经RGP高质量人工注释的以序列叠连群为导向的数据库,可以代表了以合并多个PAC/BAC克隆为方法的非冗余叠连群分析。
6 、Construction of A Bacterial Artificial Chromosome (BAC) Contig Encompassing the Bacterial Blight Resistance Gene Xa4 Locus in Rice───水稻抗白叶枯病基因Xa4位点跨叠BAC克隆群的构建
7 、The integrated
contig
with five sequences was identified to 8, 675bp, exactly, which separately comprised Bos taurus rRNA gene of 18S, ITS1, 5.8S, ITS2 and 28S with the length of l,873bp, 1, 072bp, 150bp, 1, 038bp and 4, 542bp.───采用DNAstar的SeqMan软件将5个奶牛rRNA基因片段序列拼接成8,675bp的片段,找出18S rDNA、ITS1、5.8SrDNA、ITS2和28S rDNA大小分别为1,873bp、1,072bp、150bp、1,038bp和4,542bp。
8 、The wildlife reserves a r e concentrated in the western Sichuan, the region around Poyang Lake, the
contig
uous areas of Sichuan, Guizhou and Hunan.───野生生物类自然保护区在川西高原、川黔湘接壤带和鄱阳湖附近比较集中。
9 、The homology of the fourth
contig
and coxsackie virus B6 was 97 3% at amino acids level.───部分序列与柯萨奇病毒B6型氨基酸同源率达 97 3% ;
10 、Contig assembly───序列拼接
11 、
contig
map───邻接克隆图
12 、Contig Construction and BAC1J9 Sequencing and Analysis at Rht-Dlc Locus───小麦Rht-Dlc位点跨叠群构建及BAC1J9序列分析
13 、CodonCode Aligner is a program for sequence assembly,
contig
editing, and mutation detection, available for Windows and Mac OS X.───资源简介:DNA测序trace图编辑、突变分析、contig编辑、序列拼接软件。
Contig N50和Scaffold N50
对一条染色体进行测序,将测序得到的reads进行拼接,能够完全拼接起来,中间没有gap的序列称为contig。 如果中间有gap,但是gap的 长度我们知道,这样的序列就叫做scaffold。
Contig N50:Reads拼接后会获得一些不同长度的Contigs.将所有的Contig长度相加,能获得一个Contig总长度.然后将所有的Contigs按照从长到短进行排序,如获得Contig 1,Contig 2,contig 3...………Contig 25.将Contig按照这个顺序依次相加,当相加的长度达到Contig总长度的一半时,最后一个加上的Contig长度即为Contig N50.举例:Contig 1+Contig 2+ Contig 3 +Contig 4=Contig总长度 1/2时,Contig 4的长度即为Contig N50.ContigN50可以作为基因组拼接的结果好坏的一个判断标准.
Scaffold N50:Scaffold N50与Contig N50的定义类似.Contigs拼接组装获得一些不同长度的Scaffolds.将所有的Scaffold长度相加,能获得一个Scaffold总长度.然后将所有的Scaffolds按照从长到短进行排序,如获得Scaffold 1,Scaffold 2,Scaffold 3...………Scaffold 25.将Scaffold按照这个顺序依次相加,当相加的长度达到Scaffold总长度的一半时,最后一个加上的Scaffold长度即为Scaffold N50.举例:Scaffold 1+Scaffold 2+ Scaffold3 +Scaffold 4 +Scaffold 5=Scaffold总长度 1/2时,Scaffold 5的长度即为Scaffold N50.Scaffold N50可以作为基因组拼接的结果好坏的一个判断标准.
在序列拼接中,为什么说n50越大,拼接效果越好
因为如果n50越大,表明那些含有较多
碱基
的reads就较多,也就是长片段的reads很多,当然拼接的效果也就越好。
举个例子,比如一个基因组大小是1M,测序得到若干条reads,这些reads进行拼接,如果完全可以拼接起来,中间没有gap的序列称为contig,即连续的意思。如果中间有gap,但是可以知道gap的长度,这样的序列就叫做scaffold, 即脚手架(非连续)的意思。
然后把contig 和 scaffold 从长到短进行排列,然后相加,当恰好加到1M的50%,也就是500k的时候 ,那一条 contig 或者scaffold 的长度就叫做Contig N50和Scaffold N50。很明显这个数值越大说明组装的质量越好。
即:从最长的开始倒数,数到长度为总长度一半的片段,最后一个被数到的片段越长,说明长的片段越多,最后组装的质量越好。
拼接分析原理:
测序仪器一次测量的长度有限,通常会对样本中的序列进行饱和式测量,原始数据文件中会包含大量来自基因不同位置、长度不同的短序列。拼接工作将这些短序列按照一定顺序排列并筛除重复部分,合成长序列。