分子生物学研究试验平台

基因测序仪Miseq-建库及测序经验总结

发表日期:2016-10-17  周翔  打印  放大 缩小  【关闭

基因测序仪(Miseq)是美国illumina公司于20112月推出的一款小型测序平台,可以高通量、并行对核酸片段进行深度测序。其技术原理是采用可逆性末端边合成边测序反应。首先在DNA片段两端加上序列已知的通用接头构建文库,文库加载到测序芯片Flowcell上,文库两端的已知序列与Flowcell基底上的Oligo序列互补,每条文库片段都经过桥式PCR扩增形成一个簇,测序时采用边合成边测序反应,即在碱基延伸过程中,每个循环反应只能延伸一个正确互补的碱基,根据四种不同的荧光信号确认碱基种类,保证最终的核酸序列质量,经过多个循环后,完整读取核酸序列。

该型号的测序仪是一台在单个仪器上整合簇生成、末端配对测序及数据质量分析的新一代测序仪。它在测序过程中最大可产生25M Reads2x300 bp读长及15 Gb的数据产量。自2012年正式投入运行以来,已为我园多个课题组提供宏基因组、转录组、小RNA及细菌基因组等多项测序服务。通过近20次的DNARNA测序,本人将实验中的文库制备和基因测序经验和感悟总结如下:

1  核酸的浓度和质量

获得高质量核酸样品及其准确定量,是建立高质量基因文库的首要关键步骤。判定核酸样品的质量主要查看否存在蛋白质、酚类物质及其它次生代谢物质的污染以及是否存在降解现象。杂质污染可导致核酸定量不准确,同时影响建库过程中各种生物化学反应以及聚合酶链式反应效率(PCR)。核酸降解导致大量遗传和基因表达信息丢失,引起测序数据量下降。针对上述问题,必须根据不同物种的特性选择合适的核酸提取方法,同时利用超微量紫外分光光度计、核酸凝胶电泳系统、凝胶成像系统定性和定量判定核酸样品的质量。核酸定量不准确直接影响核酸片段化效果,核酸浓度过高,酶切不完全导致片段化不完全,文库中大片段偏多;浓度太低,酶切过度,文库小片段偏多。目前主要利用Quit仪器,采用荧光定量的方法,准确测定样品中总DNARNA的浓度。

2)核酸片段化时间

较为理想的基因文库是不同尺寸大小的片段呈现梯形分布,即小尺寸和大尺寸的基因片段含量较低,而中等尺寸的片段含量较高。基因文库构建过程中,需要严格控制核酸片段化时间,时间太短导致片段化不完全,大片段数量增多,由于最长读长的限制,较长片段无法测通;时间太长,片段化过度,小片段较多,增加后续序列拼接上的困难。因此对于较为成熟的基因文库构建方法,必须严格遵守试剂盒上规定的片段化反应时间。

3)片段化方法的选择

目前主要有酶切和超声波破碎两种核酸长链大分子片段化方法。酶切法产生的核酸片段两端具有粘性末端,较容易连接测序接头。超声波破碎方法产生平末端的DNA片段,连接测序接头的效率偏低。因此一般多选择酶切法片段化核酸长链分子。限制性内切酶具有固定的酶切位点,切割核酸分子时具有一定的偏向性,这种偏好性导致测序后数据处理过程中无法拼接形成完整的核酸分子链。为解决这一问题,目前建库试剂盒多采用切割核酸分子较为随机的转座酶片段化核酸大分子。

4)建库过程中PCR循环数的设置

基因文库构建过程中,由于核酸样品使用量较少,因此在片段化和加测序接头后适当扩增文库中不同大小的核酸片段,对开展后续的实验是十分必要的。但必须设置适当的PCR循环数。较低的循环数使文库DNA片段总量不能满足后续实验需求,对测序结果产生不利影响;较高的循环数指数级增大不同片段在基因文库中的含量差异,导致含量较高的片段具有较多的reads,而含量较低的片段具有极低的reads;其后果是在测序过程中大量重复测定含量较高的片段,而含量较低的片段由于覆盖和干扰作用,很少被读取,导致信息丢失。

5)基因文库构建方法的选择

一般根据待测核酸片段的长度选择合适的基因文库构建方法。由于受仪器最长读长(2×300bp)的限制,长链核酸分子建库时首先需要用酶切或机械破碎片段化处理;较短的核酸片段由于在最长读长范围内,可直接连接测序接头方法进行建库。而对于那些片段较小(700bp2kb),但又超出最大测序读长的核酸片段,用酶切建库方法会丢失两端的核酸序列,而直接连接测序接头建库后测序,中间序列由于无法读取导致信息丢失,因此必须结合两种方法建库、两次测序结果才能拼接出完整的目的核酸片段。

6)测序过程中上样文库浓度

Miseq基因测序时上样文库的最适浓度为810pmolFlow cell最适簇密度为10001200 k/mm2。上样浓度直接影响簇密度大小,促密度太大引起的覆盖和干扰作用使测序仪荧光检测器无法正确分辨不同颜色标记的核酸碱基,测序时出错的几率较高;簇密度太低会使被测读的核酸片段量减少,二者均会显著降低测序获得的有效数据量。因此准确定量文库中核酸片段的量,是获得较高质量测序数据的关键步骤。在实际测序过程中,簇密度往往偏高或偏低,其原因是绝对定量不够准确,标准误差较大以及超出标准曲线范围的样品需要重新进行绝对定量。

7)读长的设置

读长决定测序循环总数,对测序数据量产生决定性影响。设置最长读长(2×300bp)可最大限度提高测序试剂的利用效率,获得最大测序数据量。但对于小RNA、短DNA测序(100bp以下),并非设置的读长越长越好,需要根据文库片断的长度设置相应的测序读长。读长设置太长,片段全部测通,双端测序最后读取的均为测序接头序列,会导致Q30值降低;同时在测读完接头序列后,后续因为无模板序列,测序延伸反应不正常终止,容易出现仪器报错而终止测序反应。因此需要根据待测片段的长度设置合理的测序读长。

 

 

附件: