Bulked-segregant analysis簡稱BSA,也叫混合分組分析,是一種利用樣本混池的建庫方式對(duì)動(dòng)植物的極端性狀進(jìn)行QTL定位的一種方法。這種方法快速便捷,在親本群體中選擇表型極端的個(gè)體構(gòu)建表型極端的子代群體,并對(duì)極端性狀的子代群體進(jìn)行混池測(cè)序,從而迅速定位到與目標(biāo)基因具有緊密連鎖的分子標(biāo)記區(qū)域,進(jìn)一步挖掘重要的功能基因。Graded-seq是升級(jí)版的BSA,可對(duì)多個(gè)混池DNA進(jìn)行分析。
取樣類型:具有重要極端性狀的親本,子代群體包括暫時(shí)分離群體F1、F2和永久分離群體RIL、NIL和DH
混池規(guī)模:子代數(shù)量最少30+30個(gè)起,推薦數(shù)量50+50個(gè)起。必須符合極端性狀的要求。
測(cè)序深度:親本測(cè)序深度最低20x起,推薦深度30x起。平均每個(gè)子代1x起,推薦2x起。
Q1:混池?cái)?shù)量有要求嗎?
A:子代混池?cái)?shù)量最少30個(gè)起,建議至少50個(gè)。理論上混池?cái)?shù)量越多,性狀定位越好。如果極端性狀的樣本數(shù)量不多不建議強(qiáng)行湊樣,最低至少也要達(dá)到20個(gè)左右。兩種極端性狀的混池?cái)?shù)量可以不一致。
Q2:沒有親本,只有RIL群體或者是F2群體,可以做BSA嗎?
A:可以做。聯(lián)川生物會(huì)采用ED分析法進(jìn)行分析。但是定位區(qū)間內(nèi)的候選基因會(huì)偏多。
A:建議老師親本測(cè)序深度至少要10x-20x以上,推薦30x以上。子代混池,平均每個(gè)子代至少要1x以上,推薦2x以上。理論上測(cè)序深度越深,標(biāo)記的準(zhǔn)確性會(huì)越強(qiáng)。
A:是的。Mutmap僅限于EMS等化學(xué)誘變劑引起的點(diǎn)突變。
A:可以的。如果沒有參考基因組可以做BSA但是后期數(shù)據(jù)關(guān)聯(lián)性較差,不太推薦做BSA,做簡化基因組遺傳圖譜較為合適。另外針對(duì)一些沒有參考基因組但是基因組雜合度較高的物種如牡丹,推薦做BSR混池。
A:我們不建議老師使用動(dòng)物樣本做BSA混池,這里的動(dòng)物不包括魚、昆蟲等物種。但是我們一般會(huì)優(yōu)先推薦植物,二倍體和多倍體都是可以做混池的。
快捷高效的BSA混池測(cè)序鑒定水稻抗稻瘟病QTL
研究背景
使用傳統(tǒng)的育種方法鑒定某個(gè)重要的農(nóng)藝性狀存在費(fèi)時(shí)費(fèi)力等缺點(diǎn),采用BSA策略可以通過對(duì)性狀差異較大的親本進(jìn)行雜交,快速構(gòu)建作圖群體如F2、RIL等。在亞洲水稻是一種十分重要的糧食作物,鑒定重要農(nóng)藝性狀的相關(guān)基因迫在眉睫。
來自日本的Terauchi教授和他的同事們,利用抗稻瘟病的水稻品系Nortai和感病水稻品系Hitomebore(圖a)雜交后得到F2群體,之后連續(xù)自交得到總計(jì)241株水稻(RIL群體)。之后按照不同的抗病能力對(duì)RIL群體進(jìn)行分級(jí)(圖b),將抗病能力最強(qiáng)的20株水稻和抗病能力最弱的20株水稻分別構(gòu)建2個(gè)混池(圖c)。
SNP-index和基因組位置關(guān)系圖可以看出,抗病混池(R-bulk)和感病混池(S-bulk)的SNP-index在6號(hào)染色體上差異較大。△SNP-index(R-S bulk)可以看出,染色體上絕大部分區(qū)域的△SNP-index都接近于0,而2.39-4.39Mb這段區(qū)域的△SNP-index都大于0.79且p<0.01(圖d)。
接下來作者使用最傳統(tǒng)的遺傳圖譜法,對(duì)所有241株水稻進(jìn)行QTL定位,發(fā)現(xiàn)0-4.9Mb內(nèi)LOD值最高,去交集后抗稻瘟病的區(qū)域進(jìn)行快速定位。
Takagi H, Abe A, Yoshida K, et al. QTL-seq: rapid mapping of quantitative trait loci in rice by whole genome resequencing of DNA from two bulked populations. Plant J, 2013, 74(1):174.
Reads比對(duì)到參考基因組后,可以計(jì)算堿基的覆蓋到基因組上的比例。參考基因組上被reads覆蓋到的堿基數(shù)占基因組的百分比稱為基因組覆蓋度;堿基上覆蓋的reads數(shù)為覆蓋深度。
使用GATK進(jìn)行SNP Calling和Indel Calling,接下來使用ANNOVAR對(duì)SNP和Indel結(jié)果進(jìn)行注釋。
根據(jù)親本和混池的SNP及Indel標(biāo)記,利用SNP-Index和ED分析方法同時(shí)進(jìn)行標(biāo)記與性狀的關(guān)聯(lián)分析,獲得與目標(biāo)性狀相關(guān)的基因。
使用聯(lián)川生物自主開發(fā)的富集分析程序,對(duì)目標(biāo)性狀區(qū)域內(nèi)的候選基因進(jìn)行功能富集分析。