全長(zhǎng)轉(zhuǎn)錄本測(cè)序基于單分子實(shí)時(shí)測(cè)序Pacbio Sequel平臺(tái),超長(zhǎng)讀長(zhǎng)可獲得mRNA全長(zhǎng)序列及完整結(jié)構(gòu)信息??朔o參考基因組物種轉(zhuǎn)錄本拼接短、信息不完整的難題,實(shí)現(xiàn)有參考基因組物種研究可變剪切及融合基因等結(jié)構(gòu)變異。
技術(shù)優(yōu)勢(shì)
平臺(tái)優(yōu),質(zhì)量好,性價(jià)比高。
基于小而強(qiáng)大的Pacbio Sequel平臺(tái),獲取mRNA全長(zhǎng)序列,
文庫(kù)構(gòu)建時(shí)無需將轉(zhuǎn)錄本打斷,信息分析無需組裝,精準(zhǔn)重構(gòu)轉(zhuǎn)錄組全貌。
科學(xué)方案設(shè)計(jì):從材料選取,建庫(kù)測(cè)序,到數(shù)據(jù)分析,每一步都需要科學(xué)、縝密的設(shè)計(jì),以保障高質(zhì)量研究成果.
技術(shù)路線
分析內(nèi)容
樣本類型
由于是測(cè)全長(zhǎng),所以比二代轉(zhuǎn)錄組測(cè)序?qū)嶒?yàn)對(duì)RNA質(zhì)量的要求更高。
樣品量:總RNA>5 ug/文庫(kù);總量>15 ug(3個(gè)文庫(kù));
樣品純度:OD260/280≥1.8,OD260/230≥1.0,260nm處有正常峰值;
RNA 完整性:總RNA的RIN值≥8.0,28S/18S≥1.3;圖譜基線無上抬;5S峰正常
Q1:全長(zhǎng)轉(zhuǎn)錄組測(cè)序中,為什么要建3個(gè)以上文庫(kù)?
A:全長(zhǎng)轉(zhuǎn)錄組采用單分子實(shí)時(shí)測(cè)序技術(shù),通過構(gòu)建啞鈴型文庫(kù),以環(huán)形方式循環(huán)測(cè)序。測(cè)序時(shí),短片段文庫(kù)更容易落入零模波導(dǎo)孔。為了避免測(cè)序過程中短片段文庫(kù)偏好性,保證不同長(zhǎng)度轉(zhuǎn)錄本的覆蓋度,因此,會(huì)構(gòu)建3個(gè)或3個(gè)以上文庫(kù)。
Q2:全長(zhǎng)轉(zhuǎn)錄組是否需要打斷,拼接?
A:全長(zhǎng)轉(zhuǎn)錄本是包括從5`末端到3`-poly A tail的,包括mRNA全長(zhǎng)序列以及完整結(jié)構(gòu)信息的完整轉(zhuǎn)錄本,片段集中分布于1-6kb,sequel平均讀長(zhǎng)在12kb左右,最長(zhǎng)的文庫(kù)都可以測(cè)至少一遍,所以建庫(kù)前不需要打斷,后期分析也無需拼接,得到的就是完整的mRNA。
研究背景
高粱是世界上非常重要的C4作物,也是重要的耐脅迫的谷類,重要的研究非生物脅迫的模式生物。本研究以高粱為研究材料,采用Pacbio的Iso-Seq策略,調(diào)研高粱轉(zhuǎn)錄組特征,改進(jìn)高粱基因集注釋。
研究結(jié)果
1. AS事件分析
本研究發(fā)現(xiàn),有10,053個(gè)isoform經(jīng)歷了AS事件,其中只有2,950個(gè)isoform和現(xiàn)有的基因模型吻合。Pacbio數(shù)據(jù)結(jié)果證實(shí)高粱轉(zhuǎn)錄組AS事件比之前的認(rèn)知更為普遍。同時(shí),文章對(duì)在Pacbio中的多isoform的基因做了RT-PCR驗(yàn)證,證實(shí)了結(jié)果的可靠性。
2. APA事件分析
APA事件是在編碼區(qū)或3’-UTR區(qū)形成isoform,提高轉(zhuǎn)錄本的復(fù)雜性。由于單分子測(cè)序技術(shù)利用Oligo dT引物合成cDNA,poly(A)會(huì)出現(xiàn)在測(cè)序結(jié)果中。因此,單分子測(cè)序技術(shù)是研究APA的有力工具。本文發(fā)現(xiàn)在已表達(dá)的14,550個(gè)基因中,11,013個(gè)至少有1個(gè)poly(A)位點(diǎn)。
3. 新基因發(fā)現(xiàn)
原來的參考基因集有~34,500個(gè)基因。在該研究中預(yù)測(cè)到2171個(gè)可能的新基因。為了鑒定這些新基因是否在其他物種中存在,我們使用BLAST中的tblastx和blastx分別比對(duì)到收集的植物cDNA序列和Swiss-Prot蛋白數(shù)據(jù)庫(kù),共檢測(cè)到971個(gè)基因。為了證明這些新基因的表達(dá),隨機(jī)選擇7個(gè)基因并用RT-PCR驗(yàn)證,證實(shí)了新基因的表達(dá)和剪切。
圖 Iso-seq和已注釋的不同可變剪切類型的比較
參考文獻(xiàn)
Abdelghany S E, Hamilton M, Jacobi J L, et al. A survey of the sorghum transcriptome using single-molecule long reads[J]. Nature Communications, 2016, 7:11706.