全長轉(zhuǎn)錄本測序基于單分子實時測序Pacbio Sequel平臺,超長讀長可獲得mRNA全長序列及完整結(jié)構(gòu)信息。克服無參考基因組物種轉(zhuǎn)錄本拼接短、信息不完整的難題,實現(xiàn)有參考基因組物種研究可變剪切及融合基因等結(jié)構(gòu)變異。
技術(shù)優(yōu)勢
平臺優(yōu),質(zhì)量好,性價比高。
基于小而強大的Pacbio Sequel平臺,獲取mRNA全長序列,
文庫構(gòu)建時無需將轉(zhuǎn)錄本打斷,信息分析無需組裝,精準(zhǔn)重構(gòu)轉(zhuǎn)錄組全貌。
科學(xué)方案設(shè)計:從材料選取,建庫測序,到數(shù)據(jù)分析,每一步都需要科學(xué)、縝密的設(shè)計,以保障高質(zhì)量研究成果.
技術(shù)路線
分析內(nèi)容
樣本類型
由于是測全長,所以比二代轉(zhuǎn)錄組測序?qū)嶒瀸NA質(zhì)量的要求更高。
樣品量:總RNA>5 ug/文庫;總量>15 ug(3個文庫);
樣品純度:OD260/280≥1.8,OD260/230≥1.0,260nm處有正常峰值;
RNA 完整性:總RNA的RIN值≥8.0,28S/18S≥1.3;圖譜基線無上抬;5S峰正常
Q1:全長轉(zhuǎn)錄組測序中,為什么要建3個以上文庫?
A:全長轉(zhuǎn)錄組采用單分子實時測序技術(shù),通過構(gòu)建啞鈴型文庫,以環(huán)形方式循環(huán)測序。測序時,短片段文庫更容易落入零模波導(dǎo)孔。為了避免測序過程中短片段文庫偏好性,保證不同長度轉(zhuǎn)錄本的覆蓋度,因此,會構(gòu)建3個或3個以上文庫。
Q2:全長轉(zhuǎn)錄組是否需要打斷,拼接?
A:全長轉(zhuǎn)錄本是包括從5`末端到3`-poly A tail的,包括mRNA全長序列以及完整結(jié)構(gòu)信息的完整轉(zhuǎn)錄本,片段集中分布于1-6kb,sequel平均讀長在12kb左右,最長的文庫都可以測至少一遍,所以建庫前不需要打斷,后期分析也無需拼接,得到的就是完整的mRNA。
研究背景
高粱是世界上非常重要的C4作物,也是重要的耐脅迫的谷類,重要的研究非生物脅迫的模式生物。本研究以高粱為研究材料,采用Pacbio的Iso-Seq策略,調(diào)研高粱轉(zhuǎn)錄組特征,改進(jìn)高粱基因集注釋。
研究結(jié)果
1. AS事件分析
本研究發(fā)現(xiàn),有10,053個isoform經(jīng)歷了AS事件,其中只有2,950個isoform和現(xiàn)有的基因模型吻合。Pacbio數(shù)據(jù)結(jié)果證實高粱轉(zhuǎn)錄組AS事件比之前的認(rèn)知更為普遍。同時,文章對在Pacbio中的多isoform的基因做了RT-PCR驗證,證實了結(jié)果的可靠性。
2. APA事件分析
APA事件是在編碼區(qū)或3’-UTR區(qū)形成isoform,提高轉(zhuǎn)錄本的復(fù)雜性。由于單分子測序技術(shù)利用Oligo dT引物合成cDNA,poly(A)會出現(xiàn)在測序結(jié)果中。因此,單分子測序技術(shù)是研究APA的有力工具。本文發(fā)現(xiàn)在已表達(dá)的14,550個基因中,11,013個至少有1個poly(A)位點。
3. 新基因發(fā)現(xiàn)
原來的參考基因集有~34,500個基因。在該研究中預(yù)測到2171個可能的新基因。為了鑒定這些新基因是否在其他物種中存在,我們使用BLAST中的tblastx和blastx分別比對到收集的植物cDNA序列和Swiss-Prot蛋白數(shù)據(jù)庫,共檢測到971個基因。為了證明這些新基因的表達(dá),隨機選擇7個基因并用RT-PCR驗證,證實了新基因的表達(dá)和剪切。
圖 Iso-seq和已注釋的不同可變剪切類型的比較
參考文獻(xiàn)
Abdelghany S E, Hamilton M, Jacobi J L, et al. A survey of the sorghum transcriptome using single-molecule long reads[J]. Nature Communications, 2016, 7:11706.