CRISPR-Cas9是一項可對基因組特定靶基因進(jìn)行編輯的DNA操控技術(shù),該系統(tǒng)由sgRNA和Cas9蛋白組成,Cas9蛋白在sgRNA的引導(dǎo)下對靶位點處的DNA雙鏈進(jìn)行剪切,并產(chǎn)生一個平末端的雙鏈DNA缺口,進(jìn)而啟動DNA損傷修復(fù)機(jī)制,通過非同源末端鏈接(Non-homologous end joining,NHEJ)或同源重組(Homologous recombination,HR)的方式將斷裂上下游兩端的序列連接起來。
目前,CRISPR-Cas9基因編輯技術(shù)在疾病基礎(chǔ)研究、靶點驗證、藥物分子的高通量篩選、以及遺傳性疾病的治療等領(lǐng)域得到了越來越廣泛的應(yīng)用。sgRNA在CRISPR-Cas9基因編輯系統(tǒng)中具有準(zhǔn)確識別靶基因序列的作用,其效果可影響編輯的效率、是否發(fā)生脫靶等,甚至對最終基因編輯的效果產(chǎn)生決定性作用。因此,設(shè)計合理有效的sgRNA是我們實現(xiàn)基因編輯的重要基礎(chǔ)。
sgRNA設(shè)計的一般流程如下:
圖1. sgRNA的設(shè)計流程
靶基因信息的分析
查詢靶基因信息常用的數(shù)據(jù)庫有NCBI、Ensembl等,在查詢過程中要注意物種的選擇和確定靶基因在數(shù)據(jù)庫中的登錄號,避免查找錯誤。查詢到目的基因信息后,需進(jìn)一步關(guān)注其所在基因座上下游基因情況、轉(zhuǎn)錄本數(shù)量、外顯子數(shù)量及長度、翻譯起始位點與終止位點等信息。然后再綜合考量上述信息進(jìn)行下一步的sgRNA設(shè)計。
此處以查詢?nèi)祟怰ag1基因為例。在NCBI Gene數(shù)據(jù)庫中輸入需要查找的人類Rag1基因,查找的結(jié)果顯示多個與Rag1相關(guān)的基因,這些基因包括了不同物種的Rag1同源基因。因而查找時需要注意該基因在NCBI的登錄號與種屬描述等(圖2a)。點擊查詢目的基因人類Rag1基因,顯示出該基因的基本信息。
可在“Download Datasets”下載該基因的相關(guān)序列。在“See related”可查看該基因在Ensembl數(shù)據(jù)庫中的相關(guān)信息,主要是為了查看該基因的轉(zhuǎn)錄本相關(guān)信息(圖2b)。鏈接到Ensembl數(shù)據(jù)庫后能查找到該基因的轉(zhuǎn)錄本數(shù)量等相關(guān)信息,此處顯示人類Rag1基因有三個轉(zhuǎn)錄本,并且可以打開任意一個轉(zhuǎn)錄本查看相關(guān)信息(圖2c)。查詢RAG1-201轉(zhuǎn)錄本信息,可打開左側(cè)“Exons”查看該轉(zhuǎn)錄本的外顯子等相關(guān)信息(圖2d),即可顯示該轉(zhuǎn)錄本的基本結(jié)構(gòu)(圖2e)。
圖2. 靶基因信息的分析
靶區(qū)域的選擇原則
以基因敲除(KO)為例,基因敲除可采用2種不同策略——移碼突變和片段敲除,雖然不同的策略對于靶區(qū)域選擇的參考標(biāo)準(zhǔn)有差異,但也需遵循以下原則:
1. 不影響其他基因,尤其是編碼蛋白的基因。挑選靶區(qū)域時避免選擇與其他基因重疊的區(qū)域(圖3a)。
2. 盡可能影響所有的轉(zhuǎn)錄本,敲除位點最好在編碼區(qū)的前50%,但避免敲除ATG所在的位置(圖3b)
3. 能影響蛋白的功能結(jié)構(gòu)域。
對于片段敲除,需考慮更多因素:如片段敲除所敲除的外顯子編碼序列之和為非3的倍數(shù)(圖3c),這樣可使靶區(qū)域后面的序列發(fā)生移碼,無法翻譯出功能蛋白,從而使敲除更徹底。片段敲除所選定的敲除區(qū)域不超過10Kb,超過10Kb后編輯效率會降低。片段敲除的gRNA設(shè)計在內(nèi)含子上,這樣能敲除整個外顯子區(qū),避免翻譯出殘留蛋白。并且gRNA的設(shè)計位點需靠近所敲除的外顯子,這樣可避免產(chǎn)生不可控的剪切信號而導(dǎo)致形成新的轉(zhuǎn)錄本。敲除區(qū)域前后序列盡量簡單,方便后續(xù)的PCR鑒定。
圖3. 靶區(qū)域選擇示意圖
(a)基因A與基因B共有一個外顯子(標(biāo)藍(lán)的外顯子),因此選擇靶區(qū)域時應(yīng)遵循不影響其他基因的原則,不以共有的外顯子作為靶區(qū)域。(b)存在多個轉(zhuǎn)錄本時,為了能敲除所有的轉(zhuǎn)錄本,應(yīng)選擇在多個轉(zhuǎn)錄本均存在,且在編碼區(qū)的前50%的外顯子(此處選擇標(biāo)紅的外顯子)作為靶區(qū)域。(c)片段敲除時,因基因片段過大不能全部敲除而選擇敲除部分外顯子,敲除片段的編碼序列之和應(yīng)為非3的倍數(shù),使后面的蛋白發(fā)生移碼突變。
gRNA的設(shè)計
目前有較多提供gRNA設(shè)計的在線工具,常用的如張鋒實驗的CRISPOR(http://crispor.tefor.net/),只需輸入目標(biāo)序列,選定好種屬基因組與相應(yīng)的PAM,則可以得出多個gRNA,以及每個gRNA對應(yīng)的特異性、切割效率和潛在脫靶位點,一般選擇特異性、切割效率得分高的gRNA作后續(xù)實驗(圖4)。
如果需要手動設(shè)計gRNA,則需要考慮其特異性與切割效率。在靶點設(shè)計時要綜合考慮所有候選靶點的序列、位置、正負(fù)鏈、GC含量、潛在的脫靶位點等信息。
圖4. CRISPOR在線網(wǎng)頁設(shè)計sgRNA流程
脫靶分析
根據(jù)選擇的sgRNA,通過生物信息學(xué)方法,對sgRNA進(jìn)行脫靶分析。推薦使用CCTop(https://cctop.cos.uni-heidelberg.de:8043/)在線網(wǎng)頁進(jìn)行預(yù)測。將sgRNA序列輸入,選定相應(yīng)種屬基因組進(jìn)行分析(圖5)。并且對獲得的遺傳材料進(jìn)行檢測。挑選前10個潛在脫靶位點,通過PCR測序驗證是否脫靶。如果實驗要求較為嚴(yán)格的,則需要通過全基因組測序鑒定脫靶情況。
圖5. sgRNA在CCTop在線網(wǎng)頁的脫靶分析
sgRNA的設(shè)計,你學(xué)廢了嗎?不過這僅僅是基因編輯方案設(shè)計中的一環(huán),基因編輯方案還需要考慮目的基因轉(zhuǎn)錄本分析、轉(zhuǎn)染方法、細(xì)胞克隆形成能力等多種因素,即使一位非常熟練的方案設(shè)計專家出一份方案都需要幾個小時或更長,且疏漏也在所難免。