空間轉(zhuǎn)錄組學(xué)技術(shù),尤其是華大時(shí)空組學(xué)技術(shù)Stereo-seq的出現(xiàn),能夠準(zhǔn)確反映細(xì)胞的空間排布和RNA的原位表達(dá),幫助科研人員從時(shí)間和空間維度上認(rèn)知每個(gè)基因、每個(gè)細(xì)胞,有望帶來生命科學(xué)領(lǐng)域的第三次科技革命,成為重新認(rèn)知器官結(jié)構(gòu)、生命發(fā)育、物種演化和定義疾病的底層工具。
對(duì)于時(shí)空組學(xué)技術(shù)生產(chǎn)的原始數(shù)據(jù),需結(jié)合算法工具進(jìn)行處理、分析,進(jìn)而找到在空間分布上具有意義的細(xì)胞和基因表達(dá)。然而,由于該技術(shù)的創(chuàng)新性,現(xiàn)有工具包大多僅側(cè)重于空間原位信號(hào)的可視化,而缺乏系統(tǒng)性分析數(shù)據(jù)的方法。
北京時(shí)間11月12日,華大生命科學(xué)研究院聯(lián)合斯坦福大學(xué)醫(yī)學(xué)院、武漢大學(xué)電子信息學(xué)院等機(jī)構(gòu)在國(guó)際頂級(jí)學(xué)術(shù)期刊《細(xì)胞》(Cell)發(fā)表時(shí)空算法工具包最新研究。該國(guó)際協(xié)作團(tuán)隊(duì)借鑒了物理學(xué)、地理學(xué)、經(jīng)濟(jì)學(xué)等多個(gè)跨學(xué)科領(lǐng)域的數(shù)學(xué)模型,開創(chuàng)性開發(fā)了三維時(shí)空建模工具包Spateo,使空間轉(zhuǎn)錄組學(xué)技術(shù)能夠精細(xì)地重構(gòu)器官三維結(jié)構(gòu)、系統(tǒng)地量化時(shí)空動(dòng)態(tài)過程。該工具包的發(fā)布標(biāo)志著時(shí)空組學(xué)研究迎來革新性突破,可全面支撐胚胎發(fā)育、腦科學(xué)、疾病等領(lǐng)域研究,為實(shí)現(xiàn)高精度時(shí)空生命全景觀研究邁出了極為關(guān)鍵的一步。

Cell 官網(wǎng)截圖
Spateo工具包提供多種算法選擇,具備三維重建、區(qū)域數(shù)字化、細(xì)胞間相互作用推斷、“形態(tài)計(jì)量向量場(chǎng)”以及用于交互式操作的可視化界面等獨(dú)特優(yōu)勢(shì)。為驗(yàn)證其性能,研究團(tuán)隊(duì)以小鼠胚胎和果蠅發(fā)育的研究為例,探索了三維空間中隨時(shí)間變化的器官生態(tài)形成機(jī)制,并構(gòu)建了小鼠胚胎發(fā)育的“3D分子全息圖”,證實(shí)了Spateo將顯著提高我們對(duì)發(fā)育過程中器官形成的理解。

Spateo整體功能示意圖
如果說以往的時(shí)空算法工具包更多的是輔助研究者觀察數(shù)據(jù),Spateo則具備系統(tǒng)性的統(tǒng)計(jì)能力與強(qiáng)大的分析能力??梢哉f,Spateo工具包是當(dāng)前時(shí)空算法工具領(lǐng)域“天花板”級(jí)別的存在,將為生命科學(xué)的未來研究奠定重要基礎(chǔ)。
下文選取Spateo工具包中的四種核心創(chuàng)新性算法為大家介紹。
三維重建算法:普適性強(qiáng),更高精度、更低成本實(shí)現(xiàn)三維重建
Spateo工具包提供的三維重建算法,能夠幫助科研人員以更低成本、更低難度(更少、更遠(yuǎn)距離的組織切片)獲取更高精度的三維重建結(jié)果,可廣泛適用于胚胎發(fā)育、腦科學(xué)、疾病、植物等多領(lǐng)域研究。
首先,對(duì)于空間組學(xué)中經(jīng)典的三維重建問題,Spateo巧妙地將切片間的配準(zhǔn)任務(wù)轉(zhuǎn)化為“生成”問題。切片間的配準(zhǔn),是將二維圖像進(jìn)行精確對(duì)齊,以便于后續(xù)的三維重建和分析。作為空間組研究中的基礎(chǔ)問題,配準(zhǔn)的準(zhǔn)確度將直接影響研究結(jié)果的判斷。可類比理解為,醫(yī)院檢查拍攝的CT影像越精準(zhǔn),醫(yī)生也就能更好地理解和診斷患者的病情。
具體而言,研究人員獲取了兩張組織切片A和B之后,Spateo可根據(jù)切片A生成一個(gè)虛擬的A’切片,使其與B切片足夠相似。A’切片的生成過程由高斯過程建模,并通過變分推斷求解,實(shí)現(xiàn)高效且穩(wěn)定的計(jì)算,并且能夠處理切片形變和部分缺失等難題。同時(shí),Spateo還設(shè)計(jì)了多切片聯(lián)合優(yōu)化算法以及表面糾正算法,進(jìn)一步提升了三維重建的精度。鑒于此,即便切片A和B距離較遠(yuǎn)、或時(shí)間跨度較長(zhǎng),甚至是跨物種的切片,也能借助Spateo推斷出兩者間的映射關(guān)系。
生成算法示意圖和小鼠腦胚胎重建效果(c-d:之前發(fā)表的方法偏向于重建成“一團(tuán)”組織,而Spateo準(zhǔn)確還原了三維精細(xì)結(jié)構(gòu)和基因空間分布)
此外,研究團(tuán)隊(duì)采用多個(gè)空間組學(xué)數(shù)據(jù)集對(duì)Spateo進(jìn)行驗(yàn)證,包括小鼠腦、人類淋巴瘤、猴腦和小鼠胚胎。結(jié)果顯示,Spateo成功重建了各種組織類型的三維結(jié)構(gòu),展示了其處理復(fù)雜數(shù)據(jù)集的強(qiáng)大能力,在準(zhǔn)確性、計(jì)算速度、內(nèi)存消耗、可重建的切片間距和可處理的細(xì)胞數(shù)量等方面均優(yōu)于當(dāng)前國(guó)際上主流的重建算法。
更具創(chuàng)意的是,Spateo的三維重建算法在拓展到兩個(gè)甚至多個(gè)完成重建的三維胚胎的配準(zhǔn)工作時(shí),能夠自然地捕捉跨時(shí)間點(diǎn)的細(xì)胞遷移、凋亡和分裂分化事件。該方法在細(xì)胞層面完美解決了胚胎形態(tài)發(fā)生學(xué)的關(guān)鍵問題,為后續(xù)的形態(tài)計(jì)量算法奠定了堅(jiān)實(shí)基礎(chǔ)。
區(qū)域數(shù)字化和細(xì)胞互作算法:識(shí)別細(xì)胞上下游調(diào)控網(wǎng)絡(luò),有望助力臨床應(yīng)用
生物發(fā)育的過程中,有一個(gè)確保發(fā)育精確性和對(duì)稱性的關(guān)鍵步驟,叫“軸線發(fā)育”,即組織和器官沿特定軸進(jìn)行有序分化與發(fā)育,如頭-尾軸、背-腹軸或左右軸。軸向發(fā)育為組織和器官的位置、形態(tài)及功能提供空間上的指引,因此該過程也被稱為“區(qū)域化”。
Spateo的區(qū)域數(shù)字化算法借鑒了物理學(xué)中的勢(shì)能場(chǎng)概念,可對(duì)任意形態(tài)的組織、沿任意軸向生成等高線進(jìn)行數(shù)字化分割,進(jìn)而識(shí)別出具有顯著軸向表達(dá)特征的關(guān)鍵基因。此方法尤其適用于研究具有分層結(jié)構(gòu)的發(fā)育問題,如大腦皮層(人類大腦皮層分為6個(gè)層次)、皮膚、血管壁等。

第11.5天小鼠腦中丘腦限制帶研究(a: 小鼠腦不同腦區(qū)是如何發(fā)育而成的 g:影響不同腦區(qū)功能的細(xì)胞互作網(wǎng)絡(luò))
通過區(qū)域數(shù)字化算法挖掘出一系列具有空間特征的基因之后,Spateo的細(xì)胞互作算法能夠構(gòu)建目標(biāo)基因的上下游調(diào)控關(guān)系網(wǎng)絡(luò),進(jìn)一步探討目標(biāo)基因的表達(dá)如何受到自身及周圍細(xì)胞的調(diào)控。
此兩種算法結(jié)合使用,在三維發(fā)育研究中具有重要應(yīng)用價(jià)值,有助于理解控制細(xì)胞行為的動(dòng)態(tài)過程,此外,在疾病研究中能幫助找到關(guān)鍵基因及其互作網(wǎng)絡(luò),有望為腫瘤等疾病的治療提供新思路。
形態(tài)計(jì)量向量場(chǎng)算法:關(guān)聯(lián)宏觀組織與微觀基因,為發(fā)育、疾病研究提供新見解
Spateo中最令人振奮、最具創(chuàng)意的算法是利用形態(tài)計(jì)量向量場(chǎng)算法,開創(chuàng)性地將宏觀組織的形態(tài)變化與微觀的基因表達(dá)變化關(guān)聯(lián)起來,這是以往工具未能實(shí)現(xiàn)的。該算法實(shí)現(xiàn)了對(duì)影響器官發(fā)生的關(guān)鍵基因進(jìn)行分子層面的推斷,為研究發(fā)育過程、疾病發(fā)生發(fā)展等問題提供了極具優(yōu)勢(shì)的新途徑。
具體而言,組織形態(tài)學(xué)變化通過物理空間中跨時(shí)間點(diǎn)的細(xì)胞遷移向量場(chǎng)進(jìn)行微分幾何計(jì)算,包含三維旋度、加速度、曲率、撓率(物體扭曲程度)和散度等物理量,這些量與生物發(fā)育過程密切相關(guān)。同時(shí),通過向量場(chǎng)中表達(dá)量的變化,可以挖掘出與這些物理度量高度相關(guān)的“形態(tài)計(jì)量”基因。
以小鼠心臟的非對(duì)稱發(fā)育研究為例,我們可以觀察到小鼠左心室的各種形態(tài)計(jì)量都比較保守,而主要發(fā)育自第二心場(chǎng)的右心房、右心室、還有左心房則有各自顯著的宏觀上的形態(tài)變化,Spateo能夠以物理度量的方式,找出與不同形態(tài)變化高度關(guān)聯(lián)的關(guān)鍵基因。此外,研究團(tuán)隊(duì)還開展了果蠅發(fā)育的研究,結(jié)果表明Spateo對(duì)幫助我們更好地理解先天性心臟缺陷等疾病具有重要意義。

小鼠心臟的非對(duì)稱發(fā)育研究(g:左心室在各種物理度量下都最保守,而其它的腔室有各自特異的顯著變化 h:算法鑒定出宏觀形態(tài)學(xué)變化所對(duì)應(yīng)的關(guān)鍵基因表達(dá))
隨著空間技術(shù)的不斷成熟并廣泛應(yīng)用,研究團(tuán)隊(duì)預(yù)見到單細(xì)胞基因組學(xué)的許多方法可以轉(zhuǎn)化為空間基因組學(xué),能夠在原位和三維空間中實(shí)現(xiàn)多視角、時(shí)空分辨的譜系解析和擾動(dòng)解析的細(xì)胞狀態(tài)動(dòng)態(tài)。
此外,Spateo的應(yīng)用將助力理解多種生物系統(tǒng)問題,舉例而言,通過生成空間分辨的跨物種細(xì)胞圖譜,比較不同物種間器官的三維模型,進(jìn)而揭示組織結(jié)構(gòu)的進(jìn)化過程,如脊椎動(dòng)物的四腔心臟是如何從無(wú)脊椎動(dòng)物的單腔心臟演變而來的。
文章通訊作者、華大生命科學(xué)研究院白寅琪博士表示:“Spateo采用數(shù)學(xué)建模的方式,可廣泛適用于空間組學(xué)領(lǐng)域各種科學(xué)問題的研究,為生命科學(xué)領(lǐng)域提供了革新性、系統(tǒng)性的整體研究方案。此外,Spateo工具包已開源,兼容目前包括華大時(shí)空組學(xué)技術(shù)Stereo-seq在內(nèi)所有的空間組學(xué)技術(shù),我們歡迎各領(lǐng)域科研工作者使用,共同推動(dòng)時(shí)空組學(xué)生命研究進(jìn)展?!?/span>
文章第一作者、斯坦福醫(yī)學(xué)院邱肖杰教授認(rèn)為,Spateo代表了我們?cè)趧?chuàng)建預(yù)測(cè)性虛擬胚胎模型的道路上的重要里程碑。與其它方法不同,Spateo能夠?qū)⑸锵到y(tǒng)視為一個(gè)相互連接的整體,而不僅僅是單個(gè)細(xì)胞,這在揭示先天性疾病背后的分子機(jī)制方面具有巨大的潛力,對(duì)促進(jìn)人類健康具有深遠(yuǎn)的影響。
“時(shí)空組學(xué)技術(shù)給生物學(xué)研究帶來了巨大的機(jī)遇,而對(duì)時(shí)空組學(xué)大數(shù)據(jù)分析是當(dāng)前的巨大挑戰(zhàn)?!蔽恼峦ㄓ嵶髡?、華大生命科學(xué)研究院院長(zhǎng)徐訊研究員表示,“Spateo是一個(gè)重大的飛躍,我們借鑒了多個(gè)學(xué)科的理論知識(shí),通過算法彌補(bǔ)了實(shí)驗(yàn)技術(shù)無(wú)法解決的問題,譬如切片的細(xì)微形變、需要克服不連續(xù)間斷取樣造成的數(shù)據(jù)丟失問題,還解決了跨時(shí)間點(diǎn)重構(gòu)發(fā)育過程中的細(xì)胞分化、遷移等難題。隨著時(shí)空技術(shù)的進(jìn)步和普及,相信Spateo這樣的前瞻性算法研究,能為我們真正從時(shí)空維度系統(tǒng)研究生命的過程奠定基礎(chǔ)。”
斯坦福醫(yī)學(xué)院邱肖杰教授為文章第一作者,并與華大生命科學(xué)研究院白寅琪博士、劉石平研究員、徐訊研究員,以及武漢大學(xué)馬佳義教授共同擔(dān)任通訊作者。麻省理工學(xué)院博士生Daniel Y. Zhu、武漢大學(xué)博士生盧意帆、華大生命科學(xué)研究院與西北大學(xué)聯(lián)合培養(yǎng)本科生姚佳俊、華大生命科學(xué)研究院-中國(guó)科學(xué)院大學(xué)博士生荊澤華、Ginkgo Bioworks研究人員Kyung Hoi Min、華大生命科學(xué)研究院博士后成夢(mèng)南為共同第一作者。
該項(xiàng)目通過倫理審查等相關(guān)審批,嚴(yán)格遵循相關(guān)法規(guī)和倫理準(zhǔn)則執(zhí)行。國(guó)際合作僅限于計(jì)算建模與數(shù)據(jù)分析,不涉及任何物質(zhì)或財(cái)務(wù)資源。項(xiàng)目中的所有軟件開發(fā)均以透明方式進(jìn)行,并可在GitHub上公開訪問,本研究中使用的數(shù)據(jù)現(xiàn)已公開訪問。
Spateo使用教程:https://spateo-release.readthedocs.io/en/latest/