6月30日,深圳鹽田,熱浪滾滾。北山道136號,幾棟白色的建筑并不起眼。龐大的數據如同螺旋一般,每天從這里源源不斷地涌出。偶爾從門口經過的人也許無法想象,這些數據有一天會完全改變他的生活。全球最大的基因組研究中心、深圳華大基因就藏在這些白色建筑里,“生產”出全球40%的基因測序數據。
離此約20公里處,一塊11.6萬平米的巨大“梯田”正在深圳大鵬街道下沙片區禾塘仔地塊上建起。這里是由華大基因組建及運營的中國首個國家基因庫,一期基本完工,樣本量達840萬份,今年10月有望投入使用。
基因“國庫”:一部要看4萬年的高清電影
華大基因董事長汪建把即將面世的國家基因庫形容為每個人的“生物銀行”。2015年10月,中國首個國家基因庫有望投入使用。“把你個人的東西存在基因庫里,我們才是真正的‘國庫’。”
2011年1月,國家發改委批復同意深圳依托華大基因組建國家基因庫。同年10月,國家發改委、財政部、工業和信息化部以及當時的衛生部批復,深圳國家基因庫由深圳華大基因組建及運營。
離鹽田的華大基因總部約20公里處,一塊11.6萬平米的巨大“梯田”正在深圳市大鵬街道下沙片區“禾塘仔”地塊上立起。
2002年4月5日,《科學》雜志以14頁的篇幅發表了華大基因《水稻(秈稻)基因組的工作框架序列圖》,封面是秀美的云南紅河哈尼梯田。正在建設的國家基因庫,建筑外形基本參照龐大的哈尼梯田,分兩期建設,目前一期基本完工,樣本量已達840萬份。
“未來,你可以把你的血液、細胞、尿液、meta、DNA、RNA存在這里,動植物、海洋、微生物組織也會存起來。”按規劃,2015年前建設完善生物資源樣本庫及配套的自動化樣本處理流水線,預計將保存3000萬份可溯源的生物實驗樣本。“人的樣本,特別是與醫學健康相關的樣本會占主導。”
與此同時,生物信息數據庫將儲存與樣本相關的所有數據,包括基因組、轉錄組、蛋白組學、表型數據,高性能計算儲存集群系統則作為信息化平臺支撐。
這個建設中的基因“國庫”,數據規模到底有多大?“以一部高清電影4G B、時長1.5小時算,如果把國家基因庫當做一部高清電影,要看上4萬年。”國家基因庫負責人曾有一個形象的形容。
測序工廠:100多臺測序儀24小時運行
基因“國庫”聽上去很高大上,但汪建把基因學研究與產業化應用,自嘲為一件很“俗”的事,“我們是貪生怕死,就是想先天下之樂而樂”。
1999年,哥本哈根大學的遺傳學博士楊煥明、華盛頓大學的汪建和于軍等四人“自作主張”,以中國代表的身份,向人類基因組計劃提交注冊申請。他們負責的是3號染色體短臂末端的30 M b(兆)堿基測序,僅占總計劃的1%。“那時還沒有電子屏幕,只能掛起一張10米長3米高的基因圖,每天有人拿著筆和尺子在上面一點點填充”。
6月30日,記者走進位于深圳鹽田的華大基因時,早已看不到汪建回憶中的“手工作坊”場景,取而代之的是每天24小時自動化運行的100多臺測序儀。
30歲的陳城超換鞋、穿上白大褂、消毒進入測序機房,他負責樣本的上機測序環節。2008年從華師生物系畢業的他,操作起這些外人看不懂的機器來如魚得水。
一管血液、一截頭發、一口唾液……一份基因樣本抵達實驗室后,首先被陳城超的同事接收確認,錄入信息系統。樣品的基因組通常過長,測序儀沒法進行一次測序,需要把基因組打斷成小片段。
隨后,檢測人員從質量和濃度檢測樣本是否合格。不同樣本和測序類型的濃度不一,以無創產前檢測為例,因分析數據較少,幾納克即可;如果是腫瘤基因檢測,濃度則為幾十納克。
樣本合格后,會送到陳城超的實驗室內。由于單分子的信號非常弱,他會先將其在擴增儀上進行擴增。“通俗地說,就是將其復制為大量相同的雙螺旋,在D N A兩端分別設置接頭,當其長成一個簇后,信號就被放大了。”
陳城超一邊解釋,一邊在小黑板上畫出這些“簇”和連接的過程。至此,樣本建庫完成,等待送到測序儀上進行“上機操作”。
完成試劑準備工作,陳城超點擊“RU N”按鈕,測序過程完全自動化運行。“跑”一次后,測序結果將自動上傳到大型數據庫,有專門人員進行信息分析并發放報告。
日復一日,龐大的數據如同螺旋一般,源源不斷在這條測序流水線上涌出。
精準醫療:先在基因圖譜里尋找“錯別字”
汪建逢人便說,他是華大基因的“大白鼠”。2002年,他被診斷出冠心病。他給自己做了基因檢測,發現糖脂及代謝綜合征相關基因、心血管及猝死相關基因、腫瘤易感基因等多種易感基因。坦言“怕死”的老頑童汪建,開始針對自己的基因數據,對自己的冠心病精準用藥,同時定期預測監控體內生態平衡狀況,再通過飲食和鍛煉進行調整。
汪建把自己的遺傳蛋白、代謝、菌群、環境、平時的體質評價、運動、營養、睡覺、飲食甚至心情等情況一一記錄,連續跟蹤10年,已記錄下超過14T的多組學健康數據。
他認為自己的模式就是精準醫療的試驗。
2015年1月,美國總統奧巴馬在國情咨文演講中談到“人類基因組計劃”所取得的成果,并宣布新的項目— 精準醫療計劃。“精準醫療計劃在時間上是承接人類基因組計劃,在本質上是對現行的以藥物治療為主體的醫療進行改革。”南方醫科大學基礎醫學院副院長張文清認為,精準醫療將影響和改變未來的醫療、藥物研發和使用,使治療、診斷和用藥更趨精確。
2013年,國家基因庫出生缺陷聯盟正式成立。在汪建眼里,超過一半的疾病,都可以通過基因測序得以提前防范和管理。第一類是針對遺傳出生缺陷的產前檢測,第二類是病毒和細菌的基因檢測,如艾滋病、埃博拉、SA RS、結核病等,通過基因測序也能找出“元兇”。此外,很多腫瘤的發生也是基因變異的結果。
基因測序究竟如何“鎖定”疾病?生物科學博士、華大基因總部辦公室主任楊碧澄給出一個形象描述:一個D N A的正常表達可以理解為一段文字,如果該文字中出現一個錯別字,可能就失去其正確意義。測序就是要與正常序列比對,找出哪個細胞哪里出錯。而錯誤有不同類型,可能是一個錯別字,可能是整段話都錯了,還可能是一段話跳到了另一個位置。這時,通過測序結果,分析基因突變的部分,從而找到某個疾病對應的基因,方便對癥下藥。
知曉基因圖譜,只是邁向精準醫療的第一步。“惡性腫瘤的發生往往伴隨著眾多基因點位的突變。”南方醫科大學基因研究所所長馬文麗就說,疾病總是外因與內因相結合的產物,惡性腫瘤也不例外。楊碧澄也坦言,基因不是單個作用的過程,而是復雜交互的過程,可能涉及很多性狀,需要積累大量數據,才能找出科學解答。
但基因檢測的應用正在加速。深圳國家基因庫建成后,這個巨型“生物銀行”將為中國生命科學研究和生物產業發展提供基礎性和支撐性服務平臺,儲存和管理中國特有的遺傳資源、生物信息和基因數據。同時,以生物資源為依托,形成從資源到科研到產業的全貫穿、全覆蓋模式,實現大資源、大數據、大科學、大產業的整合與應用。
圖基于卷對卷流體的新一代快速低成本基因測序技術在國家自然科學基金項目(批準號:22027805、22334004、22421002)等資助下,福州大學楊黃浩、陳秋水團隊與華大生命科學研究院秦彥哲、章文......
數據元件互聯互通實踐助力跨區域跨行業釋放數據價值推薦單位:中國電子信息產業集團有限公司申報單位:中電數據產業集團有限公司中電數據產業集團有限公司依托數據元件理論,基于國產自主軟硬件,融合大數據、人工智......
近日,一項發表于《分子精神病學》的研究發現,單個基因GRIN2A可直接導致精神疾病。而此前的研究認為,精神疾病是由許多基因共同作用所致。根據世界衛生組織(WHO)數據,2021年全球每7人中就有1人患......
三維基因組互作與表觀遺傳修飾是基因表達調控的重要因素,其動態變化與細胞生長發育及癌癥等疾病的發生發展密切相關。解析染色質在活細胞內的時空動態,是理解基因調控機制的重要科學問題。現有基于CRISPR-C......
11月1日,在長沙舉行的第五屆湖南省抗癌協會家族遺傳性腫瘤專業委員會學術年會上,中信湘雅生殖與遺傳專科醫院(下稱中信湘雅)首席科學家盧光琇宣布,該院第100位通過胚胎植入前遺傳學檢測(PGT)技術阻斷......
10月16日,記者從中信湘雅生殖與遺傳專科醫院獲悉,該院研究員林戈、副研究員鄭偉團隊,聯合山東大學、上海交通大學醫學院等單位的科研團隊開展合作攻關,系統揭示了卵子與早期胚胎質量問題導致女性反復“試管”......
衰老對身體產生的可見影響有時與基因活動的無形變化有關。DNA甲基化的表觀遺傳過程會隨著年齡增長而變得不再精確,造成基因表達的變化。而這種變化與隨著年齡增長而出現的器官功能衰退和疾病易感性增加有關。如今......
有些人比同齡人更顯年輕,而有些人看著更顯老;有些人年逾九旬仍身心康健,而另一些人早在數十年前就飽受糖尿病、阿爾茨海默病或行動障礙的困擾;有些人能輕松應對嚴重摔傷或流感侵襲,而有些人一旦住院就再難康復。......
在一個繁忙的火車站,監控攝像頭正全方位追蹤站臺的情況,乘客流量、軌道占用、衛生狀況……所有信息實時傳輸給中央人工智能(AI)系統。這個系統的任務是幫助調度列車,讓它們安全準點進站。然而,一旦有人惡意干......
近日,西北農林科技大學玉米生物學與遺傳育種團隊聯合華中農業大學玉米團隊在《植物生理學研究》發表論文。研究初步揭示了ZmGBF1-ZmATG8c模塊通過自噬途徑調控玉米耐熱性的分子機制。隨著全球氣溫持續......