農(nóng)業(yè)工作促進了作物產(chǎn)量增加,滿足了糧食需求。糧食產(chǎn)量提高主要歸功于品種遺傳改良和栽培管理方法提升。作物育種技術(shù)的發(fā)展主要分為四個階段,目前已進入到第四代的智能育種,但全球育種水平大部分停留在常規(guī)育種階段。面對人口增長的挑戰(zhàn),需要整合現(xiàn)代的最新技術(shù),提升育種技術(shù),進一步加快遺傳改良進程。
2023年12月22日,由華中農(nóng)業(yè)大學玉米團隊李林教授領(lǐng)銜,聯(lián)合國內(nèi)多個研究團隊,在Molecular Plant在線發(fā)表了題為The CropGPT project: A call for a global, coordinated effort in precision design breeding driven by AI using biological big-data 的文章。該文向全球發(fā)起了開放、共享與合作的智能育種倡導——CropGPT,探討了如何整合現(xiàn)有資源(包括種質(zhì)、生物大數(shù)據(jù))及人工智能方法、升級現(xiàn)有育種技術(shù),并提出了可能的運作流程及潛在理論基礎(chǔ)。
作物產(chǎn)量是一個復雜的性狀,涉及復雜的基因調(diào)控網(wǎng)絡和品種差異性。因此,系統(tǒng)分析基因的調(diào)控突進,引入平衡多個性狀的最佳等位基因,是確保或促進產(chǎn)量提高的有效途徑。隨著測序技術(shù)的發(fā)展,多種基因組學數(shù)據(jù)可以與蛋白質(zhì)組學及代謝組學數(shù)據(jù)相結(jié)合,系統(tǒng)地研究每個遺傳層內(nèi)或不同遺傳層之間功能元件的相互作用,從而產(chǎn)生網(wǎng)絡大數(shù)據(jù)(NBD)。人工智能和基因編輯等多種先進技術(shù)被用于NBD 挖掘已有報道。
Generative Pre-trained Transformers(GPT)是一種強大的語言模型,它們利用轉(zhuǎn)換器模型(一種基于自注意力機制的神經(jīng)網(wǎng)絡模型)從廣泛的訓練數(shù)據(jù)中學習并生成文本。自然語言處理(NLP)可用于處理多模式輸入如基因組學、環(huán)境參數(shù)、田間管理及其相互作用。GPT/NLP 的繁榮為通過增強生物大數(shù)據(jù)的分析,進行精準的智能設計育種帶來了希望。因此,該研究論文提出CropGPT 新概念,并向全球發(fā)起CropGPT 智能設計育種合作倡導。CropGPT 的成功開發(fā)將需要兩個主要要素,一是合作與整合,二是作物育種的多模式GPT。該項目將堅持開放、合作以及共贏的團隊育種模式,需要育種家、生物學家、數(shù)學家、計算機學家、育種公司和生物技術(shù)公司之間的合作(圖1A)。首先育種家提供基礎(chǔ)的育種資源,育種公司利用DH 等工程化技術(shù)構(gòu)建育種群體。其次,生物學家利用多組學數(shù)據(jù)構(gòu)建基因網(wǎng)絡結(jié)合AI 技術(shù)鑒定基因-性狀調(diào)控關(guān)系,提供大量與特定性狀相關(guān)的功能基因集合。此外靶向基因分型檢測需要提高標記的有效性,高通量基因分型(與特定性狀相關(guān)的基因)和表型分型(種群)將通過生物技術(shù)公司的協(xié)同努力進行。然后,數(shù)學家整合基因型數(shù)據(jù)、表型數(shù)據(jù)和環(huán)境因素來開發(fā)合適的大數(shù)據(jù)模型,而計算機學家通過模型預測合適的組配方式并提供建議。最后育種家/生物家根據(jù)育種建議進行雜交組合配制和基因編輯,根據(jù)性狀鑒定優(yōu)質(zhì)材料或組合。優(yōu)質(zhì)的組配材料可直接進行商業(yè)化應用,同時也可以再次加入基礎(chǔ)種質(zhì),通過迭代優(yōu)化大數(shù)據(jù)模型。
圖1 CropGPT智能設計育種架構(gòu)
多模式GPT 將開發(fā)用于作物育種,數(shù)學家將基于大規(guī)模的育種語料庫開發(fā)合適的育種語言模型,這是CropGPT 成功的關(guān)鍵因素。在此基礎(chǔ)上,研究人員的目標是在CropGPT 中開發(fā)一種特征融合方法,該方法使用獨立的預訓練編碼器來處理多模態(tài)數(shù)據(jù),包括表型、環(huán)境因素、基因型、多組學數(shù)據(jù)、基因網(wǎng)絡和文本等,從而統(tǒng)一生命語言。理想情況下,神經(jīng)網(wǎng)絡和自監(jiān)督學習技術(shù)將被整合到CropGPT 中,以實現(xiàn)多種模態(tài)數(shù)據(jù)和人類自然語言之間的對齊和翻譯。最終期望CropGPT 能夠?qū)崿F(xiàn)自由文本查詢、多模態(tài)輸入,并支持不同的下游任務(圖1B)。
綜上所述,CropGPT項目旨在協(xié)同應用DH技術(shù)、人工智能、基因組編輯、多組學等多種前沿技術(shù),對基礎(chǔ)種質(zhì)資源進行分析和豐富,開發(fā)最優(yōu)生物大數(shù)據(jù)模型(LLMs/GPT),提高育種的精準設計。
—— 原文 ——
Zhu W, Han R, Shang X, et al. The CropGPT project: A call for a global, coordinated effort in precision design breeding driven by AI using biological big-data[J]. Molecular Plant, 2023, 16: 206-231.
實驗室-溫室-田間的一體化DH生產(chǎn)服務+基因編輯服務+高通量表型儀器和服務方案
北大荒墾豐種業(yè)-澤泉科技生物技術(shù)與表型服務中心是由北大荒墾豐種業(yè)股份有限公司和上海澤泉科技股份有限公司共同建設的開放式高通量植物基因型-表型-育種服務平臺。中心建立了基因克隆和載體平臺、作物轉(zhuǎn)化系統(tǒng)、基因型分析平臺、表型鑒定分析平臺、數(shù)據(jù)分析和利用平臺等現(xiàn)代化生物技術(shù)和信息支持平臺,是定位于為植物科研和作物育種提供植物基因型-表型-育種數(shù)據(jù)分析的科研服務平臺。
為了縮短您的育種進程,提高您的育種成功率,北大荒墾豐種業(yè)-澤泉科技生物技術(shù)與表型服務中心將為您提供DH服務技術(shù)流程(實驗室-溫室-田間一體化服務)、測序服務、高通量表型儀器和服務。
實驗室-溫室-田間的一體化DH生產(chǎn)服務
單倍體產(chǎn)生:父本誘導系誘導母本材料,孤雌生殖,產(chǎn)生單倍體種子(幼胚)。
剝胚及培養(yǎng):20-60份/皿。置于人工培養(yǎng)室(帶光照層架)或人工培養(yǎng)箱中培養(yǎng)48小時左右。
挑選:將幼胚在體視熒光顯微鏡下觀察或者在日光燈下觀察,以自交系所得幼胚為對照。因為雜合二倍體含有父本基因,所以單倍體有微弱熒光或無色。
生苗:將挑選的擬單倍體直接置于含有加倍藥劑(秋水仙素)的MS培養(yǎng)基上,暗培養(yǎng);后轉(zhuǎn)入不含加倍藥劑的MS培養(yǎng)基,暗培養(yǎng)后光照培養(yǎng),待幼苗2葉一心時移至培養(yǎng)瓶中(MS培養(yǎng)基)。
煉苗:將培養(yǎng)瓶中DH系幼苗在4葉一心時移栽至苗缽,在溫室中煉苗。
移栽:待幼苗5-6葉期移栽至溫室花盆或大田,待散粉時,及時套袋進行自交授粉。
收獲:田間收獲和鑒別。如果用采用花藥離體培養(yǎng)單倍體的方法,則省去觀察幼胚的步驟,其余步驟基本相同。
靶向測序服務
靶向測序技術(shù)主要分為基于多重PCR的靶向基因捕獲技術(shù)(GenoPlexs)和基于液相探針雜交的靶向基因捕獲技術(shù)(GenoBaits)兩種??赏瓿蓡螛悠?0-5000和3000-40000標記的基因型分析,并達到可設計區(qū)域覆蓋度高于95%,擴增子均一性高于90%的捕獲效率。
高通量表型儀器和服務方案
突變株作為育種的主要載體,篩選與鑒定工作復雜而繁重。高通量表型分析設備和熒光成像系統(tǒng)都可服務于突變株的篩選,具體體現(xiàn)在對一些物理誘變和化學誘變產(chǎn)生的突變?nèi)后w,定時觀察植株形態(tài)、顏色等變化,可以獲得大量的植物表型參數(shù),構(gòu)建指紋圖譜。此外,還可利用IMAGING-PAM熒光系統(tǒng)對植物幼苗進行光合特性測定,高效篩選突變單株。隨著植物生物技術(shù)和基因工程的發(fā)展,細胞遺傳操作與農(nóng)藝性狀改良顯得尤為重要。細胞遺傳操作之后導致農(nóng)藝性狀例如生育期,株高,葉面積,果實重量等改變,均可以通過中心服務平臺高通量表型平臺進行分析。目前,平臺已針對小麥、水稻、玉米、黃瓜、番茄、辣椒、楊樹、丹參、擬南芥、煙草、蕎麥等多種植物進行表型服務,服務內(nèi)容涉及脅迫生理,生長模型構(gòu)建、生長勢評價等領(lǐng)域。
如您需要了解更多信息,請識別下方二維碼填寫登記表,我們會為您提供專業(yè)的服務,真誠期待與您的合作!
電話:021-32555118
郵箱:sales@zealquest.com