IT 之家 11 月 4 日消息,IT 之家從中國農科院基因組所官方微信公衆号獲悉,今日《自然・遺傳學(Nature Genetics)》在線發表了中國農業科學院深圳農業基因組研究所(嶺南現代農業科學與技術廣東省實驗室深圳分中心)周永鋒團隊利用人工智能進行葡萄育種的最新研究成果。該研究将大幅縮短葡萄育種周期,且對葡萄農藝性狀的預測準确度高達 85%。相比傳統方法,育種效率可提高 400%。該研究有望實現葡萄的精準設計育種,加速葡萄品種創新,并爲其他多年生作物育種提供方法參考。
周永鋒團隊自 2015 年起,便開始聚焦葡萄的設計育種工作,并于 2023 年發布首個葡萄端粒到端粒完整參考基因組圖譜,相關研究以封面文章發表在《園藝研究(Horticulture Research)》上。
圖源 Pexels
然而,要實現精準 " 設計 ",一個基因組數據遠遠不夠。在此基礎上,周永鋒團隊又陸續對包括野生種和栽培品種在内的 9 個二倍體葡萄品種進行測序、組裝,得到 18 個端粒到端粒的單倍型基因組,并整合已有的基因組數據,構建了目前首個最全面、最準确的葡萄泛基因組(Grapepan v1.0),總長度達 1.43Gb,是單個參考基因組大小的近 3 倍。
爲了進一步弄清楚葡萄基因與性狀之間的關聯,周永鋒團隊從近萬份葡萄品種中選取了 400 多份有代表性的葡萄品種,連續 3 年對包括果穗大小、漿果中代謝物含量、漿果大小和果皮顔色等在内的 29 個農藝性狀進行調查,構建了葡萄基因型圖譜和性狀圖譜。在此基礎上,周永鋒團隊利用數量遺傳學分析,鑒定到 148 個與農藝性狀顯著相關的位點,其中 122 個位點爲首次發現。研究發現,調控不同性狀的位點間存在關聯性,如可溶性固形物含量和漿果寬度相關位點鄰近。此外,不同葡萄群體(釀酒、鮮食、美洲鮮食雜種)之間存在顯著分化的區域,這些區域中存在與漿果顔色、果皮澀味、漿果形狀、果穗重量、果肉硬度、果實大小等相關的多個性狀相關的遺傳位點,表明對農藝性狀歧化選擇促進了釀酒與鮮食葡萄的分化。
全面、準确的基因組數據是精準 " 設計 " 育種的基礎,而如何深入挖掘這些數據來優化育種策略并指導育種?是智能育種必須回答的問題。周永鋒團隊決定引入機器學習,通過構建預測模型,根據評分進行早期個體的預測和選擇,從而指導、優化育種策略。
在本研究中,研究人員将包含了性狀和基因型的數據劃分爲三個子集:訓練集、驗證集和測試集。利用機器學習算法解析基因型與性狀數據間的複雜網絡關系,運用訓練數據集構建了首個葡萄全基因組選擇模型,研究進一步通過驗證集調整模型參數,對模型進行優化,最後測試數據集評估最終模型的性能。研究結果表明,結合了結構變異信息和機器學習模型的計算多基因評分預測準确率高達 85%。
通過這一模型,育種家可以快速準确地評估大量育種材料的遺傳潛力,從而更好地選擇優良品種。與雜交育種需要根據葡萄成熟後的表型作出判斷相比,全基因組選擇育種技術在葡萄幼苗時期就可以預測其成熟後的性狀,盡早剔除掉不符合條件的幼苗,減少了不必要的人工成本和投入,在葡萄育種應用中有很大的應用潛力,提高葡萄育種效率,加速葡萄新種質的創制,革新葡萄育種策略。
目前,相關研究成果已申請獲批國家發明專利 6 項,已申請國際專利 1 項。