不同于蛋白質計算,RNA 計算與 DNA計算是利用生化反應,更確切地講,是以核酸分子間的特異性雜交為機理的計算模型。由于RNA分子不僅在實驗操作上沒DNA 分子容易,而且在分子結構上也不如DNA 分子處理信息方便,故對 RNA 計算的研究相對較少,蛋白質計算與RNA計算D
生物計算行業前景如何?具體來說,就是根據不同類型的生物數據(比如濃度、序列、圖像等)來構建算法和模型,從而理解生物系統本身(比如分子、細胞、組織和器官等),并推進相關研究及應用的學科。
生物計算研究包括器件和系統兩個方面。利用有機(或生物)材料在分子尺度內構成的有序體系、提供通過分子層次上的物理化學過程信息檢測、處理、傳輸和存儲的基本單元。稱為分子器件。生物計算系統的結構和計算原理不同于傳統的計算系統,它的結構一般是并行分布式的。信息存儲往往是短時記憶和長時記憶的結合,是通過學習完成的。它的計算則表現為復雜的動態過程,不僅存在精確的時間同步,甚至要求在分維時間尺度上才能描述。
不同于蛋白質計算,RNA 計算與 DNA計算是利用生化反應,更確切地講,是以核酸分子間的特異性雜交為機理的計算模型。由于RNA分子不僅在實驗操作上沒DNA 分子容易,而且在分子結構上也不如DNA 分子處理信息方便,故對 RNA 計算的研究相對較少,蛋白質計算與RNA計算少有進展,但DNA計算發展很快1。
而從應用劃分,目前主要落地領域包括序列分析、結構和功能分析、生物分子動力學、系統建模、進化和群體基因組學、相關性網絡……
以AlphaFold2為例,它是基于基因序列預測蛋白質結構,屬于結構和功能分析范疇。
可以看到的是,計算生物學屬于工具性質的學科。某種程度上這決定了市面上尚不存在嚴格意義上的計算生物學公司,而是以AI制藥、組學、精準醫療等名義出現。
根據中研普華研究院《2022-2027年中國生物計算行業市場前瞻分析與未來投資戰略規劃報告》顯示:
在中國全面進入數字經濟時代,以及國家推動生物經濟成為經濟發展的新引擎的雙重背景之下,CB Insights 中國關注生物計算領域,力爭鎖定數字經濟時代下活躍的中國生物計算企業,期望為前沿科技成果轉化,企業和人才發展帶來新的契機。
生物計算一方面是用生物技術賦能計算技術的領域,CB Insights 中國研究團隊認為,生物計算是生物技術和計算技術的前沿交叉領域,具有十分廣闊的內涵。
人工智能落地已經進入“大模型”時代。大規模預訓練模型使用自監督學習的方法讓模型對海量無標注數據中的規律和知識進行提煉、學習,當面向任務和場景應用時,只需要少量的任務標注數據,就能通過持續微調得到在應用場景中非常好用的模型,對具體任務的賦能效果顯著,大規模預訓練模型在NLP、CV等多類任務上已經展現出強大的優勢。
人工智能大模型的下一個奇跡,將出現在生物計算領域,生物計算行業將出現規模最大、效果最好、價值最高的大模型,成為行業的重大基礎設施,不僅徹底改寫藥物研發的技術能力,也將對人工智能底層技術發展起到巨大的推動作用,反哺其他行業的AI技術發展。
今年8月阿里云正式發布飛天智算平臺,以算力和大數據AI一體化的解決方案服務于生物醫藥等算力高需求行業,其用戶深勢科技與阿里云合作定向優化其分子動力學仿真模擬模型,訓練效率提升了5倍;北大化學與分子工程學院進行靶向藥物研究的數據集構建效率提升了100倍。
生命科學數據的大爆發,傳統研究方法在現有算力條件下面臨計算成本過高、效率過低的問題。由此,智能計算成為突破藥物設計中分子蛋白質結構或功能預測、藥物親和力分析、成藥性評估等關鍵難點問題的有力武器。
從現狀分析來看,計算生物學行業離商業化爆發還需至少5年時間,目前還不好做市場規模計算。
可以預見的是,計算生物學未來的產業鏈將會是以數據提供商為底層支撐+上層各類相關從業公司(包括提供計算平臺和軟件、分子建模/機器學習框架、算力以及智能實驗室的企業)的結構構成。
眼下,要想實現以上期待,年輕的計算生物學還有著以下幾大關鍵瓶頸待突破——有的問題為該行業獨有,也有的是整個AI科學領域都存在的:
一是對生物底層原理的明確。目前,我們還有大量關于生物學本身的底層機制待研究透徹,在進行模型構建、生物驗證及人體落地時,需要引入這次知識來減少不符合領域認知的偏差,保證準確率。
二是統一的計算和數據框架?;谖⒂^手段,一些生物學上的特定問題能夠得到解決,但要最終落地,所需的模型需要能夠覆蓋多組學數據、多環節及功能并行。
此外,需要保證計算生物學中的多種異構數據,例如圖像、視頻、分子圖譜、DNA 代碼、基因表達、電信號等,有明確的標準和通用格式,以便在不同算法和平臺之間互操作。
三是消費級數據的獲取。在分析師看來,基因組學相關的計算生物學,其關鍵的產業發展階段是數據采集達到了消費級水準。
四是工程落地能力。目前學術上有很多機器學習算法和模型已經相當成熟,關鍵是如何在具備底層數據的情況下,加入對生物學的具體理解,進行精細地調整。
最后就是數據隱私的問題,以及如何讓相關模型具備可解釋性,取得這一特殊行業的信任問題。
隨著互聯網的普及和技術的發展,大數據和云計算已經滲透在人們的生活的各個方面,在金融,零售,能源,交通等領域已經得到廣泛應用。而對于生物信息來說,生物的DNA,基因序列,生物芯片等無時無刻不產生新的數據,生命科學的數據來源和形式多樣,包括基因測序、分子通道、不同的人群等。每個臨床試驗需要千上萬病患的數年統計資料,而DNA測序的每個樣本產生的數據則以兆兆位計算;如果能高效、高速地利用這些大數據,無疑將為生命科學領域帶來無限機遇。
目前國家大力支持生物云計算行業的發展。隨著行業競爭的不斷加劇,國內優秀的企業愈來愈重視對行業市場的研究,特別是對產業發展環境和產品購買者的深入研究。一大批國內優秀的企業品牌迅速崛起,逐漸成為行業翹楚。
本報告綜合了生物計算行業的整體發展動態,對行業在產品方面提供了參考建議和具體解決辦法。報告對于生物計算產品生產企業、經銷商、行業管理部門以及擬進入該行業的投資者具有重要的參考價值,對于研究我國生物計算行業發展規律、提高企業的運營效率、促進企業的發展壯大有學術和實踐的雙重意義。
想了解更多關于生物計算行業專業數據分析,請點擊查看中研普華研究院出版的報告《2022-2027年中國生物計算行業市場前瞻分析與未來投資戰略規劃報告》。
關注公眾號
免費獲取更多報告節選
免費咨詢行業專家

2022-2027年中國生物計算行業市場前瞻分析與未來投資戰略規劃報告
生物計算是指利用生物系統固有的信息處理機理而研究開發的一種新的計算模式。生物計算研究包括器件和系統兩個方面。利用有機(或生物)材料在分子尺度內構成的有序體系、提供通過分子層次上的物...
查看詳情
一、智能馬桶行業概述智能馬桶又稱智能坐便器或電子馬桶,屬于建筑給排水材料領域,是指在傳統的陶瓷或塑料坐便基上安...
余熱發電作為一項通用技術,不僅是水泥、玻璃生產線可以安裝余熱發電設備,其他如鋼鐵、冶金、化工這些高耗能行業將來...
我國余熱發電行業前景如何?在國家政策的大力推廣下,我國余熱發電裝機規模不斷增長,目前,中國仍有將近一半的工業能2...
目前,中國科技創業孵化機構已經超過1.5萬家,是全球孵化器數量最多的國家。據不完全統計,中國在孵化器方面的運營收5...
隨著風能、太陽能等新能源在我國能源體系中的占比不斷提升,與新能源發展緊密相關的儲能技術和產業也備受關注。今年以...
一、明膠的概念明膠是一種大分子的親水膠體,是膠原部分水解后的產物。按其性能和用途可分為照相明膠、食用明膠和工業...
微信掃一掃