百度悶聲幹大(dà)事
進入到(dào) 2022 年,生物科技領域,動态不(bù)斷。
僅過半個(gè)月,有 4 家生物科技相關公司被同一(yī / yì /yí)家企業投資;不(bù)僅如此,它所投的(de)項目在(zài)《麻省理工科技評論》(MIT Tech Review )的(de)十大(dà)突破性發明“AI 新藥發現”闆塊占比過半……
這(zhè)些動态的(de)背後,都離不(bù)開一(yī / yì /yí)家互聯網巨頭:百度。
對于(yú)鮮少關注醫學領域的(de)人(rén)來(lái)說(shuō),很難将百度和(hé / huò)生命科學進行聯系,但從其近年來(lái)的(de)種種舉措來(lái)看,在(zài)生命科學領域,百度正“悶聲幹大(dà)事”。
百度 AI 落地(dì / de)的(de)另一(yī / yì /yí)站
對外界而(ér)言,百度 AI 落地(dì / de)最廣爲(wéi / wèi)人(rén)知的(de)場景在(zài)于(yú)自動駕駛領域,即百度 Apollo,但對于(yú)百度而(ér)言,其 AI 的(de)野心并不(bù)止于(yú)此——對于(yú)生命科學領域,百度同樣想吃下;不(bù)僅因爲(wéi / wèi)這(zhè)是(shì)一(yī / yì /yí)個(gè)極具前沿性的(de)方向,而(ér)且關系到(dào)李彥宏“最初的(de)夢想”。
大(dà)約在(zài) 20-25 年前,李彥宏就(jiù)對生物信息學挖掘人(rén)體秘密充滿興趣。
早在(zài) 90 年代,李彥宏在(zài)華爾街時(shí)便申請過生物信息研究相關的(de)工作,據說(shuō)當時(shí)已經拿到(dào)世界頂尖生命科學研究機構的(de) Merck(默克集團)的(de) offer。
不(bù)過,在(zài)他(tā)看來(lái),當時(shí)的(de)基因測序技術還非常初級,生物數據量和(hé / huò)數據質量也(yě)不(bù)足以(yǐ)發揮計算的(de)優勢。
“如果那麽多從事生命科學的(de)人(rén)都不(bù)相信計算機能夠對生命科學産生重要(yào / yāo)影響,那麽靠我一(yī / yì /yí)個(gè)人(rén)力量恐怕也(yě)很難推動”,李彥宏事後回憶。
後來(lái)的(de)事情也(yě)不(bù)難得知,李彥宏回國(guó)創立了(le/liǎo)百度,而(ér)後百度又在(zài) AI 上(shàng)迅猛發力,并在(zài)包括智能駕駛等領域進行落地(dì / de)實踐。
但對李彥宏來(lái)說(shuō),他(tā)始終沒有放下對生命科學的(de)向往。李彥宏曾多次在(zài)公開場合提到(dào)計算機技術與生命科學相結合的(de)可能性。
在(zài)他(tā)看來(lái),基因測序是(shì) IT 領域之(zhī)外另一(yī / yì /yí)個(gè)高度契合摩爾定律的(de)領域。“每隔 18 個(gè)月,計算機的(de)計算能力提升一(yī / yì /yí)倍、成本下降了(le/liǎo)一(yī / yì /yí)半,經過幾十年這(zhè)樣的(de)速度發展,很多原來(lái)覺得不(bù)可能的(de)事情變可能了(le/liǎo)”,李彥宏表示。
從基因測序的(de)發展來(lái)看,的(de)确如此。十幾年前,基因測序需要(yào / yāo)花費 10 億、20 億才做出(chū)來(lái)。如今,每個(gè)人(rén)的(de)基因測序隻需花費 1000 美元左右。
即使當初想投身聲明科學的(de)“夢”被暫時(shí)擱置,但在(zài)很長一(yī / yì /yí)段時(shí)間裏,李彥宏一(yī / yì /yí)直在(zài)嘗試推動互聯網技術和(hé / huò)生命科學的(de)結合,曾個(gè)人(rén)捐資 3000 萬元與協和(hé / huò)合作抗癌項目;跨界參與完成醫學研究論文等。
2020 年 5 月,李彥宏與其它學者共同研究的(de)關于(yú)食管鱗狀細胞癌的(de)論文在(zài)權威醫學期刊 Cell Research 雜志發表,題爲(wéi / wèi)《Whole-genome sequencing of 508 patients identifies key molecular features associated with poor prognosis in esophageal squamous cell carcinoma》。
除了(le/liǎo)李彥宏親自上(shàng)陣的(de)種種舉措,百度還在(zài)内部設立了(le/liǎo)一(yī / yì /yí)家 VC 基金——百度風投(Baidu Ventures),其中一(yī / yì /yí)大(dà)重要(yào / yāo)投資版塊便是(shì)生物智能。
據不(bù)完全統計,百度風投過往投資的(de)生物計算相關企業超過 50 家,涵蓋 AI 藥物發現、多組學數據、分子(zǐ)影像等諸多領域。
在(zài)多年的(de)積累沉澱下,百度在(zài) 2020 年 1 月疫情爆發時(shí)就(jiù)能夠在(zài)第一(yī / yì /yí)時(shí)間開放線性時(shí)間算法 LinearFold——借助這(zhè)一(yī / yì /yí)算法,疾控部門用 10 小時(shí)便完成了(le/liǎo)四個(gè)樣本的(de)全基因組測序。
随後,百度研究院又推出(chū)全球首個(gè)專門優化新冠病毒 mRNA 疫苗基因序列的(de)高效算法 LinearDesign,可在(zài) 11 分鍾内完成序列設計。
或許是(shì)新冠疫情的(de)爆發讓百度更加認識到(dào)互聯網技術和(hé / huò)生命科學結合的(de)重要(yào / yāo)性,在(zài) 2020 年 8 月,百度研究院宣布成立生物計算實驗室。
百度期望通過 AI 和(hé / huò)計算技術,深化學術界和(hé / huò)生物制藥企業的(de)合作,探索基因、DNA、RNA、蛋白質分子(zǐ)結構等人(rén)類生命密碼,縮短新藥研發周期,降低新藥研發成本,提升藥物和(hé / huò)疾病匹配的(de)精準度,發現基因和(hé / huò)疾病的(de)關聯關系,從而(ér)實現精準醫療。
僅僅過了(le/liǎo) 1 個(gè)月,百度就(jiù)成立了(le/liǎo)一(yī / yì /yí)家名爲(wéi / wèi) "百圖生科"(英文簡稱爲(wéi / wèi) BioMap)的(de)生命科學平台公司——李彥宏作爲(wéi / wèi)牽頭發起人(rén),擔任該公司的(de)董事長,原百度風投 CEO 劉維擔任 CEO。
雷峰網注:圖爲(wéi / wèi)劉維
值得注意的(de)是(shì),百圖生科成立初期,李彥宏并未以(yǐ)個(gè)人(rén)股東的(de)身份出(chū)現。直到(dào) 2021 年 3 月,李彥宏才通過直接和(hé / huò)間接方式持有百圖生科 40% 股份,成爲(wéi / wèi)名副其實的(de)幕後掌舵人(rén)。
這(zhè)意味着,在(zài)紮根互聯網 20 年後,百度正式向生物科學進軍,尋求 AI 落地(dì / de)的(de)另一(yī / yì /yí)站,而(ér)李彥宏也(yě)重新踏上(shàng)了(le/liǎo)逐夢之(zhī)旅。
步入無人(rén)區
“這(zhè)些年,我對挖掘人(rén)體數據、探尋疾病規律、找到(dào)新藥設計的(de)熱情一(yī / yì /yí)如既往”,在(zài) 2021 年的(de)生物計算大(dà)會上(shàng),李彥宏坦言一(yī / yì /yí)直在(zài)密切關注生物計算行業的(de)變化。
盡管 20 多年前未能圓夢,但随着生物計算發展十分迅速,産生的(de)大(dà)量數據(包括基因組學研究帶來(lái)的(de)人(rén)體數據、新藥研發過程當中所累積的(de)知識、以(yǐ)及新生的(de)各類機器學習算法等)爲(wéi / wèi)認知複雜的(de)生命系統打開了(le/liǎo)新的(de)大(dà)門,也(yě)給計算技術帶來(lái)了(le/liǎo)新的(de)用武之(zhī)地(dì / de)。
知名咨詢公司埃森哲(Accenture)曾在(zài)預測報告中指出(chū)——到(dào) 2026 年,大(dà)數據與醫學和(hé / huò)制藥領域的(de)機器學習相結合将産生每年 1500 億美元的(de)驚人(rén)價值。
可見,生物計算是(shì)一(yī / yì /yí)個(gè)前景遼闊的(de)領地(dì / de)。李彥宏也(yě)堅定認爲(wéi / wèi),生物和(hé / huò)計算的(de)融合會帶來(lái)巨大(dà)的(de)突破和(hé / huò)進步。因此,百圖生科的(de)業務發展規劃也(yě)始終圍繞這(zhè)個(gè)核心展開。
雷峰網了(le/liǎo)解到(dào),百圖生科的(de)業務發展分爲(wéi / wèi)兩個(gè)階段——
第一(yī / yì /yí)個(gè)階段:利用前沿 AI 技術構建完整的(de)生物計算平台,并與提供新的(de)數據軸和(hé / huò)新的(de)數據分析、藥物設計工具的(de)初創企業與研究機構攜手,構建生物計算生态,爲(wéi / wèi)生命科學企業和(hé / huò)科研用戶提供豐富的(de)工具能力和(hé / huò)完整的(de)解決方案,做好服務。
第二個(gè)階段:深度參與或主導發起新型精準藥物和(hé / huò)精準診斷産品的(de)研發,攜手合作夥伴,爲(wéi / wèi)社會貢獻極具創新性的(de)精準生命科學産品。
不(bù)僅如此,百圖生科還計劃大(dà)力投入關鍵底層數據設備和(hé / huò)計算技術的(de)研發,加速高通量類器官芯片、高分辨物質觀測設備、新的(de)組學采集分析設備、蛋白質模拟和(hé / huò)生物計算專用芯片的(de)研發。
這(zhè)并非易事。
僅是(shì) AI 制藥,就(jiù)需要(yào / yāo)突破三大(dà)技術門檻,包括高性能的(de)生物計算引擎、幹濕一(yī / yì /yí)體的(de)生物數據生産能力、靶點挖掘 — 藥物設計全流程的(de)閉環能力。
“這(zhè)是(shì)一(yī / yì /yí)個(gè)新興的(de)行業,沒有一(yī / yì /yí)個(gè)成熟的(de)解決方案可以(yǐ)直接套用”,百圖生科首席 AI 科學家宋樂說(shuō)道(dào)。
宋樂進一(yī / yì /yí)步向雷峰網解釋道(dào),要(yào / yāo)用 AI 發掘新藥有三個(gè)問題需要(yào / yāo)提前考慮:
一(yī / yì /yí)是(shì)了(le/liǎo)解複雜疾病的(de)困難。
二是(shì)對多維度、多尺度的(de)數據進行複雜且多樣化的(de)融合處理,包括基因層面的(de)基因測序、表觀組,蛋白質表達、蛋白質代謝,組織層面、機理層面等。
三是(shì)行業配合問題。數據分析與實驗往往是(shì)兩波人(rén),他(tā)們之(zhī)間的(de)溝通缺乏一(yī / yì /yí)個(gè)非常高效的(de)系統,将預測、模型輸出(chū)和(hé / huò)試驗系統進行整合。
不(bù)難想見,即使背靠百度這(zhè)座大(dà)山,百圖生科依然步履維艱;畢竟,其要(yào / yāo)駛入的(de),是(shì)一(yī / yì /yí)片無人(rén)區。
而(ér)百圖生科,僅剛剛開始。
沒有盡頭的(de)投注
公開資料顯示,百圖生科将與百度底層深度學習算法平台飛槳建立深度戰略合作,飛槳将爲(wéi / wèi)百圖生科提供 AI 底層技術和(hé / huò)開發工具。同時(shí),百度作爲(wéi / wèi)善于(yú)處理海量數據、知識圖譜,具有巨型數據中心布局的(de) AI 平台公司,預計也(yě)将在(zài)底層架構上(shàng)與百圖生科産生協同。
從全球市場來(lái)看,企業耗費巨資建立研發中心的(de)大(dà)研發模式已成過去。近年流行的(de)趨勢是(shì) VIC 模式,即 “VC (風險投資) +IP (知識産權) +CRO (研發外包服務)” 相結合的(de)新藥研發模式。
在(zài)此模式之(zhī)上(shàng),百圖生科提出(chū)了(le/liǎo)“VIP”模式,即利用資本(Venture)+自行參與打造 IP + 生物計算及智能實驗平台(Platform)加速藥物和(hé / huò)診斷管線的(de) IP 生成和(hé / huò)轉化——這(zhè)或将成爲(wéi / wèi)百圖生科生物計算平台的(de)核心價值和(hé / huò)盈利來(lái)源。
雷峰網了(le/liǎo)解到(dào),百圖生科有獨立的(de)投資部門 BioMap Ventures,其前身是(shì)百度風投的(de)生物投資團隊,目前在(zài)全球已投資了(le/liǎo)超過 50 家早期企業。
除了(le/liǎo)聯合生态合作夥伴,百圖生科還在(zài)不(bù)斷招兵買馬。成立初期,百圖生科就(jiù)宣布兩項領軍人(rén)才招募計劃,将分别用 100 萬美元年薪及 100 萬人(rén)民币年薪招兵買馬。
值得一(yī / yì /yí)提的(de)是(shì),去年加入百圖生科擔任首席 AI 科學家宋樂就(jiù)是(shì)世界知名的(de)機器學習專家,他(tā)曾在(zài) CMU 從事生物計算相關的(de)研究,利用機器學習技術對靶點挖掘、藥物設計取得了(le/liǎo)一(yī / yì /yí)系列突破性成果,獲得 NeurIPS、ICML、AISTATS 等主要(yào / yāo)機器學習會議的(de)最佳論文獎。
2021 年 5 月,百圖生科還推出(chū)了(le/liǎo)“免疫圖譜卓越計劃”。百圖生科提供自身研發的(de)核心生物計算引擎、海量自有數據、10 億元的(de)資金補貼,與生态聯盟合作夥伴共同推動免疫圖譜的(de)繪制,系統探尋癌症、自免等疾病的(de)複雜免疫規律,進一(yī / yì /yí)步提高對應的(de)靶點挖掘和(hé / huò)藥物設計效率。
截至 2020 年 7 月底,首批“卓越計劃”就(jiù)已收到(dào)來(lái)自中科院、協和(hé / huò)、北大(dà)、清華、複旦等系統的(de)近百個(gè)臨床和(hé / huò)研究團隊的(de)申報。
不(bù)僅如此,百圖生科目前也(yě)在(zài)自建實驗室,從而(ér)全流程系統化地(dì / de)解決和(hé / huò)提高行業的(de)運行效率。
據悉,通過利用自己構建的(de)生物計算平台和(hé / huò)大(dà)規模預訓練模型,百圖生科成功将典型蛋白質結構預測時(shí)間,從 30 分鍾縮短到(dào) 5 分鍾以(yǐ)内。
在(zài)不(bù)斷地(dì / de)發展布局下,百圖生科在(zài)去年 7 月拿到(dào)了(le/liǎo)上(shàng)億美元 A 輪融資,GGV 紀源資本領投,百度、君聯資本、藍馳創投、真知資本、襄禾資本跟投。據了(le/liǎo)解,這(zhè)輪融資還将用于(yú)技術研發和(hé / huò)人(rén)才引進。
如果僅從百圖生科的(de)成立到(dào)發展的(de)周期來(lái)看,其時(shí)間長度僅一(yī / yì /yí)年有餘,但實際上(shàng),百圖生科其實是(shì)李彥宏和(hé / huò)百度在(zài)生命科學領域多年積累的(de)彙聚,是(shì)百度 AI 落地(dì / de)的(de)另一(yī / yì /yí)站,也(yě)是(shì)百度開啓生物計算的(de)新通道(dào)。
這(zhè)是(shì)一(yī / yì /yí)條道(dào)阻且長的(de)道(dào)路,李彥宏同樣深知,他(tā)表示——
“生命科學沒有盡頭,隻有盡力”。