(相關(guān)資料圖)
中關(guān)村論壇平行論壇“人工智能大模型發(fā)展論壇”現(xiàn)場。論壇方供圖現(xiàn)場,趙志耘解讀稱,中國大模型的各種技術(shù)路線都在并行突破,特別是在自然語言理解、機器視覺、多模態(tài)等方面,出現(xiàn)了多個在行業(yè)有影響力的大模型。據(jù)不完全統(tǒng)計,到目前為止,中國10億級參數(shù)規(guī)模以上大模型已發(fā)布了79個。
報告指出,中國大模型地域和領(lǐng)域分布相對集中。從地域分布看,有14省份均在開展大模型研發(fā),主要集中在北京、廣東兩地,其中北京有38個大模型,廣東有20個大模型。從領(lǐng)域分布看,自然語言處理仍是目前大模型研發(fā)最為活躍的重點領(lǐng)域,其次是多模態(tài)領(lǐng)域,在計算機視覺和智能語音等領(lǐng)域的大模型還較少。從研發(fā)主體分布看,大學(xué)、科研機構(gòu)、企業(yè)等不同創(chuàng)新主體都在積極參與大模型研發(fā),但學(xué)術(shù)界與產(chǎn)業(yè)界之間的聯(lián)合研發(fā)仍不足。
報告顯示,北京、廣東、浙江、上海等地的大模型數(shù)量最多;同時這4個地方也是近三年人工智能服務(wù)器采購數(shù)量最高的地區(qū)。
值得注意的是,北京、江蘇、廣東、上海等是大模型人才相對較多的地區(qū),為大模型研發(fā)提供了關(guān)鍵的智力要素支撐。但另一方面,大模型具有較高門檻,需要高素質(zhì)AI人才,目前各地大模型人才數(shù)量均不充足。
此外,從學(xué)術(shù)影響力看,北京、廣東、上海三地,不論是論文發(fā)表量還是引用量,都居國內(nèi)最高。
報告指出,中國大模型研發(fā)團隊積極推進大模型開源發(fā)展,目前已經(jīng)有超過半數(shù)大模型實現(xiàn)開源。北京、廣東、上海三地開源數(shù)量和開源影響力均居國內(nèi)前三。其中,高校及科研機構(gòu)是開源的主力。
針對當(dāng)前國內(nèi)大模型發(fā)展情況,報告提出四點建議和展望:
一是加強資源和研發(fā)力量統(tǒng)籌,促進大模型有序發(fā)展。加強智算中心、超算中心、云計算中心等計算資源的統(tǒng)籌,制定公共數(shù)據(jù)共享目錄和共享規(guī)則,推動數(shù)據(jù)分級分類有序開放。
二是加快基礎(chǔ)研究和技術(shù)創(chuàng)新,提升學(xué)術(shù)和開源影響力。大模型技術(shù)仍處于發(fā)展初期,潛在的基礎(chǔ)理論和技術(shù)創(chuàng)新空間巨大,通過蒸餾、量化等小型化技術(shù)實現(xiàn)模型“瘦身”,為大模型小型化、綠色化發(fā)展提供技術(shù)支撐。同時,進一步加強產(chǎn)學(xué)研合作,鼓勵大模型開源開放,也將加速大模型技術(shù)進步。
三是強化大模型發(fā)展中的場景牽引作用,打造大模型標(biāo)桿項目。以行業(yè)專有訓(xùn)練數(shù)據(jù)集為基礎(chǔ),打造金融、醫(yī)療、電力等領(lǐng)域的專業(yè)大模型,將率先特定業(yè)務(wù)場景實現(xiàn)高質(zhì)量應(yīng)用突破,也將通過應(yīng)用場景和應(yīng)用數(shù)據(jù)反向促進大模型技術(shù)迭代升級。
四是強化國際合作,積極參與全球人工智能治理。以負(fù)責(zé)任的態(tài)度共同推進大模型治理,加快人工智能治理原則和倫理規(guī)范在大模型研發(fā)全鏈條落地生根,在增進共識的基礎(chǔ)上加強人工智能治理全球協(xié)作。(完)
搜索
復(fù)制