“人工智能大模型是新質(zhì)生產(chǎn)力的代表,大模型和超級計算融合發(fā)展十分重要,我國需認真布局、考慮?!苯?,中國科學(xué)院院士陳潤生在2024中國算力發(fā)展專家研討會上表示。

  在這場由中國智能計算產(chǎn)業(yè)聯(lián)盟與全國信標委算力標準工作組共同主辦的研討會上,超智融合技術(shù)路線的趨勢與發(fā)展方向引發(fā)專家學(xué)者熱議。

  在數(shù)字化、智能化浪潮中,算力正成為經(jīng)濟社會高質(zhì)量發(fā)展的重要驅(qū)動力。但千行百業(yè)的計算場景紛繁復(fù)雜,單一計算架構(gòu)無法應(yīng)對。與會專家學(xué)者認為,超智融合兼具超算的強大處理能力與智算的算法優(yōu)化能力,二者融合發(fā)展已成大勢所趨。

  資料顯示,當前流行的預(yù)訓(xùn)練大模型具有數(shù)十億乃至上萬億參數(shù),訓(xùn)練時用到數(shù)萬億個Token(大模型用來表示自然語言文本的單位),訓(xùn)練的過程就是海量數(shù)據(jù)處理的過程,這消耗了巨大算力。

  據(jù)美國開放人工智能研究中心(OpenAI)測算,2012年開始,全球大模型訓(xùn)練所用的計算量呈指數(shù)級增長,平均每3.43個月便會翻一番。目前,計算量已遠超算力增長速度。

  “大模型的迅猛發(fā)展體現(xiàn)出新質(zhì)生產(chǎn)力的特質(zhì),但目前遇到了算力瓶頸?!敝袊茖W(xué)院計算技術(shù)研究所研究員張云泉說。

  北京應(yīng)用物理與計算數(shù)學(xué)研究所研究員袁國興說:“現(xiàn)在的應(yīng)用越來越復(fù)雜,不同應(yīng)用需要不同算法,對計算機也有不同要求?!?/p>

  國家信息中心信息化和產(chǎn)業(yè)發(fā)展部主任單志廣說,超智融合隨著基礎(chǔ)算力、智算算力、超算算力等應(yīng)用多元化發(fā)展而誕生。這一技術(shù)通過混合型算力資源或融合型算力體系,可同時滿足多種不同算力的應(yīng)用需求。

  實際上,超智融合技術(shù)正成為近年來全球計算領(lǐng)域熱點線月,在以“重塑超算”為主題的國際超算大會上,超智融合相關(guān)方案遍地開花。

  在我國,超智融合技術(shù)已被應(yīng)用于超算互聯(lián)網(wǎng)建設(shè)。今年4月,國家超算互聯(lián)網(wǎng)平臺上線,標志著我國在超智融合領(lǐng)域邁出探索性步伐。平臺依托一體化算力調(diào)度、數(shù)據(jù)傳輸、生態(tài)協(xié)作體系,實現(xiàn)算力供給、軟件開發(fā)、數(shù)據(jù)交易、模型服務(wù)等產(chǎn)業(yè)鏈相關(guān)各方緊密鏈接,構(gòu)建市場化、互聯(lián)網(wǎng)化、標準化的先進計算服務(wù)環(huán)境。

  數(shù)據(jù)顯示,平臺上線家應(yīng)用、數(shù)據(jù)、模型等服務(wù)商入駐,并提供超3200款商品。這些商品覆蓋科學(xué)計算、工業(yè)仿真、人工智能模型訓(xùn)練等領(lǐng)域,可滿足全社會對先進計算服務(wù)的需求。

  陳潤生認為,發(fā)展大模型與智算,不僅要改進應(yīng)用層面的模型和算法,還要在基礎(chǔ)理論層面有所突破。在他看來,隨著模型規(guī)模擴張,一味“堆芯片”并不可取。根本上還要向人腦學(xué)習(xí),把空間復(fù)雜度、時間復(fù)雜度壓縮得更小,以更低能耗實現(xiàn)更高性能。

  中國科學(xué)院院士錢德沛認為,在硬件方面,要盡量以最低能耗實現(xiàn)最高性能。未來不一定要做面面俱到的硬件,可重構(gòu)或柔性或許是主要發(fā)展路徑。而在軟件方面,要從基本大模型理論出發(fā),形成完整支撐人工智能的軟件棧。

  “我國一些超算中心已能為大模型訓(xùn)練提供支撐,未來還應(yīng)重點圍繞國產(chǎn)算力芯片發(fā)展關(guān)鍵軟件,進一步實現(xiàn)軟硬件協(xié)同優(yōu)化?!敝袊こ淘涸菏苦嵕暶裾f。

  中國信通院云計算與大數(shù)據(jù)研究所所長何寶宏認為,傳統(tǒng)超算和智算訓(xùn)練,對底層基礎(chǔ)設(shè)施的要求各不相同?!斑@需要判斷在什么場景下實現(xiàn)兼容統(tǒng)一,在哪些場景下凸顯各自獨特性?!焙螌毢暾f。

  在通用性與專用性之間,應(yīng)如何選擇超智融合的技術(shù)路線?與會專家學(xué)者普遍認為,應(yīng)保持一定通用性。尤其在技術(shù)和方法論持續(xù)發(fā)展的背景下,應(yīng)保持芯片、系統(tǒng)與軟件的普適性,為研究提供廣闊空間,深化底層理論與方法探索。

  對此,單志廣提醒,未來一體化算力體系的構(gòu)建,要做好算力資源和業(yè)務(wù)應(yīng)用的統(tǒng)籌銜接。須避免有效應(yīng)用需求不足、缺乏網(wǎng)絡(luò)服務(wù)質(zhì)量保證、沒有成熟調(diào)度體系的普遍性算力互聯(lián),不能脫離實際應(yīng)用需求進行異地計算和遠地計算算力設(shè)施布局,要從算力資源供給側(cè)和業(yè)務(wù)應(yīng)用需求側(cè)兩個維度進一步深化研究。

  未來,超智融合具體將以何種路徑演進?錢德沛認為,其將沿著超算支撐人工智能應(yīng)用、用人工智能技術(shù)改進超算、超智實現(xiàn)內(nèi)生融合這三個階段清晰演進。

  他進一步解釋,在第一階段,對現(xiàn)有計算機系統(tǒng)進行改造與升級。要發(fā)展專用硬件,確保可高效支持和執(zhí)行人工智能任務(wù),為人工智能研究提供堅實基礎(chǔ)設(shè)施。在第二階段,用人工智能改造傳統(tǒng)計算。一方面要用人工智能的方法求解傳統(tǒng)超算問題,另一方面人工智能也將影響傳統(tǒng)計算機的結(jié)構(gòu),這個趨勢會逐漸明顯。在最終階段,計算機系統(tǒng)將呈現(xiàn)內(nèi)在的智能特性。人工智能不再是一種外加能力,而將成為計算機的核心屬性和基本組成,可能計算能力或智能化水平會遠超今天的超算或智算。

  本文為澎湃號作者或機構(gòu)在澎湃新聞上傳并發(fā)布,僅代表該作者或機構(gòu)觀點,不代表澎湃新聞的觀點或立場,澎湃新聞僅提供信息發(fā)布平臺。申請澎湃號請用電腦訪問。


本文由:捕魚大作戰(zhàn)機械公司提供