大(dà)模型“計算”時(shí)代 曙光搶先突圍
伴随8家大(dà)模型陸續通過《生成式人(rén)工智能服務管理暫行辦法》備案,文心一(yī / yì /yí)言率先向全社會全面開放,AIGC将真正迎來(lái)在(zài)國(guó)内實際落地(dì / de)開花的(de)時(shí)期,“百模大(dà)戰”也(yě)将愈演愈烈。
ChatGPT帶動AIGC火爆的(de)背後,人(rén)工智能算力需求也(yě)随之(zhī)暴漲。公開資料顯示,GPT-4的(de)模型擁有近1.8萬億參數、13萬億訓練數據,其訓練一(yī / yì /yí)次的(de)成本高達6300萬美元,大(dà)模型對算力的(de)依賴顯而(ér)易見。除增加算力資源供給外,算力利用率優化、使用門檻降低也(yě)至關重要(yào / yāo)。
無疑,實現算力、算法及應用的(de)智能、協同調度,将算力更高效地(dì / de)轉化爲(wéi / wèi)生産力,成爲(wéi / wèi)制勝百模争“算”時(shí)代的(de)關鍵。
作爲(wéi / wèi)全産業鏈覆蓋的(de)核心信息基礎設施企業,曙光對于(yú)大(dà)模型及大(dà)規模算力的(de)支持與經驗,遠早于(yú)2023年。
近年來(lái),基于(yú)對産業的(de)深入洞察和(hé / huò)前瞻預判,曙光在(zài)全國(guó)範圍内構建了(le/liǎo)包括智算中心、雲中心、一(yī / yì /yí)體化大(dà)數據中心在(zài)内的(de)各類算力中心,掌握了(le/liǎo)豐富多樣且通用性極強的(de)算力資源。通過智能化調度和(hé / huò)資源管理,将算力資源上(shàng)雲聯網,并以(yǐ)創新型算力服務平台爲(wéi / wèi)出(chū)口,面向不(bù)同行業區域的(de)用戶提供可便捷獲取的(de)算力和(hé / huò)應用。
截至目前,曙光已參與“悟道(dào)2.0”、“紫東太初”、“文心一(yī / yì /yí)言”、“通義千問”等多類大(dà)模型的(de)訓練、微調、推理等工作,爲(wéi / wèi)其提供強勁算力支撐。累計完成30餘個(gè)國(guó)内外主流大(dà)模型的(de)适配孵化,包括業界熟知的(de)GPT系列、LLaMA系列、GLM系列等。同等條件下,大(dà)模型訓練效率及訓練穩定性都得到(dào)顯著提升。
此外,針對大(dà)模型訓練帶來(lái)的(de)挑戰,曙光緊密協同生态夥伴,與百度、阿裏、智源研究院、智譜AI、複旦大(dà)學、之(zhī)江實驗室、捷通華聲等業内領先企業及科研院所深度合作,充分調動起政、産、學、研、用各方力量,打造了(le/liǎo)面向不(bù)同應用場景的(de)大(dà)模型一(yī / yì /yí)體機、大(dà)模型存儲解決方案等,提供從底層算力、框架、算法、應用等全棧AI能力,滿足多場景需求,加速大(dà)模型探索創新及産業化落地(dì / de)。
與此同時(shí),由于(yú)大(dà)模型對算力的(de)巨大(dà)需求,能耗問題日益嚴峻。自2011年開啓,曙光便緻力于(yú)相關探索,研發了(le/liǎo)領先的(de)浸沒式相變液冷技術和(hé / huò)冷闆式冷卻技術,構建了(le/liǎo)包含計算和(hé / huò)存儲的(de)全棧綠色計算方案,并已成功實現商業化部署。相比傳統風冷模式,在(zài)同等功率下,可爲(wéi / wèi)AI計算核心部件降溫20-30°C;在(zài)同等性能下,爲(wéi / wèi)算力設備降低能耗30%。目前,中國(guó)有超過58%的(de)液冷數據中心選擇了(le/liǎo)曙光的(de)技術方案。
信息産業在(zài)演變的(de)每個(gè)階段,都會有主流的(de)技術應用方向。在(zài)“萬變”的(de)環境中,唯有把握前瞻趨勢、堅持打造核心競争力才是(shì)應對變化的(de)“不(bù)變”法則。無論是(shì)大(dà)模型,還是(shì)下一(yī / yì /yí)個(gè)新“風口”,曙光早已在(zài)等候。