近日,百度智能云成功點亮昆侖芯三代萬卡集群,這也是國內首個正式點亮的自研萬卡集群。據悉,百度智能云將進一步點亮3萬卡集群。這一重大突破標志著百度在人工智能算力領域邁出了堅實的一步,不僅為百度自身的技術發展提供了強大動力,也為整個中國科技界、互聯網行業和AI行業帶來了新的發展機遇。
萬卡集群的建成不僅為百度帶來了強大的算力支持,還推動了模型降本的趨勢。在過去一年中,整個行業都在努力降低大模型的使用成本,而算力緊張是導致成本居高不下的重要因素之一。百度通過自研芯片和大規模集群的建設,不僅解決了自身算力供應的問題,還為整個行業提供了新的思路和方向。
從算力上看,超大規模并行計算能力可實現訓練效率躍升,萬卡集群可將千億參數模型的訓練周期大幅降低,滿足AI原生應用快速迭代的需求。同時也能支持萬億參數模型、復雜任務和多模態數據,支撐Sora類應用的開發。此外,萬卡集群能夠支持多任務并發能力,通過動態資源切分,單集群可同時訓練多個輕量化模型,通過通信優化與容錯機制減少算力浪費,實現訓練成本指數級下降。
隨著國產大模型的興起,萬卡集群逐漸從“單任務算力消耗”到“集群效能最大化”過渡,通過模型優化、并行策略、有效訓練率提升、動態資源分配等手段,智能調度任務,將訓練、微調、推理任務混合部署,從而提升集群綜合利用率,降低單位算力成本。
過去,多芯混訓和激增的故障率等難題,成為萬卡集群部署過程中的巨大挑戰。而24年9月升級的百度百舸AI異構計算平臺4.0,在萬卡集群的建設中發揮了至關重要的作用。
首先,突破硬件擴展性瓶頸,如卡間互聯的拓撲限制,避免通信帶寬成為瓶頸;同時,圍繞芯片及集群功耗,基于萬卡規模常規方案功耗可達十兆瓦或更高,采用創新性散熱方案,從而解決萬卡集群的能效與散熱問題;完善模型的分布式訓練優化,采用高效并行化任務切分策略,訓練主流開源模型的集群MFU提升至58%;在提升穩定性方面,提供容錯與穩定性機制,避免由于單卡故障率隨規模指數上升而造成的萬卡集群有效性大幅下降,保障有效訓練率達到98%;最后,針對機間通信帶寬需求,建設超大規模HPN高性能網絡,優化拓撲結構,從而降低通信瓶頸,帶寬有效性達到90%以上。?
日前,花旗銀行發布研報表示,DeepSeek、百度等中國模型展現出高效和低成本優勢,將有助于加速全球AI應用開發,并在全球引發更多技術創新,推動2025年人工智能應用的拐點。中國工程院院士、清華大學計算機系教授鄭緯民也表示,當下構建國產自主萬卡系統充滿挑戰,但“至關重要”。
推薦閱讀
經典欄目
精彩專題
關注我們
大視頻行業頗具影響力的行業社群平臺,重要新聞、熱點觀察、深度評論分析,推動電視行業與各行各業的連接。
集合電視臺、網絡視聽、潮科技等各種好玩信息。
專注于報道廣電行業新鮮5G資訊,致力于成為廣電行業有權威、有深度的5G自媒體平臺。
UHD、4K、8K的最新資訊和最深入的分析,都在這里。
視頻產業的專業圈子,人脈、活動、社區,就等你來。
我們只沉淀有深度的信息和數據。
致力于衛星電視信息、衛星通信技術、天地一體網絡應用案例、以及廣電、通信等產業的市場動態、政策法規和技術資訊的傳播。