10月22日,以“前沿發明,引領AI產業新變革”為主題的“2024百度十大科技前沿發明”發布會在北京召開。北京市知識產權局副局長潘新勝、百度首席技術官(CTO)王海峰等出席儀式并為發布會致辭。
王海峰表示,前沿發明不僅支持百度提升了自有產品、業務效果和效能,也為百度產品AI原生化重構,為人工智能賦能千行百業貢獻了力量。百度發布十大發明,一方面,通過表彰這些引領產業創新的前沿成果,鼓勵更多的創新創造;另一方面,推動產業界更多應用這些成果,加快產業化進程。
潘新勝指出,近年來,國家高度重視人工智能產業發展,北京市正在大力推動人工智能創新策源地和產業高地建設。北京市知識產權局大力支持以百度公司為代表的產業知識產權龍頭企業,在重點領域開展產業知識產權促進中心建設,以知識產權為紐帶帶動重點產業強鏈增效。作為人工智能領域領先企業,百度創新技術和知識產權工作已經走在了全國的前列。
會上,百度集團專利事務部總經理崔玲玲發布“2024百度十大科技前沿發明”。她表示,百度發布這些前沿發明成果,不僅是對百度技術創新能力的集中展示,更是對未來人工智能發展趨勢的深刻洞察。百度人工智能領域的前沿專利發明,涵蓋了從基礎算法到應用場景的全方位突破成果,正引領著AI產業新的變革。
自2013年入局AI領域,百度十年來累計研發投入近1700億元。國家工業信息安全發展研究中心、工信部電子知識產權中心今年4月份發布的《新一代人工智能專利技術分析報告》顯示,截至2023年底,百度在人工智能全領域專利申請量19308件、授權量9260件,連續六年位居國內第一;在以大模型為核心的新一代AI領域,百度專利申請1432件、授權651件,成為技術創新和專利布局領軍者。根據專利數據庫機構IFI claims發布的生成式人工智能專利圖景洞察,百度生成式人工智能專利申請量躋身全球TOP10,是唯一進入該榜單的中國創新主體,并且專利技術涵蓋文本、圖像、語音、視頻四大基礎領域,成為這四個領域全面布局的全球四家公司之一。
11月12日,以“應用來了”為主題的百度世界2024即將在上海舉辦,百度將再次帶來令人矚目的技術突破和產品發布。同時,百度也將通過持續的研發投入和技術創新,不斷加強數智產業的快速發展,為經濟高質量增長帶來更多動能。
百度2024十大科技前沿發明,具體如下:
一、基于生成式大模型的智能體技術
該發明技術創新性地引入了思考模型,使智能體具備了任務規劃、工具調用、知識增強和反思進化等多重能力。通過系統化的設計與核心能力的定向優化,能夠低成本地支持不同應用場景下智能體的規模化建設與部署;通過建設大規模仿真能力,加速智能體構建與分發。該技術系統已成功應用于文心智能體平臺、商家智能體、文心快碼等多個重點場景,顯著提升了智能體的研發效率,降低了研發門檻。
二、基于大模型高效訓練框架的多模型協同進化技術
該發明技術從工程和算法兩個角度攻克系列難題。工程架構上,從混合并行策略、通信效率、計算存儲優化全方位創新突破,顯著提升大語言模型訓練性能,支撐文心全系列模型全流程高效穩定訓練。算法策略上,研發了大小模型協同的預訓練技術,攻克了模型間知識難以繼承的技術難題,改變了傳統模型的訓練范式,降低了新模型訓練成本。
三、基于大模型和知識檢索增強技術的多模態內容創編一體的智能系統
本發明技術綜合運用知識增強、多源內容解析、融合式編輯、檢索增強文生圖等技術,解決了專業長文及多模態內容生成質量弱、創編無法共享容器、文生圖主體準確性差等問題。檢索增強文生圖,旨在通過智能判斷用戶需求自適應處理參考圖,進而基于混合模態的生圖系統顯著提升了生圖主體的一致性,有效彌補長尾內容刻畫不準確的短板,整體效果遠遠超過文生圖原生系統。
四、支持規模化的自動駕駛定位和車道級地圖生成技術
該發明技術突破了傳統模式的效率和成本問題,降低了地圖制圖成本95%,車道級道路里程超過360萬公里,實現全國超過41000個城鄉鎮道路的全覆蓋。基于地圖數據進一步構建的多模態傳感器融合的自動駕駛高精定位技術,精度達到厘米級,極大提高了可量產性,將車端定位依賴的地圖包體積降低97.5%,可靠性達到99.9999%,全面支撐目前蘿卜快跑全無人駕駛的規模化運營,在高架橋下、多層路、隧道等各種復雜困難場景實現全無人駕駛。
五、面向大模型智能化的個性化記憶機制
該發明技術創新性地提出了一套全面的記憶機制,涵蓋記憶加工、存儲、管理、觸發和利用五大模塊,賦予大模型個性化記憶能力。記憶加工借鑒人類海馬體機制,實現了對全場景用戶信息的深度理解和精準加工;記憶管理支持用戶主動與系統自動的增刪改查,確保了記憶庫的實時更新與準確;記憶觸發和利用,通過相關記憶的推測生成,輔助大模型產生更加擬人和個性化的回復。該發明技術已廣泛應用于智能AI助手、數字人等場景。
六、基于大模型的超擬真數字人建模、驅動與生成系統
該發明技術提出了一整套的超擬真數字人建模、驅動和生成方案。針對真人數字人,研發了數據驅動的人像建模、跨模態驅動和人像視頻生成大模型,實現了自然、擬真的數字人內容生產,獨家支持大幅動作&遮擋場景的直播人像克隆,并實現了首個全身智能驅動直播間落地。
七、基于大模型的生成式商業檢索系統
該發明技術變革了傳統的“索引—召回—排序”流程,扁平化系統漏斗,減少信息損失,通過構建索引學習任務,將商業信息編碼進模型參數,實現“模型即索引”,利用大模型的理解和推理能力,實現“生成即檢索”,新范式顯著提升系統定向效率120%。該發明所涉及項目業界率先落地,實現大規模工業化應用,生成式大模型結合商業搜索場景取得多項技術創新,創意豐富度提升37倍,創意質量提升92%,獲得了顯著的業務收益和廣泛技術影響力。
八、大模型數據飛輪技術
該發明技術通過整合用戶反饋、執行反饋和自監督反饋等多來源和形式的信息,自動識別模型缺陷并高效合成高質量、多樣化的訓練數據。同時結合多源反饋的強化學習方法,顯著提升了模型訓練效果。該創新技術構建了一個能夠持續自我改進的數據飛輪,有效突破了大模型的數據瓶頸,降低了數據獲取成本,提高了大模型的適應性和魯棒性,提升了模型在不同任務場景下的泛化能力。
九、大模型高效推理技術
該發明技術提出的高效推理技術,底層模型層基于飛槳框架,在推理架構方向,結合主流的Prefix Caching、Lookahead等方向持續創新,并將各項技術高效結合,大幅提升模型吞吐和性能。在大模型壓縮方面,采用大模型無損量化技術,通過激活自適應分段平滑與權重聯動重排等方法,在業內率先實現了對百億千億級大模型的高效無損壓縮。該發明支持多種大模型壓縮和推理加速手段,目前已應用于百度智能云千帆大模型平臺等核心業務,減少模型推理的資源消耗,節省大模型部署成本超50%,提升模型性能,模型吞吐提升3倍—5倍。
十、用戶數據反饋驅動的檢索生成系統
該發明技術提出的檢索生成系統,能夠結合用戶行為反饋信號,實現快速自我強化。通過滿意度建模和強化學習直接對齊用戶偏好,并利用用戶反饋觸發系統快速反思,解決了傳統數據應用時專家反饋效率低和用戶偏好建模難的問題。基于該框架的檢索生成系統已覆蓋18%的搜索流量,廣泛應用于文字、視頻、圖片等搜索場景。
推薦閱讀
經典欄目
精彩專題
關注我們
大視頻行業頗具影響力的行業社群平臺,重要新聞、熱點觀察、深度評論分析,推動電視行業與各行各業的連接。
集合電視臺、網絡視聽、潮科技等各種好玩信息。
專注于報道廣電行業新鮮5G資訊,致力于成為廣電行業有權威、有深度的5G自媒體平臺。
UHD、4K、8K的最新資訊和最深入的分析,都在這里。
視頻產業的專業圈子,人脈、活動、社區,就等你來。
我們只沉淀有深度的信息和數據。
致力于衛星電視信息、衛星通信技術、天地一體網絡應用案例、以及廣電、通信等產業的市場動態、政策法規和技術資訊的傳播。