來源:上觀新聞 2025年7月28日
標題:全國首個語料運營公共服務統一門戶在滬發布,為AI提供更好的“燃料”
作者:文匯報 張懿
作為全國語料行業年度盛會,2025世界人工智能大會語料創新發展論壇于7月27日舉行。本次論壇聚焦強化高質量語料供給,以“平臺筑基、工具賦能、標準引領、生態協同”為主線,集中發布一系列核心成果,其中,全國首個語料運營公共服務統一門戶在上海正式上線。
語料數據堪稱人工智能和大模型的“燃料”。上海堅持以完善生態、集聚要素為核心,圍繞具身智能、強推理數據集、稀缺數據集等3個重點工程,構建多層次的語料供給體系,加速推動模型迭代,通過市場化的方式賦能行業尤其是中小企業。其中,新組建的庫帕思公司在一年中,在語料高質量語料庫、語料標準,語料運營平臺等建設中發揮了重要作用。
本次論壇集中呈現了打造語料基座“上海方案”的一系列成果。在平臺方面,對標服務國家戰略,按照全市整體部署,庫帕思打造全國首個語料運營公共服務統一門戶,按“統一標準、統一門戶、統一機制”的框架,推動語料調用服務智能體化。同時,其內部運行的語料工具鏈平臺也升級到2.0版,延續數據的“采、洗、標、測、用”五位一體布局,目前已完成400多個功能模塊,在醫療、教育、金融、城市治理等領域投入實戰。
在標準方面,論壇集中發布了10項語料團體標準,3項行業標準、1項高質量數據集建設指南,涵蓋醫療、教育、金融、自動駕駛、科學智能、城市治理等多個方向,為“好數據”確立可量化的標尺。
在語料數據人才培養方面,庫帕思與上海交通大學、復旦大學、同濟大學、上海大學、上海中醫藥大學、上海理工大學、上海師范大學、上海電力大學等高校,啟動了工程碩博士聯合培養項目,打造語料領域的產教融合新模式。
鏈接地址:https://www.shobserver.com/staticsg/res/html/web/newsDetail.html?id=954770