
-
三部門聯合發文:加強語言文字復合型人才培養 2025-04-01
-
浙江省高水平大學建設聯盟成立 2025-03-25
-
錨定教育強國建設目標,更好發揮高等教育龍頭作用 2025-03-18
近日,教育部、國家語委、中央網信辦印發《關于加強數字中文建設 推進語言文字信息化發展的意見》(以下簡稱《意見》)。
《意見》指出,到2027年,國家數字中文建設行動取得重要成效,語言文字數據要素價值有效釋放。基本形成“政府主導、部門協同、社會參與、共建共享”的語言文字信息化工作機制;基本建成國家語言文字大數據中心,初步建成國家關鍵語料庫和國家戰略語言資源信息庫;語言文字信息化標準、前沿語言技術、優質語言資源、新型語言服務等基礎支撐能力顯著增強。到2035年,中文在全球數字空間、網絡空間以及生成式人工智能等關鍵應用場景中的使用占比顯著提高;語言文字信息化有力支撐國家語言能力建設、語言文字事業和經濟社會高質量發展,整體水平位居世界前列。
《意見》提到,建立產學研用協同培養語言文字信息化相關人才的機制,建設高水平人才隊伍。依托國家語言文字關鍵研究領域領航計劃,培養精通語言文字信息化建設的高層次緊缺急需人才。加強語言人才供需機制研究,支持高等學校語言學科與多學科深度交叉融合發展,加強“語言+人工智能”復合型人才培養。面向語言文字信息技術產業及未來發展方向,加強高素質技能人才培養。
充分發揮地方、高等學校、職業學校、科研機構、行業企業、社會團體等協同作用,共建“數字中文”聯盟,形成語言文字信息技術融合創新、共建共享和轉化應用機制。
加強有組織科研,探索自然語言處理、大語言模型等理論和技術創新,重點推動生成式人工智能、多模態信息處理、語言理解與生成、跨語言跨模態翻譯等方面的技術創新。
加快布局支持一批新型語言文字交叉領域科研機構,重點建設多語言智能化科技創新中心和實驗室。支持數字中文建設、生成式人工智能技術等前沿領域的學術研討和競賽活動。
全文如下:
教育部 國家語委 中央網信辦關于加強數字中文建設 推進語言文字信息化發展的意見
教語信〔2025〕1號
各省、自治區、直轄市教育廳(教委)、語委、黨委網信辦,新疆生產建設兵團教育局、語委、黨委網信辦,國家語委各委員單位,部屬各高等學校、部省合建各高等學校:
為深入貫徹落實黨中央、國務院關于數字中國建設和教育強國建設的總體部署,加快推進以信息化促進語言文字事業高質量發展,以數字化賦能語言文字更好服務全面建設社會主義現代化國家,根據中共中央、國務院《數字中國建設整體布局規劃》《教育強國建設規劃綱要(2024—2035年)》和國務院辦公廳《關于全面加強新時代語言文字工作的意見》(國辦發〔2020〕30號)要求,現就加強數字中文建設、推進語言文字信息化發展提出以下意見。
一、總體要求
以習近平新時代中國特色社會主義思想為指導,全面貫徹落實黨的二十大和二十屆二中、三中全會精神,貫徹落實全國教育大會精神,堅持圍繞中心、服務大局、支撐戰略,全面推進語言文字信息化發展,以加強數字中文建設為重點,以集成化、智能化、國際化為導向,加強政策引導,優化要素配置,促進協同創新,強化技術賦能,著力提升語言文字服務數字教育、數字科技、數字文化、數字經濟、數字社會建設的實際能力,全方位釋放語言文字在數字時代經濟社會發展中的數據要素價值,全力服務教育強國、科技強國和文化強國建設,為以中國式現代化全面推進強國建設、民族復興偉業作出新的更大貢獻。
堅持需求導向、支撐戰略。以服務國家戰略為目標,聚焦重點領域需求,以關鍵任務為驅動,確保數字中文建設取得新進展。堅持突出重點、突破創新。實施數字化示范項目,打造數字化引領品牌,在匯聚數據資源、創新應用形態、提升賦能效果等關鍵環節開辟新空間。堅持融合發展、協同推進。加強統籌協調,大力推進語言文字與信息技術深度融合,推動語言文字信息化發展邁上新臺階。
到2027年,國家數字中文建設行動取得重要成效,語言文字數據要素價值有效釋放。基本形成“政府主導、部門協同、社會參與、共建共享”的語言文字信息化工作機制;基本建成國家語言文字大數據中心,初步建成國家關鍵語料庫和國家戰略語言資源信息庫;語言文字信息化標準、前沿語言技術、優質語言資源、新型語言服務等基礎支撐能力顯著增強。到2035年,中文在全球數字空間、網絡空間以及生成式人工智能等關鍵應用場景中的使用占比顯著提高;語言文字信息化有力支撐國家語言能力建設、語言文字事業和經濟社會高質量發展,整體水平位居世界前列。
二、加快推進語言文字信息化發展
1.高度重視語言文字信息化。語言文字是人類智能發展、信息交流、思想表達、文明互鑒以及融入社會和聯通世界的基礎工具,是國家重要教育資源、科技資源、文化資源、經濟資源、安全資源和戰略資源,是國家綜合實力的重要支撐,事關國家主權、安全和發展大局。沒有信息化就沒有現代化。以加強數字中文建設為重點全面推進語言文字信息化發展,是自然語言處理技術發展新階段的客觀需要,是大語言模型等新興科技創新應用的重要基礎,是贏得人工智能技術競爭先機的時代要求,是有效發揮語言文字資源優勢服務數字中國建設的戰略舉措,對于語言文字事業全面深化改革、實現高質量發展和服務經濟社會發展意義重大、影響深遠。
2.系統推進數字中文建設。以發揮中文數據的賦能作用為著力點,將數字中文建設作為服務數字中國建設的重要任務和全面推進語言文字信息化發展的突出重點,著力推進中文數字化與數據中文化、創新應用與規范安全、新型中文服務體系構建與語言文字治理體系完善,促進中文數據的規模生產、優質集成、融合創新、規范治理和復用增效,助力中文發揮立德樹人的基礎作用、傳承中華文化的根脈作用、推進科技創新的支撐作用、賦能產業升級的關鍵作用,服務當前和今后一個時期經濟社會關鍵領域的信息化建設、數字化賦能和智能化發展。
三、全面加強語言文字信息化體系建設
3.完善規范標準體系。標準化是信息化的基礎和前提。統籌推進語言文字基礎性標準和信息化標準一體建設,構建覆蓋全面、結構合理、科學可行的數字時代語言文字規范標準體系。以語言文字信息處理標準建設為基礎,支持面向信息技術及人工智能領域的語言資源建設、管理、應用、共享標準研究,重點推進語料庫、數據標注、數據評價等規范標準的制修訂。推進大語言模型等基礎術語規范化。制定手語和盲文的信息化標準。研制民族語言文字信息化標準。研制甲骨文數字化共享技術標準。
4.健全資源服務體系。通過組織開發、征集遴選、集成匯聚等方式,多渠道建設大規模多模態優質語言資源,促進多方協作、多元融合與共建共享。加快建設國家語言文字大數據中心,以數字化技術動態監測、收集和分析語言文字事業發展、國家語言能力建設、重點規劃實施、重大工程進展等核心業務數據,提高數據支持決策效率。以國家語言資源服務平臺建設為基礎,帶動地方語言資源平臺建設。推動基礎性語言資源建設,實施國家關鍵語料庫共建共享計劃,重點支持建設大規模中文語料庫及高質量民族語言文字語料庫、手語盲文語料庫、行業領域語料庫、語言監測動態語料庫等。加快應用性語言資源建設,重點推進助力學校教育教學、文化傳承發展的資源建設。開展戰略性語言資源建設,建設國家戰略語言資源信息庫,重點建設支撐國家安全與發展、服務共建“一帶一路”等語言資源。強化特色性語言資源建設,重點推進中國語言資源保護工程數字化建設,開發利用好國家語言地圖、中國語言知識圖譜、中華精品字庫等。
5.建強人才培養體系。建立產學研用協同培養語言文字信息化相關人才的機制,建設高水平人才隊伍。依托國家語言文字關鍵研究領域領航計劃,培養精通語言文字信息化建設的高層次緊缺急需人才。加強語言人才供需機制研究,支持高等學校語言學科與多學科深度交叉融合發展,加強“語言+人工智能”復合型人才培養。面向語言文字信息技術產業及未來發展方向,加強高素質技能人才培養。
6.構建協同創新體系。加強科教融匯、產教融合、校企合作、校際合作,協同推進語言文字信息技術的科學研究、技術攻關、應用創新和產業發展。充分發揮地方、高等學校、職業學校、科研機構、行業企業、社會團體等協同作用,共建“數字中文”聯盟,形成語言文字信息技術融合創新、共建共享和轉化應用機制。探索國際科研合作機制,提升語言文字信息技術的理論研究水平、產業應用能力和社會服務效能。
7.強化安全保障體系。重點加強語言文字資源信息安全治理,切實加強數據安全、倫理道德、價值觀對齊等重點事項的監測與管理,提升資源和技術的可信性、可控性和可靠性。支持生成式人工智能的語料規范性、生成內容評測評價和全流程追溯機制研究。加強面向語言資源監測的自然語言處理技術研究,強化語言文字信息安全的態勢感知、監測預警、風險評估和應急處置。規范網絡空間、數字空間的語言生態,建設健康文明的網絡語言環境,守住網絡安全底線。
四、著力提升語言文字信息化服務水平
8.實施數字中文服務教育發展行動。服務國家教育數字化戰略行動,加強語言文字信息化建設成果在國家智慧教育公共服務平臺和地方智慧教育平臺上推廣共享;助力打造中國版人工智能教育大模型;研究基于大語言模型的教學新范式,研制大語言模型能力素養框架(師生版);提升信息化場景下教師語言文字教學能力;強化數字化教學資源和應用系統的語言文字規范使用。加大國家通用語言文字推廣普及數字化賦能力度,高水平開展基于數字技術的普通話水平測試,服務鑄牢中華民族共同體意識。以信息化手段促進民族地區、邊境地區、偏遠地區和農村地區的語言文字教育和培訓。推動全球中文學習平臺、中文聯盟平臺等建設,提升國際中文教育的能力和水平。
9.實施數字中文助力科技創新行動。服務高水平科技自立自強,推動語言文字信息技術創新應用。加強有組織科研,探索自然語言處理、大語言模型等理論和技術創新,重點推動生成式人工智能、多模態信息處理、語言理解與生成、跨語言跨模態翻譯等方面的技術創新。堅持試點先行,支持面向重點行業、戰略區域和關鍵學科等的垂直領域大語言模型建設與應用。強化語言文字信息化研究成果轉化,鼓勵戰略急需、產業緊缺、民生期盼的數字化語言服務示范應用。加快布局支持一批新型語言文字交叉領域科研機構,重點建設多語言智能化科技創新中心和實驗室。支持數字中文建設、生成式人工智能技術等前沿領域的學術研討和競賽活動。
10.實施數字中文賦能文化傳承行動。服務國家文化數字化戰略,賦能中華優秀語言文化的創造性轉化和創新性發展。推動中國語言資源博物館和地方語言資源博物館的數字化建設。建設好中國語言文字數字博物館。以信息化手段加強全民語言文化素養的監測反饋、資源開發和教育活動。推進中華思想文化術語傳播工程成果的數字化應用。加強古籍數字化整理關鍵技術研究。推進甲骨文數字化共享。實施中華文化優秀課程多語種數字化全球傳播計劃,推動構建中文數字化國際化的立體傳播體系。
11.實施數字中文推動產業升級行動。服務數字經濟做強做優做大,推進語言技術賦能數字經濟發展。支持語言文字信息技術新產品、新職業和新業態發展,鼓勵傳統語言產業數字化轉型升級,培育基于數字中文的新型語言產業。推動語言資源、語言翻譯、智能機器人、中文內容服務等軟硬件產品研發應用,支持圍繞語音、語料、語言應用生態形成產業聚集,鼓勵創建語言產業應用示范品牌。持續推進《信息技術產品國家通用語言文字使用管理規定》實施,開展信息技術產品國家通用語言文字使用狀況監測、符合性認證與行業采信。支持解決信息技術產品生僻字問題,推動GB 18030《信息技術 中文編碼字符集》深入實施應用。
12.實施數字中文促進社會進步行動。服務數字社會精準化普惠化便捷化建設,持續提升關鍵領域數字中文服務水平。指導關鍵任務場景語言翻譯數據庫建設,研發特定科技產品,服務國家外交,維護國家安全。推動國家應急語言服務數字化技術應用和智能化服務模式創新,支持自然災害、公共衛生等突發事件應對。支持研發面向語言障礙人群、老年群體的科技設備,鼓勵智能終端設備的適老化研發及無障礙改造。支持數字時代的語言生活狀況研究。
五、組織實施
教育部、國家語委、中央網信辦會同國家語委委員單位統籌推進全國語言文字信息化工作,加強工作監督檢查,推進工作落實見效,支持有條件地區建設數字中文建設試驗區。各地區、各單位要將語言文字信息化納入本地區、本單位信息化工作規劃,因地制宜制定本地區、本單位語言文字信息化工作專項方案,實施特色項目,打造引領品牌。充分發揮語委委員單位、各級各類學校、研究機構和社會組織等多方作用。各地區、各單位要加大統籌力度,優化支出結構,加強語言文字信息化工作經費保障。健全多渠道投入機制,鼓勵社會力量參與,形成共建共享機制。各地區、各單位要及時總結工作中的好經驗好做法,加大宣傳推廣力度,征集并發布數字中文建設案例,促進區域、學校間交流,營造多部門參與、多方面支持、多層級聯動的良好氛圍。

【關注川越微信公眾號,了解更多】