2021年11月,國務院辦公廳頒發(fā)《關于全面加強新時代語言文字工作的意見》,提出推進語言文字基礎能力和服務能力建設等五項重要任務。現(xiàn)階段,語言文字在人們生產(chǎn)生活中的應用以知識密集型的文檔形式居多,如何借助自然語言處理、知識圖譜、光學字符識別等人工智能關鍵技術實現(xiàn)文檔處理的自動化、數(shù)字化、智能化,近年備受學術界和產(chǎn)業(yè)界關注。
為促進智能文檔處理技術和產(chǎn)品的標準化及規(guī)范化發(fā)展,中國信息通信研究院(以下簡稱“中國信通院”)聯(lián)合多家核心參編單位,共同編制標準《自然語言處理技術及產(chǎn)品評估方法 第8部分:智能文檔處理系統(tǒng)》。標準總體分為技術能力、產(chǎn)品能力和應用能力三個模塊,聚焦產(chǎn)品技術性能優(yōu)越度、功能完備度和應用成熟度提出技術要求和評估方法。
目前,中國信通院已參考上述標準完成首輪智能文檔出處理產(chǎn)品評測,累計為4家企業(yè)提供8個模塊的產(chǎn)品評測。10月25日至28日,衛(wèi)士通人工智能數(shù)據(jù)安全分析服務平臺參與中國信通院組織的第二輪“可信AI”智能文檔處理測評工作,并順利完成技術能力模塊測評。此次測評,共涉及2個能力域、10個能力項和20余項關鍵指標,全方位評估智能文檔處理通用技術和專用技術的性能指標。
本次參測的衛(wèi)士通人工智能數(shù)據(jù)安全分析服務平臺在智能文檔處理的通用能力和AI核心能力方面均表現(xiàn)優(yōu)異。在通用能力方面,該平臺在信息抽取、表格文字識別、表格結構識別、版面分析、文檔分類等文檔處理能力均有較高的支持度。在AI核心能力方面,該平臺在文本分類、實體識別、關系抽取、事件抽取、光學字符識別等指標上的準確率、召回率、F1值總體較高。
由于業(yè)務量不斷增長,企業(yè)對智能化處理文檔的需求也在不斷增加,隨之產(chǎn)生的數(shù)據(jù)堆積和安全等問題亟待解決。在此背景下,衛(wèi)士通融合自然語言處理、知識圖譜、光學字符識別等人工智能關鍵技術打造人工智能數(shù)據(jù)安全分析服務平臺,支持解決多場景下的文檔信息處理、數(shù)據(jù)安全問題。該平臺依托先進的深度學習算法和海量的數(shù)據(jù)積累,提供文檔智能處理、敏感數(shù)據(jù)檢測、數(shù)據(jù)智能分級分類等一體化服務,實現(xiàn)企業(yè)文檔流程化、自動化、智能化處理,并全面保障企業(yè)文檔數(shù)據(jù)內容安全,助力金融、交通、醫(yī)療、政務等多種領域業(yè)務場景智能升級。
新聞延伸
AI工程化推進委員會:2017年10月初,工業(yè)和信息化部正式批復中國信息通信研究院承建人工智能關鍵技術和評測工業(yè)和信息化部重點實驗室(以下簡稱“部重點實驗室”)。
中國信通院為進一步推動我國人工智能的工程化進程,依托部重點實驗室成立了AI工程化推進委員會。委員會聚焦人工智能開發(fā)工具和平臺,AI研發(fā)運營和管理,大模型應用,知識計算應用和AI數(shù)據(jù)集治理等技術方向,以產(chǎn)業(yè)活動、研究報告、標準和評測、最佳實踐等手段,推動人工智能工程化相關的工具、系統(tǒng)、流程和治理體系的完善。