為了搶抓人工智能發展的重大戰略機遇,構筑我國人工智能先發優勢,加快建設創新型國家和世界科技強國,國務院發布實施了《新一代人工智能發展規劃》,規劃從戰略態勢、總體要求、重點任務、資源配置、保障措施和組織實施等方面對面向2030年的中國人工智能產業進行了系統部署,并將“大數據智能”并作為規劃部署的五個重要方向之一。
大數據智能是以人工智能手段對大數據進行深入分析,探析其隱含模式和規律的智能形態,實現從大數據到知識、進而決策的理論方法和支撐技術,大數據智能將建立可解釋通用人工智能模型,實現“大數據+人工智能”的方法論。
規劃中明確指出,在有望引領人工智能技術升級的基礎理論方面,大數據智能要重點突破無監督學習、綜合深度推理等難點問題,建立數據驅動、以自然語言理解為核心的認知計算模型;在建立新一代人工智能關鍵共性技術體系方面,大數據智能要構建知識計算引擎和提供知識創新服務,形成開放兼容、穩定成熟的知識加工、深度搜索和可視交互核心技術;在布局人工智能創新平臺,強化對人工智能研發應用的基礎支撐方面,要建立大數據人工智能開源軟件基礎平臺、終端與云端協同的人工智能云服務平臺、新型多元智能傳感器件與集成平臺、基于人工智能硬件的新產品設計平臺、未來網絡中的大數據智能化服務平臺等。
一、從數據到知識、從知識到決策是當前大數據智能的計算范式。
如果說人工智能是經濟發展的新引擎,正在重構生產、分配、交換、消費等經濟活動各環節,那么大數據就是這個引擎的燃料。大數據與人工智能有機結合,則是發動這個引擎的金鑰匙。傳統人工智能基于專家手工構造的知識庫來進行學習推理,如專家系統。由于難以構造較為全面的人類常識知識庫,以及還存在不確定性知識,因此,依賴于知識庫的人工智能方法在提升學習推理方法性能方面遇到了難以跨越的鴻溝。
與基于規則、邏輯和知識的推理學習方法不同,機器學習方法從大數據出發,去洞悉海量數據中隱藏的規律和模式,如從網購商品中自動挖掘用戶消費偏好和從用戶檢索詞條中洞悉文化概念的演化變遷等。
更進一步,隨著互聯網的普及、傳感網的滲透、大數據的涌現、信息社區的崛起,數據和信息在人類社會、物理空間和信息空間(Cyber-Physical–Human,簡稱CPH)——之間的交叉融合與相互作用,人類社會與信息世界和物理世界所產生數據在個體/群體所呈現的前所未有廣度和深度的交互行為中正在進一步深度耦合。CPH深度融合推動了文本、圖像、位置和視頻等海量數據涌現,使得隱藏在這些海量數據中的知識呈現不確定、復雜性和多樣性。
大數據刻畫了個人/群體的生活、工作和學習規律和模式,為了洞悉這些隱性知識,迫切需要建立從大數據到知識的一般性手段和方法,其具有從文本、圖像和視頻等大數據中永不停息學習規則、模式和知識的能力,助力決策者從大量非結構化數據中揭示非凡的洞察。同時,要具備提供知識云計算服務的能力,通過知識服務打破數據藩籬,推動多領域數據的融合碰撞,讓數據暢通流動從而發揮巨大效益。
當前,大數據智能正從傳統“以規則教”的學習推理方法,到數據驅動的知識挖掘方法,邁向數據驅動和知識引導相結合的新時代,推動人工智能從表象和特征深入到綜合推理。
二、知識創新服務與決策支持是大數據智能釋放“智能紅利”的關鍵
將通過知識計算獲得的知識,應用到實際的生產生活中,轉換為相應的能力來解決我國社會經濟發展中的資源、環境等社會問題、參與公共事務決策、發現社會發展規律,同時支撐新產業和新業態的跨界深度融合和創新服務,促進社會生產力的再次飛躍,是大數據智能釋放出“智能紅利”的關鍵。
大數據智能具有極其廣泛的應用,如在醫藥衛生方面的藥效分析與新藥研制、病例分析與預測、基因檢測和健康保險智能化管理等;在工業方面的新材料的模擬與預測、產品的智能化設計、智能物流以及宏觀經濟預測和調控智能化等;在科教方面的智能圖書館和知識服務系統、知識交叉創新等;在城市建設與管理方面的城市運行模擬與預測、環境智能分析與改善決策、智能交通、人口資源綜合分析以及城市經濟結構調整的智能輔助等等。