近日,美國發布“聯邦大數據研發戰略計劃”,旨在為在數據科學、數據密集型應用、大規模數據管理與分析領域開展和主持各項研發工作的聯邦各機構提供一套相互關聯的大數據研發戰略,維持美國在數據科學和創新領域的競爭力。
該計劃提出了以下7大戰略:
(1)充分利用新興的大數據基礎和技術,創建新一代能力
不斷增加對下一代大規模數據采集、管理和分析的投資有助于各機構逐漸適應和管理規模和復雜性日增的數據,并利用這些數據創建全新的服務與功能。在新方法開發方面,計算與數據分析技術的進步將改進復雜數據處理、簡化可擴展并行系統的編程;計算機科學、機器學習和統計學的發展將提升未來數據分析系統的靈活性和可預測性;社會計算研究將幫助人類協調計算機無法勝任的任務;新的數據交互和可視化技術將改善“人類-數據”接口。
(2)探索與理解數據及知識的可信度,實現突破性科學發現和更好的決策,開展有把握的行動
為確保源自大數據的信息和知識的可信度,需要開發合適的方法來捕獲數據的不確定性并確保結果的可再現性和可復制性。提升數據驅動型決策的透明度需要開發相應的技術與工具,而對數據分析結果進行解釋并由此采取適當行動可能需要人力的介入。
(3)創建并改善科研網絡基礎設施,實現大數據創新,為各機構完成其任務提供支持
需要制定一份協調的國家戰略來確定對安全、先進的網絡基礎設施的需求,支持對海量數據包括物聯網產生的大量實時數據流的處理與分析,并實現個人隱私保護。共享的基準、標準和指標對網絡基礎設施生態系統的良好運作至關重要。
(4)通過促進數據共享與管理的政策提升數據的價值
保證對更多數據的可持續訪問,以實現數據的價值并最大化其影響。促進數據共享和相關基礎設施的互操作性,可以提升現有數據的可獲取性和價值,提高聯合數據集分析能力。開發數據共享的最佳實踐和標準以及能改善數據易用性和數據傳輸的新技術,可以提升資源使用效率。
(5)針對隱私、安全和倫理,理解大數據的收集、共享與使用
隱私、安全和倫理是大數據創新生態系統重點關注的問題。隱私關系到數據收集者和提供者如何看待和管理信息,安全涉及個人信息,其重點是數據保護,倫理方面,數據分析有可能導致差別對待并波及民事權利。應制定新的政策來保護隱私和明確數據所有權,開發數據安全評估技術與工具,以確保高度分布式網絡中的數據安全。
(6)完善大數據教育與培訓的國家布局,滿足對高級分析人才的需求,并幫助更廣泛人群具備分析能力
要滿足對大數據人才日益增長的需求,需要制定綜合性教育戰略,確定數據科學家的核心教育需求,為下一代的數據科學家提供資金支持,壯大數據科學員工及研究人員的隊伍。隨著科學研究產生的數據日益增多,領域科學家需要通過與數據科學家合作、參與短期課程培訓等進一步提升自身的數據科學技能。數據科學教育研究應探索數據素養的概念、課程模式,以及各階層需要學習的數據科學技能。
(7)在國家大數據創新生態系統中建立各種聯系并加強這些聯系
建立可持續的機制,提高聯邦各機構合作開展大數據研發的能力。可能的機制包括:創建跨機構測試床,幫助各機構合作開發新技術并將研發成果轉化為創新能力;制定相關政策,實現快速、動態的跨機構數據共享;形成關注重大挑戰應用的大數據“基準中心”,確定達成美國關鍵優先領域的目標所需的數據集、分析工具和互操作性。、
更多資訊請關注自動化軟件頻道。