大數據(bigdata),指無法在一定時間范圍內用常規軟件工具進行捕捉、管理和處理的數據集合,是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產。作為時下最火熱的IT行業的詞匯,大數據應用隨之而來的數據倉庫、數據安全、數據分析、數據挖掘等圍繞大數據的商業價值的利用逐漸成為行業人士爭相追捧的利潤焦點。但不管如何,未來的創新發展離不開“大數據”應用。
出門乘網約車、跑步計量身體健康信息、坐飛機時了解航班是否準點。在大數據時代,每個人的生活都和數據息息相關,對核心數據的“爭奪戰”,也正在引領新一輪的科技創新。
大數據產業頻迎政策紅包
十三五大數據產業規劃步入政策落地期。工部副部長陳肇雄近日在“2017大數據產業峰會”上表示,工信部將從加強網絡設施建設、推進兩化融合等四個方面全面推進我國大數據發展和應用。地方層面,截至目前,已有北京、上海、重慶、廣東、山西、湖北等20多個省區市明確出臺了大數據產業發展規劃,搶占經濟發展制高點。隨著利好政策不斷釋放以及政府數據的逐步開放,政務、醫療、交通等領域的大數據應用創新活躍,大數據產業的春天到來。
“十三五”時期是大數據產業加快發展的重要窗口期。今年1月,工信部正式印發了《大數據產業發展規劃(2016-2020年)》(以下簡稱《規劃》)。《規劃》提出到2020年,技術先進、應用繁榮、保障有力的大數據產業體系基本形成。大數據相關產品和服務業務收入突破1萬億元,年均復合增長率保持在30%左右。這是大數據作為信息產業的細分行業之一,首次出現在五年規劃體系中。
大數據應用創新活躍
阿里巴巴集團董事局主席馬云表示,人類在正從IT時代走向DT時代。隨著互聯網+的深入發展,豐富的數據資源為大數據產業發展奠定了基礎。以大數據為基礎的數字經濟正成為經濟新動能,應用創新步伐不斷加快。
一方面,這與我國大部分企業的數據分析應用意識的提高有關。中國信息通信研究院發布的《中國大數據發展調查報告》數據顯示,59.2%的受訪企業已成立了數據分析相關部門,同時,27.3%的企業正計劃成立數據部門。企業應用大數據所帶來的主要效果包括實現智能決策、提升運營效率和改善風險管理。
另一方面,我國加快推動政府數據共享,進一步打通了政企、政府之間的數據壁壘。2015年我國正式發布《促進大數據發展行動綱要》。根據國家部署,2018年底前將建成國家政府數據統一開放平臺;2020年底前,逐步實現信用、交通、醫療、衛生、就業、社保、地理、文化、教育、科技、資源、金融等民生保障服務相關領域的政府數據集向社會開放。
目前,在社交、電商、搜索等互聯網領域,大數據應用快速普及,精準營銷、智能推薦、金融征信等新業態新模式蓬勃發展。而在工業、醫療、交通等傳統領域,大數據應用創新活躍,涌現出了個性化定制、智慧醫療、智能交通等大數據應用示范。3月29日,交通部發文稱,綜合交通大數據國家實驗室日前組建成立,未來將圍繞大數據,提高多交通方式協同能力,促進多種交通方式無縫銜接,提升綜合交通整體效能。
隨著大數據產業發展越來越正規化,大數據應用肯定會細分、細切到行業、專業、產業,應用會精細化到點。而每個精細化的應用都將產生比較大的商業價值。如今興起的大數據就像當年的“互聯網”、“移動互聯網”,發展到一定階段,勢必從通用平臺過渡到“行業”垂直平臺。中科點擊作為分行業大數據領域的先驅者,在大數據應用領域精耕細作多年,服務了超過2000+政府和企業客戶,其中有國安、網信、公安、宣傳、質監等重要政府單位,涵蓋汽車、金融、保險、地產等眾多行業支柱產業的龍頭企業,通過產品與服務,實現工作效能提升與商業增值。
大數據有風險
大數據挖掘,從正面來說,是創造價值;從負面來說,就是泄露隱私了!大數據隱私是如何被泄露的呢?請先跟我來分解一下經典的“人肉搜索”吧!
一大群網友,出于某種約定的目的,比如,搞臭某人或美化某人,充分利用自己的一切資源渠道,盡可能多地收集當事人或物的所有信息,包括但不限于網絡搜索得到的信息(這是主流)、道聽途說的信息、線下知道的信息、各種猜測的信息,等等;然后,將這些信息按照自己的目的精煉成新信息,反饋到網上與其同志們分享。這就完成了第一次“人肉迭代”。接著,大家又在第一次“人肉迭代”的基礎上,互相取經,再接再厲,交叉重復進行信息的收集、加工、整理等工作,于是,便誕生了第二批“人肉迭代”。如此循環往復,經過N次不懈迭代后(新聞名詞叫“發酵”),當事人或物的丑惡(或善良)畫像就躍然紙上了。如果構成“滿意畫像”的素材確實已經“坐實”,至少主體是事實,那么,“人肉搜索”就成功了。
其實,所謂的大數據挖掘,在某種意義上說,就是由機器自動完成的特殊“人肉搜索”而已。只不過,現在“人肉”的目的,不再限于抹黑或頌揚某人,而是有更加廣泛的目的,比如,為商品銷售者尋找最佳買家、為某類數據尋找規律、為某些事物之間尋找關聯,等等,總之,只要目的明確,那么,大數據挖掘就會有用武之地。
如果將“人肉”與大數據挖掘相比,那么,此時網友被電腦所替代;網友們收集的信息,被數據庫中的海量異構數據所替代;網友尋找各種人物關聯的技巧,被相應的智能算法替代;網友們相互借鑒、彼此啟發的做法,被各種同步運算所替代;各次迭代過程仍然照例進行,只不過機器的迭代次數更多、速度更快而已,每次迭代其實就是機器的一次“學習”過程;網友們的最終“滿意畫像”,被暫時的挖掘結果所替代,因為,對大數據挖掘來說,永遠沒有盡頭,結果會越來越精準,智慧程度會越來越高,用戶只需根據自己的標準,隨時選擇滿意的結果就行了。當然,除了相似性外,“人肉”與“大數據挖掘”肯定也有許多重大的區別,比如,機器不會累,它們收集的數據會更多、更快,數據的渠道來源會更廣泛,總之,網友的“人肉”,最終將輸給機器的“大數據挖掘”。
人們開發軟件、研制信息產品、建設網絡系統時,肯定都希望安全第一。但是,“理想很豐滿,現實很骨感”,任何系統都不可能絕對安全,其安全性也無法事先嚴格證明,只能由實踐來檢驗。無論多么認真,無論花費多少時間和精力,只要是人造的東西,就一定會有安全缺陷;而且,這些缺陷有時還很難被發現。怎么辦呢?當然只好由專門檢測人員,利用特制工具,來挖掘、修補和處理這些潛在的缺陷。
除了帶工資外,從純技術角度看,這些檢測人員與黑客其實沒啥區別;而且,他們顯然都是絕不可少的,因為,“帶著缺陷運行的系統”更危險、更可怕。從這個角度看,黑客的產生也是不可避免的。因為,即使是經過高級專門人員檢測后,也還會遺留一些未被發現的缺陷,于是,社會上便出現了一批“志愿者”,他們不分晝夜,不辭辛勞,對這些系統反復進行地毯式搜索,希望找到更多的漏洞去換錢,或以此證明自己的能力。這批“志愿者”就俗稱黑客。
如何進行風險防御
大數據時代背景下,針對過去已經遺留在網上的海量碎片信息,如何進行隱私保護呢?如果單靠技術,顯然無能為力,甚至會越“保護”就越“泄露隱私”,因此,必須多管齊下。比如,從法律上,禁止以“人肉搜索”為目的的大數據挖掘行為;增加“網民的被遺忘權”等法律條款,即,網民有權要求相關網絡刪除“與自己直接相關的信息碎片”。從管理角度,也可以采取措施,對一些惡意的大數據行為進行發現、監督和管控。另外,在必要的時候,還需要重塑“隱私”概念,因為,畢竟“隱私”本身就是一個與時間、地點、民族、宗教、文化等有關的東西,在某種意義上也是一種約定俗成的東西。
針對今后的網絡行為,應該如何來保護自己的隱私,至少不要把過多的沒必要的碎片信息遺留在網上呢?在這里,我想提供一個很實用的策略,那就是:匿名!只要做好匿名工作,那么,談論什么“隱私泄露”,就是無本之木、無源之水了。匿名的重點包括:
身份匿名。任何緋聞或丑事兒,當大家并不知道你就是當事人時,請問你的隱私被泄露了嗎?當然沒有!沒準你還踮著腳、伸著長脖子往前擠,還想多看幾眼熱鬧呢!
屬性匿名。如果你覺得自己的某些屬性(比如,在哪里工作、有啥愛好、病史記錄等)需要保密,那么,請記住:打死也不要在網上發布自己的這些消息,甚至要有意避開與這些屬性相關的東西。這樣別人就很難對你順藤摸瓜了。關系匿名。如果你不想讓別人知道你與張三是朋友,那么,最好在網上離張三遠一點兒,不要去關注與他相關的任何事情,更別與他搭訕。
位置匿名。這一點用不著我來教你了吧。至少別主動在社交媒體上隨時暴露自己的行蹤,好像生怕別人不知道“你現在正在某飯店吃飯”一樣。
概括一下,在大數據之前,隱私保護的哲學是:把“私”藏起來,而我的身份可公開。今后,大數據隱私保護的哲學將變成:把“私”公開(實際上是沒法不公開),而我的身份卻被藏起來,即匿名。
更多資訊請關注工業以太網頻道