網絡每時每刻都在處理數據,但如果把“大”這個詞放在“數據”前面,網絡管理員和首席信息官就必須面對很多全新的挑戰。
大數據將給企業使用的網絡帶來什么樣的挑戰?
人們想象一下這樣一個世界:電視臺可以在電視劇第一集播放結束之前就準確預測其表現;公用事業公司可以通過分析家用電器的傳感器的數據,幫助居民減少能源支出;或者,運輸公司可以通過實時跟蹤包裹來優化運輸路線和燃料消耗。
這種情形是不是太超前了?事實上,如今差不多可以實現。
移動應用、全IP無線網絡、在線商務、銷售點系統、社交媒體的興起,以及從交通監控到庫存管理等各方面的傳感器的使用,都會產生數據,如果管理得當,這些數據可以為推動商業決策提供關鍵的信息和情報。這些數據大多是動態收集的,如果能迅速采取行動,就能為企業提供獨特的競爭優勢,提供更多的業務機會,并解決出現的問題。
但是,由于數據量巨大,速度不斷提高,也推動了網絡需求的極限。網絡每時每刻都在處理數據。但如果把“大”這個詞放在“數據”前面,網絡管理員和首席信息官就必須面對很多全新的挑戰。
改變數據流
如今的數據無疑正在發生變化,數據量也正在呈指數級增長。數據關系已經從簡單和已知走向復雜和未知,數據模型已經從固定模式類型轉移到無模式類型。數據來源已經從簡單的數據輸入變成了來自各種來源的實時流,包括手持設備和機器傳感器。
大數據的形式尤其多樣。例如在網絡中,通話記錄看起來與信用卡交易不同。與傳統應用中的結構化數據不同,大數據包括半結構化或非結構化數據,如文本、音頻、視頻、點擊流、日志文件,以及測量和傳輸地理和環境信息的傳感器的輸出。
大數據環境改變了數據在網絡中的流動方式。大數據產生的東西方向流量或服務器之間的流量遠遠大于南北或服務器到客戶端的流量,而且對于每一次客戶端交互,可能會有成百上千的服務器和數據節點交互。應用程序架構也相應地從集中式模型發展到分布式模型。這與過去20年建立的傳統客戶機/服務器網絡架構背道而馳。
大數據對網絡的影響
大數據系統從各種來源提取數據,運行在分布在多個網絡節點上的服務器集群上。這些集群以并行的向外擴展方式運行任務。流量模式可以從1對1(電話)、1對多(電視節目)、多對1(音樂會觀眾)和多對多(CB無線電),這是并行運行的多個節點之間的單播和多播流的組合。網絡管理員需要處理這種流量模式的組合,其中一些模式創建一個流,一些模式創建多個流。
此外,當數據被提供給計算節點時,它會產生大量的網絡流量。分布式節點之間的數據洗牌和排序操作需要快速和可預測的傳輸。雖然分析系統使用直接附加的存儲進行處理,但中間存儲階段的數據。
在分析過程中,數據需要在網絡中移動和有效地操作。隨著新的數據集的增長和源的添加,工作負載也會增長。快速增加產能的需求也是如此。因此,在網絡架構中優先考慮本地、高性能、水平可擴展性和直接服務器節點到服務器節點的連通性非常重要。
對新的網絡模式的需求
一種設計模型包括構建在低端硬件上,并讓分析軟件對網絡問題做出反應,例如重新啟動由于擁塞而超時的作業。該模型用于非實時處理,即完成時間不重要,數據主要來自一個來源。
另一個設計模型涉及構建基于硬件的系統,該系統提供確定性性能,以確保連續處理。該模型用于對來自多個來源的數據進行近實時分析。
與此同時,實時大數據系統受益于網絡節點以任意對任意模型相互連接的拓撲結構,節點之間只進行單一跳躍,為處理多個大數據流提供了一個專用系統,具有低損耗和確定性性能。交換結構可以提供這種模型。
交換結構提供了整體系統帶寬和性能的優勢,特別是減少延遲。位置獨立性允許集群和數據從架構中的任何位置獲得最佳性能。這種架構還可以無縫地將新數據源合并到集群中,而無需重新連接,并極大地簡化了系統的擴展。它提供了收斂性,允許服務器集群和存儲區域網絡跨一個網絡進行通信。資源作為一個實體進行管理,策略可以很容易地跨整個交換基礎設施應用。
實施大數據解決方案
大數據為企業提供了前所未有的獲取和分析數據的巨大機會。當IT組織開始測試和開發他們的解決方案時,網絡管理員必須考慮這些技術對他們的服務器、存儲、網絡和操作基礎設施的影響。企業如何才能最好地開發新的基礎設施來利用和分析不斷增長的大數據流?在開發網絡拓撲結構時考慮以下問題:
●數據流的分析是實時進行的嗎?
●是否有多個數據源,它們是靜態的還是流動的?
●如果試點成功,集群需要有多大?
●增加更多的產能有多容易和快速?
●大數據應用需要與其他應用集成嗎?
回答這些問題將有助于構建討論框架,它們將說明基礎設施將如何影響數據中心架構和互連需求。
大數據使企業能夠制定新的戰略,提供實時業務分析和新的業務洞察,從而推動業務的發展。然而,隨著企業看到的快速變化,有必要考慮為未來的業務需求提供規模、性能和空間的關鍵技術,以滿足最高級別的投資保護、業務敏捷性和上市時間。