通常意義上講,大數(shù)據(Big Data)包括海量交易數(shù)據(結構化數(shù)據)和海量交互數(shù)據集(非結構化數(shù)據)在內的所有數(shù)據集,其規(guī)模(PB級別)或復雜程度超出了常用技術按照合理的成本和時限捕捉、管理及處理這些數(shù)據集的能力。
傳統(tǒng)的企業(yè)用戶的海量數(shù)據分析處理系統(tǒng)目前絕大多數(shù)都采用高性能主機+高端存儲的Shared-Everything架構,隨著數(shù)據來源的極大豐富和數(shù)據量的急劇增加,傳統(tǒng)的系統(tǒng)架構已顯露出技術瓶頸和成本性價比的問題,簡而言之,不僅實現(xiàn)成本高昂且更關鍵在于無法解決客戶所關心的問題。而與此同時,互聯(lián)網公司等新興行業(yè)普遍采用的分布式Shared-Nothing大數(shù)據處理架構已經證明了大數(shù)據分析處理行業(yè)可以有著完全不同的演進方向。
通常意義上講,大數(shù)據(Big Data)包括海量交易數(shù)據(結構化數(shù)據)和海量交互數(shù)據集(非結構化數(shù)據)在內的所有數(shù)據集,其規(guī)模(PB級別)或復雜程度超出了常用技術按照合理的成本和時限捕捉、管理及處理這些數(shù)據集的能力。
傳統(tǒng)的企業(yè)用戶的海量數(shù)據分析處理系統(tǒng)目前絕大多數(shù)都采用高性能主機+高端存儲的Shared-Everything架構,隨著數(shù)據來源的極大豐富和數(shù)據量的急劇增加,傳統(tǒng)的系統(tǒng)架構已顯露出技術瓶頸和成本性價比的問題,簡而言之,不僅實現(xiàn)成本高昂且更關鍵在于無法解決客戶所關心的問題。而與此同時,互聯(lián)網公司等新興行業(yè)普遍采用的分布式Shared-Nothing大數(shù)據處理架構已經證明了大數(shù)據分析處理行業(yè)可以有著完全不同的演進方向。









