海量分析平台六要件

2013-10-04_223209

海量分析平台六要件:

(1)资料仓储技术(处理Volume:“大”)
(2)Hadoop(处理Variety:“杂”)
(3)江河运算(处理Velocity:“快”)
(4)资料治理(处理Veracity:“疑”)
(5)文本分析
(6)视觉化和搜寻介面

另外Hadoop计划下的两个主要项目:分散式档案系统(Hadoop Distributed File System,HDFS)和分散性处理程式框架(MapReduce)。

[adsense][/adsense]

这是我对云端时代的杀手级应用:Big Data海量资料分析最感兴趣,也是点到最多技术的一个章节,先列出这样的架构,后续有兴趣再继续学习。