大数据

  • 8个值得关注的SQL-on-Hadoop框架(转)

    分类:知识库    标签:,

    数据的操作语言是SQL,因此很多工具的开发目标自然就是能够在Hadoop上使用SQL。这些工具有些只是在MapReduce之上做了简单的包装,有些则是在HDFS之上实现了完整的数据仓库,而有些则介于这两者之间。这样的工具有很多,来自于Shoutlet的软件开发工程师Matthew Rathbone最近发表了一篇文章,他列举了一些常用的工具并对各个工具的应用场景和未来进行了分析。Apache Hiv…

  • 数据仓库的大数据集成

    分类:知识库    标签:,

    集成策略         数据集成是指将来源于不同系统的数据组合在一起,供业务用户研究不同的行业行为及客户行为的数据处理方式。在数据集成应用早期,数据仅限于交易系统及其应用。业务决策的制定以决策平台为指导,而有限的数据集提供了创建决策平台的基础。 数据容量与数据类型在过去三十年里大幅增长,数据仓库技术从无到有,基础架构和技术的发展满足了分析和数据存储需求。这一切彻底改变了数据集成的前景。 传统数据…

  • 大数据可视化小结(一)

    分类:知识库    标签:,

    对数据可视化的需求正急剧增长。一部分原因是更多的公司正在寻求通过对大数据分析来获得可视化的业务洞察力。         大数据的可视化个人认为还是以仪表盘为展现的最终载体,当然仪表盘会包含移动端、云端和企业端。那么,仪表盘中的内容应该包含哪些?         1、单纯的数字展示         大数据的最终分析结果,其中有一种是对关键指标的计算结果,如:市场模糊占有率,总体情感指数,用户粘度系数…

  • 大数据行业的浮躁

    分类:知识库    标签:,

    我是IT从业者,俗称“程序猿”,而且大学学计算机专业也是自己寻死觅活一定要读的专业,可以说从一开始就是我自己的选择,机缘巧合之下一直从事数据技术相关的工作,尤其是这几年大数据技术、概念、名词风起云涌后,我作为站在风口的猪,虽然没有被吹上天,不过也侥幸的一直活下来了。 然而,个人认为最近几年大数据概念几乎充斥了所有领域,就像当年的云计算一样一样的,真正落地的反而没多少。 从技术上来说,过往做互联网信…