首页»云计算/大数据
  • 大数据弹性应用开发的八项基本原则

    发表于:2014-08-25阅读239次1条评论

    大数据应用正在从概念走向现实,而企业在大数据应用开发时,软件的弹性(Resilient)正在成为决定大数据应用成败的关键因素。弹性差的应用无法应对大规模的数据集,在测试和运营中也缺乏透明度,而且也不安全。

  • 推荐系统的那点事

    发表于:2014-08-25阅读7949次1条评论

    回想起来,我也算是国内接触推荐系统较早的人之一了,最近和人聊天,觉得不少人对推荐系统有所误解,以为需要多么高大上的算法才能搭建起来的,我只想说我经常说的那句话【不是这样的】,所以有了这篇文章。

  • 大数据是个什么鬼啦?

    发表于:2014-08-22阅读816次1条评论

    目前,大多数人对大数据的概念还停留在:就是海量的数据,PB(1PB=1024TB)级别的,甚至是 EB、ZB 以上的数据,通过对这些数据进行深入分析,就能得出非常有价值的结论,指引企业做出最佳决策。

  • 5种方式将机器学习带到Java、Python以及Go等编程语言

    发表于:2014-08-15阅读1194次1条评论

    机器学习目前炙手可热,本文搜集了Java、Python以及go等编程语言中常见且实用的开源机器学习工具,对机器学习感兴趣的开发者或者准备和机器学习打交道的数据科学家们不能错过了。

  • 2014年值得关注的十个Hadoop大数据创业公司

    发表于:2014-04-24阅读947次1条评论

    尽管困难重重,Hadoop创业公司依然如雨后春笋冒出,除了Cloudera、Datameer、DataStax和MapR等已经功成名就的Hadoop创业公司外,最近CIO杂志评出了2014年十大最值得关注的Hadoop创业公司,了解这些公司的产品和商业模式对企业大数据技术创业者和大数据应用用户来说都非常有参考价值:

  • 机器学习入门阶段程序员易犯的5个错误

    发表于:2014-04-23阅读173次1条评论

    怎样进入机器学习领域没有定式。我们的学习方式都有些许不同,学习的目标也因人而异。但一个共同的目标就是要能尽快上手。如果这也是你的目标,那么这篇文章为你列举了程序员们在通往机器学习高手道路上常见的五种错误。

  • 6个用于大数据处理分析的最好工具

    发表于:2014-04-17阅读1387次1条评论

    大数据是一个含义广泛的术语,是指数据集,如此庞大而复杂的,他们需要专门设计的硬件和软件工具进行处理。该数据集通常是万亿或EB的大小。这些数据集收集自各种各样的来源:传感器,气候信息,公开的信息,如杂志,报纸,文章。

  • 强烈推荐!大数据领域的顶级开源工具大集合

    发表于:2014-04-16阅读1836次1条评论

    如今,从小型初创企业到行业巨头,各种规模的供应商都在使用开源来处理大数据和运行预测分析。本文介绍了一些大数据方面的顶级开源工具,分为四个领域:数据存储,开发平台,开发工具和集成,分析和报告工具。

  • 大数据处理的开发经验

    发表于:2014-04-14阅读1102次1条评论

    大数据已经不是什么新话题了,在实际的开发和架构过程中,如何为大数据处理做优化和调整,是一个重要的话题,最近,咨询师Fabiane Nardon和Fernando Babadopulos在“Java Magzine”电子期刊中发文分享了自己的经验。

  • 不看不知道:六个超大规模Hadoop部署案例

    发表于:2014-03-28阅读1470次1条评论

    Hadoop的优点很多,但也并非十全十美。这次我们介绍eBay、Orbitz Worldwide、Facebook、Infchimps等大型网络公司实际部署Hadoop的案例,希望从这些真实的案例当中,能给大家一点启示。

  • Hadoop科普文——常见的45个问题解答

    发表于:2014-01-08阅读1107次1条评论

    时至今日,Hadoop已成为最流行的离线数据处理平台,然而它的集群配置起来并不简单。如果你学习Hadoop不久,相信下面这45个问题会对你有所帮助。

  • 2014的12个大数据趋势:Hadoop继续升温 R将进入主流

    发表于:2013-12-30阅读613次1条评论

    2013,“大数据”无疑是IT界最火的词汇之一。MapReduce、Storm、Impala以及Spark,大数据领域开源技术林立。翻过2013,走进2014,大数据领域又会向着什么样的方向发展,这里我们看数位行业高管带来的12条预测。

65篇文档«123456»