Linux Ubuntu 16.04安装Hadoop全过程(一)
本文简要记述了本人参考网上教程在Ubuntu上(虚拟机)搭建Hadoop的过程,以备后用和各位获取。 前言Hadoop是当今最流行的分布式系统之一,能够充分利用集群进行分布式程序的开发,以实现大规模数据的高速运算和存储。Hadoop包括两个最重要的设计:HDFS和MapReduc
3,265本文简要记述了本人参考网上教程在Ubuntu上(虚拟机)搭建Hadoop的过程,以备后用和各位获取。 前言Hadoop是当今最流行的分布式系统之一,能够充分利用集群进行分布式程序的开发,以实现大规模数据的高速运算和存储。Hadoop包括两个最重要的设计:HDFS和MapReduc
3,265很久没有写文字了,最近也是挺忙的,工作日忙着工作,周末忙着出去玩。 想想一个月前毕业之际的情景还历历在目,当时的自己走的爽快,不留下一丝伤感,不带走一丝怀念,等到发觉四年同学真的就分别了, 呆了四年的母校也终究离开了, 还没来得及好好珍惜,却已经迟了。狄更斯有一句话我觉得写得特别
1,2272016年6月14号,在没有过多准备下,与7位同学一起,开始了一场类似说走就走的毕业旅行。这次旅行以西安为主,后来分开,我们其中四人又转场来到重庆,最后回到成都。在旅行中收获了诸多欢乐,也尝试了许多新奇事物,看到了以前看不到的东西,留下一点小记。 6月14深夜到达西安站,吃完东西
1,992最近找到一个网站,http://www.pm25x.com/,发现上面有全国基本所有市的实时空气质量指数(AQI),就将它们爬了下来,存入了xlsx文件和CSV文件。又想着要利用一下才好,于是想到了描绘全国城市AQI分布图。这时就需要画包括省市的中国地图。最终找到了如下几种方式来
926《谁动了我的奶酪》 斯宾塞·约翰逊这本书故事看来很简单,主要说的就是要拥抱变化,提前察觉变化,做好准备应对变化,尽快适应变化等等。总之就是叫你不要因循守旧,变则通,通则久。 《幸福之路》 罗素 (刘勃译)数学专业,获得诺贝尔文学奖的哲学大师罗素在这本书里阐述了我们不快乐的一些原
3,900论文初稿终于告成,又可以偷得浮生几日闲了,上次谈了谈阅读,这次来说说写作这件事儿。 笔者最早接触博客是在2012年,1月17日注册了新浪博客,那时候韩寒和方舟子在博客上打笔仗闹得正欢,为了更加密切的关注,就顺手注册了一个新浪博客。后来也发了一些个文章,现在回去看那些文字真是有点哭
1,830Scrapy是什么?Scrapy是一款网络爬虫框架,官方文档的描述如下: Scrapy是一个为了爬取网站数据,提取结构性数据而编写的应用框架。 可以应用在包括数据挖掘,信息处理或存储历史数据等一系列的程序中。 其最初是为了 页面抓取 (更确切来说, 网络抓取 )所设计的, 也可
6,444–本博客5月18日优化,增加博客打赏功能 使用Hexo这款博客框架已经很久了,期间也一直在摸索,一次次地修改代码,看效果,修改,看效果…,现在已经大致熟悉了整个框架的结构,能够自主完成对主题的修改了。 接下来可以考虑写一篇解析Hexo框架的文章,一来加深自己对框架的理解,方便后续
3,953本文译自康奈尔大学信息科学系助理教授David Mimno写的《Advice for students of machine learning》,Mimno先生总结了一些对于机器学习学生/初学者的建议,强调理论与实践相结合,要有耐心和毅力,并提出了深入研究一篇论文的方法。希望对读
889本文译自微软剑桥研究院Simon Peyton Jones的演讲PPT。 西蒙·佩顿·琼斯(Simon Peyton Jones,1958年1月18日-),生于南非,英国计算机科学家,毕业于剑桥大学三一学院,以研究函数编程语言的实作与应用为主,特别是针对惰性函数编程语言(lazy
3,340