Giter Club home page Giter Club logo

big-data's Introduction

大数据处理技术导论 Big Data {docsify-ignore-all}

本项目《大数据处理技术导论》是Datawhale:whale:数据科学小组近期推动的一个重点项目。

当今的时代处处充斥着大数据的影子,大数据技术也为信息技术发展带来了重大的变革,并深刻影响着人们生活的方方面面。而我们旨在带领大家走进大数据时代的浪潮中,理解并能够使用目前主流的大数据处理架构Hadoop解决相应的问题,从小白到实践者。

食用方法

🐳 推荐使用 Big Data Github在线阅读Big Data Gitee在线阅读进行学习。

有配套代码的章节,可以在项目experiments目录的相应章节目录下面找到。

以下是目录,还等什么,学就完事了~

大数据处理技术导论目录

第二章以后的章节都配置有实验内容,使用Linux操作系统进行编程实战。

课程收获

通过本教程的学习,你将能够学习到:

  • 了解并描述大数据技术的应用场景,真实世界的大数据问题和方法的例子。
  • 解释大数据4V的特性以及各种特性如何影响到数据的收集、监控、存储、分析和报告的方方面面。
  • 识别大数据问题,并能够将问题转化为数据科学问题。
  • 总结HDFS文件系统和MapReduce编程模型的特点和意义,以及它们与大数据的关系。
  • 识别和利用数据科学生命周期和相关数据流中的各种组件,如HBase,Hive等。

参考教程

  1. 《大数据处理技术原理与应用 第三版》——林子雨
  2. Big Data US SanDiego
  3. 《Hadoop权威指南》
  4. 《Hive编程指南》
  5. 《维度建模权威指南(第3版)》
  6. 《大数据处理之道》
  7. 《Spark快速大数据分析》
  8. 《Spark SQL内核剖析》

致谢

感谢以下Datawhale成员对项目推进作出的贡献(排名不分先后):

贡献者名单
成员 个人简介及贡献 个人主页
沈豪 复旦大学网安博士在读,项目负责人,参与前五章内容构建 知乎, Github
刘洋 中科院数学与系统科学研究院研究生,Datawhale成员,主要贡献者 知乎, Github
王洲烽 太原理工大学数据科学与大数据技术本科生,Datawhale成员,主要贡献者 CSDN, Github
王嘉鹏 小米大数据开发工程师,Datawhale成员,主要贡献者 CSDN, Github
胡锐锋 国网大数据平台研发工程师,Datawhale成员,主要贡献者 Github

关注我们

扫描下方二维码关注公众号:Datawhale

  Datawhale是一个专注AI领域的开源组织,以“for the learner,和学习者一起成长”为愿景,构建对学习者最有价值的开源学习社区。关注我们,一起学习成长。

LICENSE

知识共享许可协议
本作品采用知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议进行许可。

big-data's People

Contributors

ditingdapeng avatar relph1119 avatar shenhao-stu avatar wzfer avatar

Watchers

 avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.