Giter Club home page Giter Club logo

bigdata_docker's Introduction

BIG DATA ECOSYSTEM COM DOCKER

Ambiente para estudo dos principais frameworks big data em docker.
Esse setup vai criar dockers com os frameworks HDFS, HBase, Hive, Presto, Spark, Jupyter, Hue, Mongodb, Metabase, Nifi, kafka, Mysql e Zookeeper com a seguinte arquitetura:

Ecossistema

SOFTWARES NECESSÁRIOS

Para a criação e uso do ambiente vamos utilizar git e docker

OBS: Existe um git na instação do Docker ToolBox, caso já tenha instalado não precisa instalar novamente

SETUP

OBS: Esse passo deve ser realizado apena uma vez. Após o ambiente criado, utilizar o docker-compose para iniciar os containers como mostrado no tópico INICIANDO O AMBIENTE

Criação do diretório docker:

OBS: A criação do diretório é importante para os mapeamentos necessários

  • No Windows:

    • Criar na raiz do seu drive o diretório docker ex: C:\docker
  • No Linux:

    • Criar o diretório na home do usuário ex: /home/user/docker

Em um terminal/DOS, dentro diretório docker, realizar o clone do projeto no github

      git clone https://github.com/fabiogjardim/bigdata_docker.git

No diretório bigdata_docker vai existir os seguintes objetos

ls

  • No Windows:

    Abrir o Docker Quickstart Terminal, isso fará com que a VM default seja criada no VirtualBox ls

    No DOS, dentro do diretório bigdata_docker, renomear o arquivo docker-compose_windows.yml para docker-compose.yml

      move docker-compose_windows.yml docker-compose.yml
    

    Executar o arquivo virtualbox_config.bat
    O arquivo bat cria/reacria a VM default com disco de até 100GB, 8GB de memória, drive do repo compartilhado como /d e todas as portas necessárias mapeadas

    OBS: se o ser driver raiz for diferente de C:, alterar o arquivo virutalbox_config.bat na parte indicada no comentário. A memória também pode ser alterada no local indicado.

    ls

  • No Linux: Não é necessário alterar nem executar nada

INICIANDO O AMBIENTE

No Windows abrir o Docker Quickstart Terminal, do Linux um terminal

No terminal, no diretorio bigdata_docker, executar o docker-compose

      docker-compose up -d        

Verificar imagens e containers

     docker image ls

docker image ls

     docker container ls

docker container

SOLUCIONANDO PROBLEMAS

No Windows abrir o Docker Quickstart Terminal

Parar um containers

     docker stop [nome do container]      

Parar todos containers

     docker stop $(docker ps -a -q)

Remover um container

     docker rm [nome do container]

Remover todos containers

     docker rm $(docker ps -a -q)         

Dados do containers

     docker container inspect [nome do container]

Iniciar um container

     docker-compose up -d [nome do container]

Iniciar todos os containers

     docker-compose up -d 

Acessar log do container

     docker container logs [nome do container] 

Acesso WebUI dos Frameworks

Acesso por shell

HDFS
      docker exec -it datanode bash
HBase
      docker exec -it hbase-master bash
Sqoop
      docker exec -it datanode bash
Kafka
      docker exec -it kafka bash

Acesso JDBC

MySQL
      jdbc:mysql://database/employees
Hive
      jdbc:hive2://hive-server:10000/default
Presto
      jdbc:presto://presto:8080/hive/default

Usuários e senhas

Hue
Usuário: admin
Senha: admin
Metabase
Usuário: [email protected]
Senha: bigdata123 
MySQL
Usuário: root
Senha: secret
MongoDB
Usuário: root
Senha: root
Authentication Database: admin

Imagens

Docker Hub

Documentação Oficial

bigdata_docker's People

Contributors

fabiogjardim avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.