Giter Club home page Giter Club logo

work-at-olist-data's Introduction

Teste prático (olist-hiring-bsa)

Esta é a página com o teste prático para candidatos ao processo seletivo de cientistas, analistas e engenheiros de dados para o time de Business Science & Analytics do olist. Ao finalizar o teste, nos comunique pelo https://bit.ly/2NNVyXk.

Cenário

O olist é a maior loja de departamentos dos marketplaces. Possui um catálogo com mais de 250 mil produtos e uma rede de mais de 5 mil lojistas parceiros espalhados por todo o Brasil. Entendemos que a área de dados e inteligência é uma das principais alavancas de crescimento do negócio, por isso buscamos profissionais apaixonados por dados para integrar a nossa equipe de Business Science e Analytics (BSA).

Estamos o tempo todo gerando dados, dados e muito mais dados. Nosso cenário é de big data!

Como é o nosso banco de dados?

Considere que a figura abaixo seja um hipotético banco de dados de e-commerce e que cada tabela desse banco de dados esteja disponível como um dataset. Aqui estão os datasets. Perceba que os dados são amostrais e estão apresentados no modelo relacional, pois foram extraídos diretamente do ambiente transacional.

Estrutura do Banco de Dados

Bom, e aqui você pode observar como um produto é exibido na plataforma de e-commerce.

Exemplo de produto exibido na plataforma

Desafio

Esta plataforma de e-commerce transaciona dados do varejo brasileiro. Assim, as áreas de negócio da empresa estão com algumas dúvidas e desafios como:

  • Será que nossos diferentes lojistas associados conseguem manter o preço do mesmo produto sem grandes discrepâncias?
  • Podemos dar os mesmos benefícios para todos os lojistas (sellers)? Ou existe algum que merece destaque?
  • Existe diferença no valor do frete praticado em regiões/cidades diferentes? Ou podemos aplicar as mesmas regras de subsídio de frete para qualquer localidade?
  • Será que nosso catálogo de produtos é abrangente? Ou tem foco em poucas categorias?
  • Será que vendemos os mesmos produtos rotineiramente? Ou existem sazonalidades?
  • Será que conseguimos ter um modelo preditivo para nos preparar para o futuro?
  • Será que o atual banco de dados vai suportar o nosso crescimento? Ou existe uma opção mais escalável?

Ficou confuso(a). Segue abaixo, dicas mais específicas para cada função.

Cientista de dados

  • Que tal uma análise textual dos clientes que deixaram comentários sobre suas compras?
  • Alguns clientes não escreveram um comentário. Mas por que eles estão satisfeitos?
  • Com as informações da data de compra, você poderá prever vendas futuras!
  • Você também poderá focar na logística e encontrar maneiras de otimizar os tempos de entrega.
  • Esses dados possuem coordenadas de geolocalização. Há diferenças no padrão de consumo por regiões?
  • Divirta-se descobrindo as categorias de produtos mais propensas à insatisfação do cliente.
  • Crie recursos deste rico conjunto de dados, feature engineering ou anexe algumas informações públicas externas a ele.
  • E um modelo para precificar os produtos do nosso catálogo? Modelagem matemática para otimizar rotas? Testes de hipóteses para validar algum questionamento?
  • O que acha de escrever um relatório ou slides detalhando as suas descobertas?
  • Fique livre para criar sua própria abordagem, caso considere que as dicas anteriores não sejam pertinentes.

Analista de dados e Business Intelligence

  • Pense em alguns KPIs para monitoramento. Talvez outros para direcionamento dos gestores!
  • Um cruzamento dos dados poderia gerar relatórios interessantes. Afinal, quem são os Top 10 em vendas? Que tipo produtos eles vendem? Qual é o impacto deles para o negócio?
  • Que tal realizar uma análise exploratória dos dados. E então? Algo lhe chama a atenção?
  • Você poderia apresentar esses dados em um dashboard. Isso daria agilidade na tomada de decisão!
  • Temos interesse em suas habilidades com matemática aplicada e estatística descritiva. O que você pode nos mostrar com os dados?
  • O que acha de escrever um relatório ou slides detalhando as suas descobertas?
  • Fique livre para criar sua própria abordagem, caso considere que as dicas anteriores não sejam pertinentes.

Engenheiro(a) de dados

  • Alguns membros do time dizem que a atual modelagem do banco de dados é adequada para o uso dos cientistas de dados e analistas de BI, porém, outros dizem que existem formas de modelar bancos de dados que trarão mais eficiência. Qual é a sua opinião sobre isso?
  • Estamos preocupados com o vertiginoso aumento do volume em nosso banco de dados atual? Você consideraria uma opção mais escalável ou devemos manter a estrutura existente?
  • Nossa ferramenta de visualização de dashboards está lenta e o nosso time detectou que o problema está na infraestrutura de dados. Como você abordaria esta situação do ponto vista de arquitetura de dados?
  • Nosso banco de dados está hospedado na nuvem e nossas ferramentas de análise de dados são "on premisses". Você manteria este arranjo ou faria mudanças visando mais performance?
  • Nossa área operacional necessita de informações em tempo real, porém os diretores da empresa, que acompanham somente informações de KPIs mensais, alegam que isso é desnecessário e acarretaria custos. Qual é o seu posicionamento sobre isso?
  • Nosso time que está focado em Governança de Dados alega que documentar os processos é mais importante do que refatorar os mais de 500 scripts que estão funcionando com lentidão. Como você atuaria neste impasse, se tivesse que priorizar o trabalho?
  • Aqui no olist, somos muito mão na massa! Como Engenheiro(a) de dados, mostre pra gente o que você consegue fazer na prática com esse nosso banco de dados. (Sabemos que é uma amostra, mas imagine que o todo pode ser 10 terabytes de dados)
  • O que acha de escrever um relatório ou slides sobre a sua abordagem na solução de alguns desses problemas?
  • Fique livre para criar sua própria abordagem, caso considere que as dicas anteriores não sejam pertinentes.

O que esperamos do candidato?

Queremos entender sua proficiência técnica, raciocínio analítico e apresentação de resultados.

Você não precisa responder todas as perguntas ou dicas que foram listadas anteriormente, são apenas insights (mantenha o foco naquilo que você mais afinidade). Porém, queremos ter uma clara percepção sobre como você resolve problemas.

Para isso, fique a vontade para adotar softwares, processos e ferramentas que considerar adequados.

Você terá um prazo de até 15 dias e após a finalização do teste, nos encaminhe um relatório de trabalho com até 5 páginas.

Não esqueça de indicar em seu relatório os links/endereços, caso tenha hospedado códigos/arquivos em algum repositório na internet.

Finalizando, não esqueça de nos avisar aqui -> https://bit.ly/2NNVyXk.

work-at-olist-data's People

Contributors

ana-malucelli avatar andresionek91 avatar l-jhon avatar leodabague avatar nosbielcs avatar tatianagaleazzi avatar

Watchers

 avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.