Giter Club home page Giter Club logo

bellabeat's Introduction

ESTUDO DE CASO:

Análise de Dados sobre Comportamento de Uso de Dispositivos Inteligentes da Empresa Bellabeat: Tendências e Padrões Emergentes

Autor: Welington Fonseca

Apresentação em forma de Storytelling no Power BI

Índice

1. Introdução

2. Tarefa de Negócios

3. Dados

4. Processamento e Exploração

5. Análise e Visualização

6. Conclusão e recomendações

Introdução

Este estudo de caso foi elaborado pela Google em parceria com a Coursera, como projeto final para obtenção do Certificado Profissional Google Data Analytics. O cenário consiste na análise dos dados fornecida pela empresa Bellabeat.

Fundada em 2013, a Bellabeat é uma empresa de alta tecnologia que desenvolve dispositivos de rastreamento de bem-estar para mulheres. Em 2016, a Bellabeat lançou vários produtos e expandiu seus negócios globalmente. Os produtos passaram a ser disponibilizados em seu próprio canal de e-commerce, bem como em varejistas online. A Bellabeat se concentra extensivamente no marketing digital, incluindo a Pesquisa do Google, páginas ativas no Facebook e Instagram, além de engajar os consumidores de forma consistente no Twitter. Além disso, a Bellabeat exibe anúncios em vídeo no Youtube e anúncios gráficos na rede de display do Google para apoiar campanhas em datas importantes de marketing.

Bellabeat possui 5 produtos:

Aplicativo Bellabeat: o aplicativo Bellabeat fornece aos usuários dados de saúde relacionados à sua atividade, sono, estresse, ciclo menstrual e hábitos de atenção plena. Ele ajuda os usuários a entender melhor seus hábitos atuais e a tomar decisões saudáveis.

Leaf: É uma smartwatch que funciona basicamente como um rastreador de bem-estar que pode ser usado como pulseira, colar ou clipe. Ele se conecta ao aplicativo Bellabeat para rastrear atividade, sono e estresse.

Time: este relógio de bem-estar combina a aparência atemporal de um relógio clássico com tecnologia inteligente para rastrear a atividade, o sono e o estresse do usuário. Ele se conecta ao aplicativo Bellabeat para fornecer informações sobre seu bem-estar diário.

Spring: Esta é uma garrafa de água que rastreia a ingestão diária de água usando tecnologia inteligente para garantir que você esteja adequadamente hidratado ao longo do dia. Ele se conecta ao aplicativo Bellabeat para monitorar seus níveis de hidratação.

Planos da Bellabeat: Bellabeat também oferece um programa de associação baseado em assinatura para usuários. Ele oferece aos usuários acesso 24 horas por dia, 7 dias por semana, a orientação totalmente personalizada sobre nutrição, atividade, sono, saúde e beleza e atenção plena com base em seu estilo de vida e objetivos.

Urška Sršen, Cofundadora e CEO da Bellabeat, sabe que uma análise dos dados de consumo disponíveis da Bellabeat revelaria mais oportunidades de crescimento. Ela pediu à equipe de análise de marketing para se concentrar em um produto da Bellabeat e analisar os dados de uso de dispositivos inteligentes para obter informações sobre como as pessoas já estão usando seus dispositivos inteligentes. Assim, por meio dessas informações, ela gostaria de conferir excelentes recomendações sobre como essas tendências podem nortear a estratégia de marketing da Bellabeat.

Tarefa de negócios

  • Quais são algumas das tendências no uso de dispositivos inteligentes?
  • Como essas tendências podem se aplicar aos clientes da Bellabeat?
  • Como essas tendências podem ajudar a influenciar a estratégia de marketing da Bellabeat?

Objetivo: Limpar, analisar e visualizar os dados para identificar oportunidades potenciais de crescimento e recomendações para a melhoria da estratégia de marketing da Bellabeat com base nas tendências de uso de dispositivos inteligentes.

Dados

  • Fonte de dados: A fonte de dados usada o estudo de caso é o FitBit Fitness Tracker Data. Este conjunto de dados está armazenado no Kaggle e foi disponibilizado através do Mobius;
  • Acessibilidade e privacidade de dados: O proprietário dedicou o trabalho ao domínio público renunciando a todos os seus direitos sobre o trabalho em todo o mundo sob a lei de direitos autorais, incluindo todos os direitos relacionados e conexos, na medida permitida por lei. É possível copiar, modificar, distribuir e executar o trabalho, mesmo para fins comerciais, tudo sem pedir permissão.
  • Tamanho e formato: 18 arquivos no formato CSV (322 MB, descompactado);
  • Intervalo dos dados da análise: Março de 2016 à Maio de 2016;
  • Mais informações:
    • O conjunto de dados possui registros 30 usuários elegíveis do Fitbit que consentiram com o envio de dados pessoais do smartwatch, incluindo atividade física por minuto, frequência cardíaca e monitoramento do sono;
    • Cada usuário tem ID exclusivo;
    • Cada arquivo CSV apresenta diferentes dados quantitativos;
    • Os dados são registrados por dia e hora.
  • Pontos negativos da base de dados:
    • De início, e baseada em informações preeliminares, a base destacava 30 usuários. Mas com a analise, foram identificados 33;
    • É uma base de dados pequena;
    • Alguns usuários não registraram suas atividades em determinados momentos;
    • Dos 33 usuários, 24 registraram informações de sono e 8 de peso.

Processamento e Exploração

Carregando Pacotes:

library(tidyverse)
library(lubridate)
library(dplyr)
library(ggplot2)
library(tidyr)

Com os devidos pacotes carregados, a exploração pode seguir.

Importando datasets

atividade <- read.csv("C:/Users/welin/Desktop/GOOGLE/Estudos de caso/2/bellabeat/dailyActivity_merged.csv")
calorias <- read.csv("C:/Users/welin/Desktop/GOOGLE/Estudos de caso/2/bellabeat/hourlyCalories_merged.csv")
intensidade <- read.csv("C:/Users/welin/Desktop/GOOGLE/Estudos de caso/2/bellabeat/hourlyIntensities_merged.csv")
sono <- read.csv("C:/Users/welin/Desktop/GOOGLE/Estudos de caso/2/bellabeat/sleepDay_merged.csv")
peso <- read.csv("C:/Users/welin/Desktop/GOOGLE/Estudos de caso/2/bellabeat/weightLogInfo_merged.csv")

Antes de começar a exploração, foram identificadas colunas que exibem data e hora fora de padrão ("ActivityHour", "ActivityDate" e "SleepDay").

Ajustando a formatação de data e hora:

#Intensidade:
intensidade$ActivityHour=as.POSIXct(intensidade$ActivityHour, format="%m/%d/%Y %I:%M:%S %p", tz=Sys.timezone())
intensidade$time <- format(intensidade$ActivityHour, format = "%H:%M:%S")
intensidade$date <- format(intensidade$ActivityHour, format = "%m/%d/%y")
#Calorias:
calorias$ActivityHour=as.POSIXct(calorias$ActivityHour, format="%m/%d/%Y %I:%M:%S %p", tz=Sys.timezone())
calorias$time <- format(calorias$ActivityHour, format = "%H:%M:%S")
calorias$date <- format(calorias$ActivityHour, format = "%m/%d/%y")
# atividade:
atividade$ActivityDate=as.POSIXct(atividade$ActivityDate, format="%m/%d/%Y", tz=Sys.timezone())
atividade$date <- format(atividade$ActivityDate, format = "%m/%d/%y")
#Sono:
sono$SleepDay=as.POSIXct(sono$SleepDay, format="%m/%d/%Y %I:%M:%S %p", tz=Sys.timezone())
sono$date <- format(sono$SleepDay, format = "%m/%d/%y")

Aparentemente temos dados prontos para exploração.

Explorando e resumindo dados:

n_distinct(atividade$Id)
n_distinct(calorias$Id)
n_distinct(intensidade$Id)
n_distinct(sono$Id)
n_distinct(peso$Id)
[1] 33
[1] 33
[1] 33
[1] 24
[1] 8

Percepções

  • Temos 33 usuários nos datasets de atividade, calorias e intensidade.
  • 24 usuários no dataset de sono e apenas 8 de peso.
  • Temos um conjunto de dados minúculo e diante dessas informações, os dados de peso não são significativos para fazer recomendações e conclusões.

Estatísticas resumidas dos conjuntos de dados:

# Explorando os minutos sedentários:
  atividade %>%  
  select(SedentaryMinutes) %>%
  summary()

# Explorando minutos ativos por categoria:
  atividade %>%
  select(VeryActiveMinutes, FairlyActiveMinutes, LightlyActiveMinutes) %>%
  summary()

# Explorando os dataset's de calorias, sono e peso
# calorias
calorias %>%
  select(Calories) %>%
  summary()

# sono
sono %>%
  select(TotalSleepRecords, TotalMinutesAsleep, TotalTimeInBed) %>%
  summary()

# peso
peso %>%
  select(WeightKg, BMI) %>%
  summary()
SedentaryMinutes
 Min.   :   0.0  
 1st Qu.: 729.8  
 Median :1057.5  
 Mean   : 991.2  
 3rd Qu.:1229.5  
 Max.   :1440.0
 VeryActiveMinutes FairlyActiveMinutes LightlyActiveMinutes
 Min.   :  0.00    Min.   :  0.00      Min.   :  0.0       
 1st Qu.:  0.00    1st Qu.:  0.00      1st Qu.:127.0       
 Median :  4.00    Median :  6.00      Median :199.0       
 Mean   : 21.16    Mean   : 13.56      Mean   :192.8       
 3rd Qu.: 32.00    3rd Qu.: 19.00      3rd Qu.:264.0       
 Max.   :210.00    Max.   :143.00      Max.   :518.0       
    Calories     
 Min.   : 42.00  
 1st Qu.: 63.00  
 Median : 83.00  
 Mean   : 97.39  
 3rd Qu.:108.00  
 Max.   :948.00  
 TotalSleepRecords TotalMinutesAsleep TotalTimeInBed 
 Min.   :1.000     Min.   : 58.0      Min.   : 61.0  
 1st Qu.:1.000     1st Qu.:361.0      1st Qu.:403.0  
 Median :1.000     Median :433.0      Median :463.0  
 Mean   :1.119     Mean   :419.5      Mean   :458.6  
 3rd Qu.:1.000     3rd Qu.:490.0      3rd Qu.:526.0  
 Max.   :3.000     Max.   :796.0      Max.   :961.0  
    WeightKg           BMI       
 Min.   : 52.60   Min.   :21.45  
 1st Qu.: 61.40   1st Qu.:23.96  
 Median : 62.50   Median :24.39  
 Mean   : 72.04   Mean   :25.19  
 3rd Qu.: 85.05   3rd Qu.:25.56  
 Max.   :133.50   Max.   :47.54  

Percepções

  • Temos que, segundo a média das 3 categorias de atividades, a "lightly active" (levemente ativos) são a maioria.

  • O tempo médio sedentário é de 991 minutos ou 16 horas. Segundo o Australian Physical Activity and Sedentary Behaviour Guidelines, ser sedentário não é o mesmo que não praticar atividade física suficiente. Mesmo se você estiver fazendo bastante atividade física, ficar sentado por mais de 7 a 10 horas por dia pode ser ruim para sua saúde. Os usários da pesquisa ultrapassam bastante esse número.

  • A média total de passos por dia dos usuários pesquisados é de 7.638, um pouco menos para ter benefícios para a saúde, de acordo com a pesquisa do Centers for Disease Control and Prevention (CDC). Eles descobriram que dar 8.000 passos por dia estava associado a um risco 51% menor de mortalidade por todas as causas (ou morte por todas as causas). Dar 12.000 passos por dia foi associado a um risco 65% menor em comparação com dar 4.000 passos.

  • Em média, os participants dormem 419.5 minutos ou praticamente 7 horas por noite. Segundo o American Academy of Sleep Medicine (AASM) e Sleep Research Society (SRS) é recomendado que os adultos tenham sete ou mais horas de sono por noite para evitar os riscos à saúde de sono inadequado crônico.

Mesclando dados

dados_mesclados <- merge(sono, atividade, by=c('Id', 'date'))

Considerações importantes aqui:

  • Poderia ser usada a função "rbind()" para combinar as tabelas, mas a função "merge()" optimiza isso, pois ela combina e não repete colunas. Bem semelhante a um JOIN em SQL;
  • A função "merge()" trouxe as colunas "date" e "id" sem que ocorram repetições;
  • Poderiamos usar todas as colunas do estudo de caso, mas por serem mais completas, a decisão de mesclar os datasets "sono" e "atividade" é mais assertada. Além de reduzir o tamanho e ganhar desempenho.

Conversões

Criando novas colunas que representam valores originais em minutos para horas:

dados_mesclados$TotalHoursAsleep <- dados_mesclados$TotalMinutesAsleep / 60
dados_mesclados$TotalHoursInBed <- dados_mesclados$TotalTimeInBed / 60
dados_mesclados$SedentaryHours <- dados_mesclados$SedentaryMinutes / 60

Criando a coluna latência do Sono:

dados_mesclados$SleepLatency <- dados_mesclados$TotalTimeInBed - dados_mesclados$TotalMinutesAsleep

summary(dados_mesclados$SleepLatency)

Percepções

  • Latência de sono é o tempo que o indviduo leva para adormercer de fato após deitar-se.
  • Embora a amostra seja pequena, temos que os números dos participantes do estudo estão acima do recomendado pela SleepFoundation.org. Enquanto uma latência do sono inferior a oito minutos pode indicar um distúrbio do sono como a narcolepsia, as pessoas que demoram mais de 20 minutos para adormecer podem ter insônia. Logo, uma latência entre 8 e 20 minutos é o ideal. A média dos pesquisados é de 39 minutos.

Agrupamento de registros

#O agrupamento de registros foi feito por meio de médias cada registro nas categorias de "Sedentary", "Lightly Active", "Fairly Active", "Very Active". 
dados_tipo_usuario <- dados_mesclados %>%
  summarise(
    user_type = factor(case_when(
      SedentaryMinutes > mean(SedentaryMinutes) & LightlyActiveMinutes < mean(LightlyActiveMinutes) & FairlyActiveMinutes < mean(FairlyActiveMinutes) & VeryActiveMinutes < mean(VeryActiveMinutes) ~ "Sedentary",
      SedentaryMinutes < mean(SedentaryMinutes) & LightlyActiveMinutes > mean(LightlyActiveMinutes) & FairlyActiveMinutes < mean(FairlyActiveMinutes) & VeryActiveMinutes < mean(VeryActiveMinutes) ~ "Lightly Active",
      SedentaryMinutes < mean(SedentaryMinutes) & LightlyActiveMinutes < mean(LightlyActiveMinutes) & FairlyActiveMinutes > mean(FairlyActiveMinutes) & VeryActiveMinutes < mean(VeryActiveMinutes) ~ "Fairly Active",
      SedentaryMinutes < mean(SedentaryMinutes) & LightlyActiveMinutes < mean(LightlyActiveMinutes) & FairlyActiveMinutes < mean(FairlyActiveMinutes) & VeryActiveMinutes > mean(VeryActiveMinutes) ~ "Very Active",
    ),levels=c("Sedentary", "Lightly Active", "Fairly Active", "Very Active")), Calories, .group=Id) %>%
  drop_na()

Considerações importantes aqui:

  • Todos os registros foram divididos em 4 grupos: Sedentário, Levemente Ativo, Consideralvemente ativo e Muito ativo;
  • A classificação se dá por meio de médias e comparações;
  • Esse agrupamento foi feito para ser exibido graficamente mais a frente.

Criando a coluna dia da semana

dados_mesclados$dia_semana <- weekdays(as.Date(dados_mesclados$SleepDay))

Análise e Visualização

Distribuição dos registros por tipo de usuário

dados_tipo_usuario %>%
  group_by(user_type) %>%
  summarise(total = n()) %>%
  mutate(totals = sum(total)) %>%
  group_by(user_type) %>%
  summarise(total_percent = total / totals) %>%
  ggplot(aes(user_type,y=total_percent, fill=user_type)) +
  geom_col()+
  scale_y_continuous(labels = scales::percent) +
  theme(legend.position="none") +
  labs(title="User type distridution", x=NULL) +
  theme(legend.position="none", text = element_text(size = 20),plot.title = element_text(hjust = 0.5))

Percepções

  • Esse agrupamento não tem como intenção definir o usuário como pertencente a determinada categoria. Mas apenas definir o registro diário. Por exemplo, um determinado usuário pode ter hoje um registro de atividade diária como sedentário e amanhã como muito ativo.

  • Segundo o gráfico, temos que os usuários se comportam na maior parte dos registros como sendentários e levemente ativos. Juntos somam mais de 80%.

  • A Bellabeat pode usar essa informação para mostrar ao usuário qual a categoria que seu dia foi alocada e dar dicas de como manter ou melhorar a situação. Exemplo: usuário teve dia classificado como sedentário, a Bellabeat o notifica.

Passos e tempo sedentário por dia da semana

Passos por dia da semana

media_totalsteps <- aggregate(TotalSteps ~ dia_semana, data = dados_mesclados, FUN = mean)

grafico_media_totalsteps <- ggplot(media_totalsteps, aes(x = dia_semana, y = TotalSteps)) +
  geom_bar(stat = "identity", fill = "blue") +
  labs(title = "Média de Total de Passos x Dia da Semana",
       x = "Dia da Semana",
       y = "Média de Total de Passos") +
  theme_minimal()

print(grafico_media_totalsteps)

Minutos sedentárias por dia da semana

media_sedentary <- aggregate(SedentaryMinutes ~ dia_semana, data = dados_mesclados, FUN = mean)

grafico_media_sedentary <- ggplot(media_sedentary, aes(x = dia_semana, y = SedentaryMinutes)) +
  geom_bar(stat = "identity", fill = "red") +
  labs(title = "Média de Minutos Sedentários x Dia da Semana",
       x = "Dia da Semana",
       y = "Média de Minutos Sedentários") +
  theme_minimal()

print(grafico_media_sedentary)

Percepções

  • Os gráficos de barras mostram que o sábado é o dia ótimo. Pois em média, é o que mais os usuários dão passos e o que menos tem minutos sendentários.
  • Informação útil para o aplicativo notificar de uma maneira mais assertiva o usuário a fazer exercicios em dias em que historicamente ele não tem bons números de atividades fisicas e sedentarismo.

Horário Popular das Atividades Físicas

intensidade_horario_medio <- intensidade %>%
  group_by(time) %>%
  drop_na() %>%
  summarise(mean_total_int = mean(TotalIntensity))

ggplot(data=intensidade_horario_medio, aes(x=time, y=mean_total_int)) + geom_histogram(stat = "identity", fill='darkblue') +
  theme(axis.text.x = element_text(angle = 90)) +
  labs(title="Horário Preferido")

Percepções

  • Ao criar um novo dataset filtrando apenas a quantidade média de exercicios por horário, é perceptivel que, em média, a prática de execício das pessoas tem uma crescente das 5 às 19 horas. Após isso, vai decaindo até entrar na madrugada. Acredito que esse dado pode ser util para que o aplicativo e/ou o smartwash indicar uma probabilidade de quais horários, por exemplo, a academia tem chances de estar lotada ou não. Isso pode ajudar tanto uma pessoa que quer socializar ou não. Ou até otimizar o tempo gasto na academia. Mas obviamente isso pode ser aprimorado com outras variáveis, como dados de localização, por exemplo.

  • O aplicativo com essa informação e cruzando com outros dados pessoais do cotidiano, pode eleger o horário chave para notificar o usuário para ir fazer a atividade física.

Relação tempo na cama X tempo de sono efetivo

ggplot(data=dados_mesclados, aes(x=TotalMinutesAsleep, y=TotalTimeInBed)) + 
  geom_point() + geom_smooth() + 
  labs(title="Minutos na Cama X Minutos Dormindo", x="Horas Dormindo", y="Horas na Cama")

Percepções

  • Essa relação implica dizer que quanto mais tempo os usuários passaram na cama, mais horas de sono tiveram. O que se conclui que os individuos do estudo tem grandes chances de melhorar a quantidade sono ao irem deitar mais cedo. Não há nada de novo aqui, mas existe uma janela de oportunidade para o aplicativo e/ou o smartwash entrarem em cena e alertar o usuário para que se prepare para dormir em #um horário otimizado de acordo com sua rotina.

Calorias Queimadas por Total de Passos

ggplot(data=dados_mesclados, aes(x = TotalSteps , y = Calories, color = SedentaryMinutes)) +
  geom_point() + 
  stat_smooth(method = lm) +
  scale_color_gradient(low = "blue", high = "red") +
  labs(title = "Calorias Queimadas X Passos",
       x = "Total de Passos",
       y = "Calorias Queimadas")

Percepções

  • Quantos mais passos uma pessoa dá, mais ativa e mais calorias ela queimará. Isso é uma uma certeza que é observada no gráfico. Mas indo além, e relacionando com a variavel "Sedentary Minutes", é evidenciado alguns usuários claramente sedentários queimando mais calorias do que os mais ativos. Isso pode ser usado a título de incentivo pela Bellabeat aos seus usuários mais sedentários.

Relação do sedentarismo com a qualidade do sono e latência

ggplot(data=dados_mesclados, aes(x=TotalMinutesAsleep, y=SedentaryMinutes)) + 
  geom_point(color='darkblue') + geom_smooth() +
  labs(title="Minutos Dormindo X Minutos Sedentários")

ggplot(data=dados_mesclados, aes(x=SleepLatency, y=SedentaryMinutes)) + 
  geom_point(color='darkblue') + geom_smooth() +
  labs(title="Minutos Sedentário X Latência de sono (minutos)")
correlacao <- cor(dados_mesclados$SedentaryMinutes, dados_mesclados$TotalMinutesAsleep)
print(correlacao)

correlacao2 <- cor(dados_mesclados$SedentaryMinutes, dados_mesclados$SleepLatency)
print(correlacao)

Percepções

  • O primeiro gráfico mostra a relação negativa do sedentarismo com a qualidade do sono. Ao usar a função cor(), foi encontrada uma correlação negativa moderada de -0,599394;
  • Já no segundo gráfico, era esperada uma relação positiva do sedentarismo e latência do sono. No sentido de quanto mais sendentário é o indivíduo, mais tempo é gasto para adormecer. O que na verdade não é evidenciado nessa amostra. Fato também observado na função cor() onde foi notada uma correlação negativa fraca de -0,1654;
  • Importante: É necessário apoiar esses insights com mais dados e variáveis, pois correlação não significa causa.

Relacionando as intensidades de atividade física como sono

ggplot(data=dados_mesclados, aes(x=TotalMinutesAsleep, y=LightlyActiveMinutes)) + 
  geom_point(color='darkblue') + geom_smooth() +
  labs(title="Levemente Ativo (minutos) X Tempo de sono (minutos)")

ggplot(data=dados_mesclados, aes(x=TotalMinutesAsleep, y=FairlyActiveMinutes)) + 
  geom_point(color='darkblue') + geom_smooth() +
  labs(title="Consideravelmente Ativo (minutos) X Tempo de sono (minutos)")

ggplot(data=dados_mesclados, aes(x=TotalMinutesAsleep, y=VeryActiveMinutes)) + 
  geom_point(color='darkblue') + geom_smooth() +
  labs(title="Muito Ativo (minutos) X Tempo de sono (minutos)")
correlacao3 <- cor(dados_mesclados$LightlyActiveMinutes, dados_mesclados$TotalMinutesAsleep)
print(correlacao3)

correlacao4 <- cor(dados_mesclados$FairlyActiveMinutes, dados_mesclados$TotalMinutesAsleep)
print(correlacao4)

correlacao5 <- cor(dados_mesclados$VeryActiveMinutes, dados_mesclados$TotalMinutesAsleep)
print(correlacao5)

Percepções

  • Ao examinar essas variaveis, esperava-se uma correlação de quanto mais intensa fosse a atividade fisica, mais minutos de sono. Mas isso não foi claramente constatado.
  • Ao utilizar a função cor() entre as atividades de intensidade: leve, moderada e muito ativas apresentam, respectivamente, correlações: positiva, negativa e negativa. A semelhança entre todas é que estas correlações são bem fracas e inconclusivas.

Relacionando as intensidades de atividade física com a latência

ggplot(data=dados_mesclados, aes(x=SleepLatency, y=LightlyActiveMinutes)) + 
  geom_point(color='darkblue') + geom_smooth() +
  labs(title="Levemente Ativo (minutos) X Latência do sono (minutos)")

ggplot(data=dados_mesclados, aes(x=SleepLatency, y=FairlyActiveMinutes)) + 
  geom_point(color='darkblue') + geom_smooth() +
  labs(title="Consideravelmente Ativo (minutos) X Latência do sono (minutos)")

ggplot(data=dados_mesclados, aes(x=SleepLatency, y=VeryActiveMinutes)) + 
  geom_point(color='darkblue') + geom_smooth() +
  labs(title="Muito Ativo (minutos) X Latência do sono (minutos)")
correlacao6 <- cor(dados_mesclados$LightlyActiveMinutes, dados_mesclados$TotalMinutesAsleep)
print(correlacao6)

correlacao7 <- cor(dados_mesclados$FairlyActiveMinutes, dados_mesclados$TotalMinutesAsleep)
print(correlacao7)

correlacao8 <- cor(dados_mesclados$VeryActiveMinutes, dados_mesclados$TotalMinutesAsleep)
print(correlacao8)

Percepções

  • Era esperada uma correlação mais forte de que quanto mais intensa for a atividade fisica, menos tempo um indivíduo gasta para adormecer. Porém, de acordo com os dados disponíveis, essa correlação não foi encontrada.
  • Ao utilizar a função cor() entre as atividades de intensidade: leve, moderada e muito ativas apresentam, respectivamente, correlações: negativa, positiva e negativa. A semelhança entre todas é que estas correlações são bem fracas e inconclusivas.

Conclusão e recomendações

Conclusões da análise:

  • Na análise dos dados, os usuários se comportaram na maior parte dos registros como sedentários e levemente ativos. Com uma pequena vantagem dos sedentários. Juntos somam mais de 80%;
  • O tempo médio diário que os usuários passaram em estado de sedentarismo é de 991 minutos ou 16 horas;
  • Em média, os participantes dormiram 419.5 minutos ou praticamente 7 horas por noite;
  • A média de tempo entre deitar na cama e adormecer (latência do sono) que os pesquisados gastaram foi de 39 minutos;
  • Dentre os dados da pesquisa, em média, o dia ótimo quando levado em consideração o maior número de passos e as menor quantidade de minutos sedentários, foi o sábado. A sexta foi o dia mais sedentário de todos.
  • A prática de exercícios físicos dos usuários tiveram trajetória ascendente entre às 5 e 19 horas. Após isso, decaiu até entrar na madrugada. O pico aconteceu às 18 horas. Às 3 da madrugada é o horário de menor atividade;
  • Foi evidenciada uma correlação negativa entre o tempo que os usuários passaram sedentários e o tempo de sono. Ou seja, quanto mais sedentário, menos minutos de sono tiveram;
  • Não foi evidenciada uma correlação significativa entre a latência do sono e o tempo que os usuários passam sedentários;
  • Não foi identificada correlação entre o tipo de intensidade de exercícios e a quantidade minutos de sono. Quando relacionada com a latência, também não houve algo satisfatório.

Recomendações para o aplicativo/smartwatch

  • A Bellabeat pode usar a informação diária do usuário para mostrar qual a categoria que o dia foi alocada e dar dicas de como manter ou melhorar a situação.
  • Podem ser criados alertas do aplicativo e/ou smartwatch para o usuário se preparar para dormir em um horário otimizado de acordo com informações de sua rotina;
  • De acordo com informações do usuário, o aplicativo pode eleger o horário chave para notificar o usuário para ir fazer a atividade física;
  • Notificar o usuário quando ele passar muito tempo sedentário. Para assim ele se movimentar de alguma forma;
  • Incentivar de uma maneira mais assertiva o usuário a fazer exercícios em dias em que historicamente ele não tem bons números de atividades físicas e sedentarismo.
  • De acordo com as opções de estilo de vida e desejos do usuário e cruzando com informações de peso e IMC, o aplicativo pode ajudar no controle do consumo de calorias sugerindo opções de alimentos de ganho de massa ou de perda de gordura, por exemplo.
  • Possibilitar aos usuários comparar seu desempenho com usuários de perfil similar.

Recomendações de marketing para expansão global:

  • Obter mais variáveis e uma amostra de dados maior para uma análise mais precisa;
  • No estudo foi evidenciado vários casos de usuários sedentários com um gasto calórico maior do que usuários que praticam atividades físicas. O aplicativo poderia utilizar informações como essa a título de incentivo.
  • Campanha educativa de estilo saudável para incentivar os usuários a fazerem exercícios ativos curtos durante a semana, mais longos nos finais de semana. Especificamente onde historicamente a incidência é baixa;
  • A campanha educacional do item anterior pode ser combinada com um sistema de incentivo de premiação de pontos. Os usuários que completarem o exercício da semana inteira receberão pontos Bellabeat em produtos/assinaturas;
  • Fazer parcerias com eventos esportivos, e usar a tecnologia Bellabeat para monitorar atletas durante as competições.
  • Patrocinar atletas para que eles usem a tecnologia e exponham a qualidade.

bellabeat's People

Stargazers

 avatar

Watchers

 avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.