3778 / covid-19 Goto Github PK

View Code? Open in Web Editor NEW

215.0 215.0 59.0 4.42 MB

Ciência de Dados aplicada à pandemia do novo coronavírus.

Home Page: https://covid-simulator.3778.care/

License: MIT License

Makefile 0.13% Shell 0.78% Python 6.54% Dockerfile 0.05% Jupyter Notebook 92.50%

covid-19's People

Contributors

Stargazers

Watchers

covid-19's Issues

Compilar lista de outros repositórios como modelos e dados do COVID-19

Marcador identificando em que dia estamos em relação ao dia zero.

Posso ter compreendido o gráfico errado, mas a princípio não tem nenhuma informação no gráfico representado indicando em que dia estamos em relação ao dia zero.

Isso torna a informação mais clara e acessível ao público que está começando a acompanhar o desenvolvimento da doença agora, e acho mais interessante do que fazer a pessoa pesquisar em fontes externas qual foi o dia zero para então determinar em que dia estamos com relação ao gráfico.

PS:. marquei como label dev na falta de uma label UX/usabilidade.

Carregar dados raw do github em data_params

Dados por município e/ou cidade (algo mais granular que estado).

A ideia é compilar fontes de dados, cuja ingestão seja automatizável, pra colocar no simulador.

Informações necessárias:

numero de infectados
recuperados
mortes

População já temos vindo do IBGE

Modelo com compartimento para assintomáticos

Acho que aproveitando o SEIR dá pra criar um outro compartimento dividindo o I(sintomático) e o I(assintomático) e a partir dos (poucos) estudos/dados de locais onde houve testagem abrangente de assintomáticos tentar inferir o número assintomáticos % de casos pra tentar modelar

By @vitoventurieri

Isso faz sentido? Como podemos equacionar esse compartimento? Como estimar os parametros?

Nova Fonte de Dados

Apareceu um novo site que se propõe a divulgar construir uma espécie de dataset colaborativo. Talvez valesse a pena dar uma olhada para ver se ajuda o modelo (ou pelo menos corrobora com as informações que vocês já tem)
http://covidzero.com.br/

Automatizar geração de CSVs usados na simulação de filas

Atualmente a simulação de filas consome 2 arquivos CSV que foram gerados manualmente, conforme mostrado em #70

Precisamos automatizar a geração desses arquivos para poder incluir novos dados facilmente e documentar o procedimento.

Arquivos:

data/tmp/cnes_leitos.csv
data/tmp/dados_covid.csv

Melhorar a visualização das curvas.

Por hora estamos utilizando o matplotlib, que por mais que seja flexível, é limitado. Seria interessante explorar o bokeh e Altair para termos visualizações dinâmicas.

Implementação em Python do SEIR

Modelagem de níveis de isolamento durante a quarentena

Uma das utilidades do modelo seria a de direcionar políticals públicas (e.g. nível de isolamento durante o período de quarentena). O modelo SEIR atual modela a transmissão do vírus assumindo que ela é homogênea. Na realidade, é preciso um contato físico para haver a transmissão. Como nem todos os membros da população vão ter um contato entre si, uma das estratégias para reduzir o número de casos é a de isolamento das pessoas.

É possível modelar essa dinâmica fazendo pequenas variações no modelo atual. Primeiramente, a população total é dividida em n compartimentos. Em seguida, introduzindo uma variável que modela o número de pessoas que se transportaram do compartimento i para o compartimento j da população durante o período de tempo, as equações que antes, para cada compartimento eram:

Se tornam:

Esse modelo permitiria a modelagem da evolução dos casos de forma mais realista (e.g. se os dados de viagem entre cidades/bairros estivessem disponíveis). O modelo também pode ser simplificado para modelar a evolução dos casos em uma cidade com diferentes níveis de isolamento (diferentes valores de T, assumindo uma taxa constante entre compartimentos).

[Edit: Somatório colocado na última eq.]

Streamlit app para simular modelos

Criar app que rode o modelo SEIR-Bayes

Melhorar estimativa do Período infeccioso médio (1/γ)

Precisamos entender melhor o Período infeccioso médio (1/γ); limites inferiores e superiores assim como uma distribuição típica à priori utilizada na literatura. Por hora temos uma ideia de média apenas (14 dias).

Referências boas:

Período de Incubação

Tunar parâmetros com dados histórico

No momento, não estamos usando os dados históricos para tunar os parâmetros, similar ao que ta aqui: https://kingaa.github.io/short-course/parest/parest.html

No caso do SEIR-Bayes, temos 6 hyperparâmetros: {média, desvio} para {alpha, gamma e R0}.

Encontrar papers e dados que possam ajudar a estimar a % de casos assintomáticos

@vitoventurieri poderias explicar melhor o que seria isso?

imagino que seja pesquisar na literatura e noticias pra entendermos qual o percentual de assintomáticos, pra usarmos em #10

Criar função que roda o SEIR-Bayes para todos os municípios

A ideia é disponibilizar pra quem quiser fazer análises em cima.

Assinatura da função será algo do tipo:

In: {gamma, alpha, R0}x{limite inferior, limite superior} + runs + t_max + SEIR(0)
Out: DataFrame(UF, municipio, t, run, S, E, I, R)

São 12 entrada e 1 dataframe de saída.

Estimar taxa de subreportagem

O Brazil ta testando apenas quem ta hospitalizado, o que diminui o número de infectados reportado e faz com que o pico de infecção seja daqui a ~3 meses (pra SP).

Notebook para forecasts de curto prazo

Poderíamos ter um notebook para fazer previsões de curto prazo (ex: 3, 7 , 14 dias) e não da curva epidemiológica como um todo.

Estimar parâmetros e condições iniciais. Documentar Fontes dos Parametros

Levantamento dos coeficientes (ex: % de casos assintomáticos, tempo de duração da doença, tempo de infecciosidade, etc)
Quantidade de infectados e recuperados (condições iniciais S0, E0, I0 e R0).

Referências para equação

Caros,

Podemos citar a referência usada para a equação definida a partir da linha 34, abaixo?

COVID-19/models/seir_sde.py

Line 34 in 80e99d4

for t in t_space[1:]:

Epidemic Calculator

Oi, Pessoal.
Não sei se já conhecem o modelo usado pelo Gabriel Goh http://gabgoh.github.io/COVID/index.html

Termo de trocar para descrição do cenário Brasileiro

Ola gente, tudo bem ? Sou novo aqui, e também não sou da área sou físico. Bem topei com um post falando desse projeto no Reddit e fui dar uma olhada nesse SEIR model. Fiquei ciente da dificuldade descrever um pais continental como no caso do brasil. Então pensei se é possível separarmos o brasil por regiões, aplicar o método SEIR em cada uma delas e colocar um termo de troca entre essas regiões. Bem temos a explicação do modelo aqui:
https://en.wikipedia.org/wiki/Compartmental_models_in_epidemiology#The_SEIR_model

Então, basicamente temos essa equação:

Regida por esse grupo de equações diferencias:

O que eu pensei foi, em perdemos a continuidade da quantidade de pessoas por região, porem mantendo a quantidade total continua:

E alterando as equações para termos um termo de troca, para as pessoas suscetíveis, na fase encubação do vírus e quando estão curadas, sendo assim:

O termo chi^{S,E,R}_k é a razão de pessoas suscetíveis, na fase de encubação e recuperas que estão transitando entre cada região. Sendo, assim, esse valor respeita:

Agora, podemos aplicar na equação da região micro e:

Ou seja, deixei a equação para pessoas doentes sem nada, porque acredito que a quantidade dessas pessoas transitando é ínfima, geralmente a transição de pessoas infectadas é na fase de encubação. O que acham ? Lembrando, não sei muita coisa do tema, vi por cima, mas uma pessoa pediu pra eu levantar esse debate aqui.

CORONAVÍRUS: Exercícios de projeção de casos para o Rio Grande do Sul

https://portal.correiodopovo.com.br/pdf/covid19.pdf

Gráfico corta margens de erro

Quando valores das margens de erro são negativos, o gráfico as corta. Isso impede que seja visualizado o limite superior e compromete o uso desse recurso do simulador. Deve-se corrigir para, nesses casos, plotar o valor em zero como é feito na função seir_bayes_plot por meio do .clip(I0).

Estimating the asymptomatic proportion of coronavirus disease 2019 (COVID-19) cases on board the Diamond Princess cruise ship, Yokohama, Japan, 2020

Precisamos de uma análise crítica desse artigo encontrado aqui - Estimating the asymptomatic proportion of coronavirus disease 2019 (COVID-19) cases on board the Diamond Princess cruise ship, Yokohama, Japan, 2020 , sobre suas premissas e fontes, para saber se é possível aproveitar alguma das inferências ou dos dados oriundos das fontes/referências do artigo. O objetivo é saber se podemos fazer estimativas de casos assintomaticos usando o método, ou dados das fontes.

Criar setup.py pra pasta covid19 no branch v2

@cchenzi pode fazer a PR direto pra branch v2.

Refatorar data_params

Refatorar data_params.py para evitar repetição de código.

Utilizar outra prior no modelo SEIR-Bayes

O modelo SEIR-Bayes utiliza priors gaussianas nos parâmetros do modelo. Isso claramente pode ser melhorado.

O que fazer?

Pesquisar na literatura quais famílias de priors (e.g. log-normal, gamma, weibull) geralmente são utilizdas;
Implementar no modelo.

É importante entender que a prior define as incertezas que temos nos parâmetros, que foram levantados de acordo com a literatura (ver o README.md).

Discussão sobre o artigo- Substantial undocumented infection facilitates the rapid dissemination of novel coronavirus (SARS-CoV2)

https://science.sciencemag.org/content/early/2020/03/13/science.abb3221

Escrever a seção "Como levamos em conta a variação dos parâmetros?" do README

https://github.com/3778/COVID-19#como-levamos-em-conta-a-varian%C3%A7%C3%A3o-dos-par%C3%A2metros

Seção de "Como contribuir"

Título do gráfico aparece cortado

Ao abrir normalmente o app, o título do gráfico é cortado:

É necessário ajustar a configuração de padding para corrigir isso.

Juntar R0 estimado com uma prior

Em #36 temos um modelo pra estimar R0 a partir do dado histórico. Porém, seria interessante juntar isso com os dados globais, pra ter uma forma de variar a estimativa utilizando os dados globais.

Visto que o R0 estimado na verdade é uma lognormal, pensei em usar isso como likelihood junto com uma conjugate prior dos dados globais (que podem ser setadas via simulador) e calcular uma posterior que será utilizada na simulação de fato.

Organizar e disponibilizar dados relacionados ao COVID-19 no Brasil

Podemos usar este repo como uma fonte de dados relacionados ao COVID-19 no Brasil no espírito que a JHU está fazendo para o mundo.

Botão de exportação dos dados da simulação

Atualmente oferecemos somente a visualização, mas seria muito útil poder exportar os dados que estão plotados em formato CSV para uso em outros locais como continuação da análise.

Exportar:

Dados do gráfico
Parâmetros da simulação

Revisar modelo SEIR-Bayes

Seria interessante, alguém com conhecimento de modelagem e python, revisar se a implementação do SEIR-Bayes ta correta.

Como estimar a quantidade de pessoas expostas inicialmente (E(0))?

No momento, estamos assumindo que a quantidade de expostas e infectadas sao a mesma (E(0) = I(0)).

Nao tenho ideia se isso ta certo, alguem saberia ajudar? Tem alguma estimativa grosseira pra quantidade de pessoas expostas em ( talvez em funcao de infectadas)?

Branch permissions

Caros,

Estive tentando criar um dev e feature branch no repositório para organizarmos a colaboração usando o git flow como padrão. Contudo, não tenho permissão para "pushar" estes branches. Será que os admins poderiam:

Autorizar a criação e push de feature branches?
Restringir o master como Pull / Merge request only?
Criar um dev. branch?

Abraços (sem o risco de corona)

App em produção dá "rerun" automático indevido a cada ~10s

Ao testar o app em produção (https://covid-simulator.3778.care/), notei que a cada ~10 s é disparado um evento que executa novamente o Streamlit (como se fosse "rerun") sem ter sido solicitado. A resposta é como se tivesse sido feita alguma alteração nos parâmetros, mas sem ter sido clicado em nada. Aparece "Connecting..." e depois "Running..." no canto direito superior.

Isso é um problema pq os parâmetros são resetados e o fluxo de interação do usuário é interrompido, sem que se consiga finalizar um configuração e analisar os resultados minimamente.

Isso não acontece rodando localmente com make launch, então imagino que seja algo relacionado com a forma que fizemos o deploy. Algum insight do que poderia ser @thiagocaiubi?

Cheguei a gravar um screencast pra ilustrar, mas por limitações técnicas (aka noob) não consegui subir aqui como GIF. Tô usando Firefox 74.0 (64-bit) no mac osx 10.15.3, mas acontece no Chrome 80.0.3987.149 também.

Papers e dados com estimativas sobre a necessidade de internação (leito normal ou UTI) em cada faixa etária

Em segundo momento, tendo dados de boa qualidade, discutimos sobre a modelagem que deverá tomar em conta:

Pirâmides etárias (fazer adaptável a realidade de cada região se possível)
Necessidade de internação (leito de enfermaria ou UTI) em cada faixa etária

Criar ambiente docker para deploy do app streamlit.

Depends on #11

3778 / covid-19 Goto Github PK

covid-19's People

Contributors

Stargazers

Watchers

Forkers

covid-19's Issues

Recommend Projects

Recommend Topics

Recommend Org