Giter Club home page Giter Club logo

rki_covid19_data's Introduction

Hi there, I’m Michael 👋

I’m Michael Böhme, theoretical chemist 👨🏻‍🔬 and computer enthusiast 👨🏻‍💻 from Jena 💚, Germany. I’m currently working part-time at the Friedrich Schiller University in Jena doing scientific research in computational magnetochemistry. 🧲 You can have a look on my personal website, if you want to know more about my scientific work. 🧪

Besides, I’ve loved to code since I was 10 years old. 👦🏻 I learned to program on an old Commodore C64 👾 with the help of the great C64 User's Guide. 📖 Nowadays, I am mostly working with C++ and Python, sometimes also MatLab, BASH scripts or gnuplot. 📈 I’m currently learning a lot of 3D graphics programming in Vulkan. 🌋 In my spare time 🌞, I’m working on a yet secret project of mine. 😎 Stay tuned! 🖖

Twitter: theochemiker GitHub micb25 GitHub micb25

rki_covid19_data's People

Contributors

fnogatz avatar micb25 avatar

Stargazers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

Watchers

 avatar  avatar

Forkers

lsch0lz dieter754

rki_covid19_data's Issues

Datei vom 30.07.2021 führt als Datenstand fälschlicherweise 29.07.2021

head -n3 RKI_COVID19_2021-07-{29,30,31}.csv
==> RKI_COVID19_2021-07-29.csv <==
FID,IdBundesland,Bundesland,Landkreis,Altersgruppe,Geschlecht,AnzahlFall,AnzahlTodesfall,Meldedatum,IdLandkreis,Datenstand,NeuerFall,NeuerTodesfall,Refdatum,NeuGenesen,AnzahlGenesen,IstErkrankungsbeginn,Altersgruppe2
1,1,Schleswig-Holstein,SK Flensburg,A00-A04,M,1,0,2020/09/30 00:00:00,01001,"29.07.2021, 00:00 Uhr",0,-9,2020/09/30 00:00:00,0,1,0,Nicht übermittelt
2,1,Schleswig-Holstein,SK Flensburg,A00-A04,M,1,0,2020/10/29 00:00:00,01001,"29.07.2021, 00:00 Uhr",0,-9,2020/10/29 00:00:00,0,1,0,Nicht übermittelt

==> RKI_COVID19_2021-07-30.csv <==
FID,IdBundesland,Bundesland,Landkreis,Altersgruppe,Geschlecht,AnzahlFall,AnzahlTodesfall,Meldedatum,IdLandkreis,Datenstand,NeuerFall,NeuerTodesfall,Refdatum,NeuGenesen,AnzahlGenesen,IstErkrankungsbeginn,Altersgruppe2
1,1,Schleswig-Holstein,SK Flensburg,A35-A59,M,1,0,2020/11/26 00:00:00,01001,"29.07.2021, 00:00 Uhr",0,-9,2020/11/24 00:00:00,0,1,1,Nicht übermittelt
2,1,Schleswig-Holstein,SK Flensburg,A35-A59,M,1,0,2020/12/04 00:00:00,01001,"29.07.2021, 00:00 Uhr",0,-9,2020/12/01 00:00:00,0,1,1,Nicht übermittelt

==> RKI_COVID19_2021-07-31.csv <==
FID,IdBundesland,Bundesland,Landkreis,Altersgruppe,Geschlecht,AnzahlFall,AnzahlTodesfall,Meldedatum,IdLandkreis,Datenstand,NeuerFall,NeuerTodesfall,Refdatum,NeuGenesen,AnzahlGenesen,IstErkrankungsbeginn,Altersgruppe2
1,1,Schleswig-Holstein,SK Flensburg,A00-A04,M,1,0,2020/09/30 00:00:00,01001,"31.07.2021, 00:00 Uhr",0,-9,2020/09/30 00:00:00,0,1,0,Nicht übermittelt
2,1,Schleswig-Holstein,SK Flensburg,A00-A04,M,1,0,2020/10/29 00:00:00,01001,"31.07.2021, 00:00 Uhr",0,-9,2020/10/29 00:00:00,0,1,0,Nicht übermittelt

Datei vom 26.02.2021 fehlerhaft (doppelte Daten)

Erst mal vielen Dank für die Zusammenstellung der RKI-Daten!

Gestern hat das RKI leider zunächst eine fehlerhafte Datei veröffentlich, die später korrigiert wurde. Anscheinend waren die Daten doppelt, erkennbar auch an der Dateigröße.

Im Repository ist leider noch die falsche Datei. Die korrekte Version kann ich ggf. zur Verfügung stellen.

Falscher Datenstand in RKI-Datei vom 14.03.2021

Gestern (14.03.2021) standen die RKI-Daten leider erst sehr spät zur Verfügung. Die Datei im Repository enthält daher noch die Daten vom Vortag (13.03.).

Die korrekte Datei kann ich bei Bedarf zur Verfügung stellen.

Kurven für Pflegeheimbewohner

Mich würden Sättigungskurven für Pflegeheimbewohner pro Bundesland interessieren. Dürften doch relativ einfach zu integrieren sein.
Eine Quelle für den Bezugspunkt 100% pro Bundesland kann ich leider nicht liefern.

Intensivregister und Testanzahl

Hallo Michael,

danke für die tolle Zusammenstellung der Daten! Das ist eine super Grundlage für Analysen.

Ich hätte noch einen Vorschlag für zwei meiner Meinung nach wichtige Datenquellen:

Übersicht über die Intensivbetten:
https://www.intensivregister.de/#/aktuelle-lage/reports

Übersicht über die durchgeführten Tests:
https://www.rki.de/DE/Content/InfAZ/N/Neuartiges_Coronavirus/Testzahl.html

Mit den drei Informationen (Erkrankte, Anzahl Tests und freie/belegte Intensivbetten) kann man sich ein deutlich differenzierteres Bild der aktuellen Situation machen.

Data of 16/Jan/2021 and 17/Jan/2021 appears the same

Hi there - first of all, great job you are doing in storing the data from RKI!

I am using your stored data as historical data in my repo to nowcast the number of infections. Recently the script had some issues and I traced it back to the data of the 17th of Jan 2021, it appears to be the same as that of the 16th of Jan. The data of the 17th in this [repository[(https://github.com/CharlesStr/CSV-Dateien-mit-Covid-19-Infektionen-/tree/master/Dezember) however appears different.

Could you address this issue?

Dateien vom 11.04.2020 und 04./05.05.2020 falsch formatiert?

Danke für die umfangreiche Sammlung der RKI-Daten! Natürlich unterscheiden sie sich hin und wieder in Details – Grüße gehen an dieser Stelle raus an alle BOMs, CRLFs und dann doch mal irgendwo hineingemogelte UNIX-Timestamps! Insgesamt aber Dinge, die sich irgendwie noch gut händeln lassen, sodass ich immer gemeint hätte, dass das Vorhalten der Original-Dokumente im Repo wichtiger ist als die Mehrarbeit in der programmseitigen Behandlung.

Einzig bei der Datei für den 11.04.2020 tendiere ich zu einer anderen Sicht. Die ist einfach in zu vielen Aspekten "kaputt". Einmal der Vergleich zum vorigen und nächsten Tag:

> head -n3 RKI_COVID19_2020-04-{10,11,12}.csv
==> RKI_COVID19_2020-04-10.csv <==
IdBundesland,Bundesland,Landkreis,Altersgruppe,Geschlecht,AnzahlFall,AnzahlTodesfall,FID,Meldedatum,IdLandkreis,Datenstand,NeuerFall,NeuerTodesfall,Refdatum,NeuGenesen,AnzahlGenesen
1,Schleswig-Holstein,LK Pinneberg,A60-A79,W,1,0,1584304,2020-03-30,01056,2020-04-10,0,-9,2020-03-30,0,1
1,Schleswig-Holstein,LK Pinneberg,A60-A79,W,1,0,1584305,2020-03-31,01056,2020-04-10,0,-9,2020-03-29,-9,0

==> RKI_COVID19_2020-04-11.csv <==
"ID","IdBundesland","Bundesland","Landkreis","Altersgruppe","Geschlecht","AnzahlFall","AnzahlTodesfall","ObjectId","Meldedatum","IdLandkreis","Datenstand","NeuerFall","NeuerTodesfall","Refdatum","NeuGenesen","AnzahlGenesen"
1,1.00,"Schleswig-Holstein","SK Neum├╝nster","A15-A34","M",1.00,0.00,1668016.00,05/04/2020,1004.00,11/04/2020,0.00,-9.00,05/04/2020,-9.00,0.00
2,1.00,"Schleswig-Holstein","SK Neum├╝nster","A15-A34","M",1.00,0.00,1668017.00,09/04/2020,1004.00,11/04/2020,0.00,-9.00,09/04/2020,-9.00,0.00

==> RKI_COVID19_2020-04-12.csv <==
IdBundesland,Bundesland,Landkreis,Altersgruppe,Geschlecht,AnzahlFall,AnzahlTodesfall,FID,Meldedatum,Landkreis ID,Datenstand,Neuer Fall,Neuer Todesfall,Referenzdatum,Neu Genesen,Anzahl Genesen
1,Schleswig-Holstein,SK Flensburg,A15-A34,M,1,0,1754998,3/14/2020,01001,04/12/2020,0,-9,3/16/2020,-9,0
1,Schleswig-Holstein,SK Flensburg,A15-A34,M,1,0,1754999,3/19/2020,01001,04/12/2020,0,-9,3/13/2020,0,1

Die Probleme sind also:

  • Irgendwas hakt am Encoding (SK Neum├╝nster)
  • Das Datum folgt dem deutschen Format DD/MM/YYYY.
  • Die Zahlen sind werden als Fließkommaangaben ausgegeben.
  • Die Datei nutzt CRLF.

Allesamt Dinge, die wir auch programmseitig behandeln könnten und zum Teil an anderer Stelle auch schon machen. Hier kommen nur so viele Sachen zusammen, dass ich vorschlagen würde, einfach eine korrigierte Fassung im Repo zu behalten.

Fehlerhafte und nicht aktualisierte RKI Dateien

Beim Vergleich einiger Dateien mit denen, die im Projekt unter https://covid19-de-stats.sourceforge.io/ ("covid19-de-stats") archiviert werden, habe ich festgestellt, dass zwei Dateien hier fehlerhaft sind und zwei Dateien nicht der nachträglich bei Esri aktualisierten Version entsprechen.

Fehlerhaft sind:

Nicht der nachträglich aktualisierten Version entsprechen:

Ich habe aber nur einzelne Dateien verglichen, von denen ich wusste, dass es bei deren Bereitstellung bei Esri Probleme gab. Um einen umfassenden Vergleich durchzuführen, wäre folgendes zu tun:

  1. Das Script compare-hashes.sh unter https://covid19-de-stats.sourceforge.io/ForGithub/compare-hashes.sh und die Datei rki-hashes-compare.txt unter https://covid19-de-stats.sourceforge.io/ForGithub/rki-hashes-compare.txt abrufen und im Verzeichnis mit den RKI-Dateien speichern.
  2. In das Verzeichnis mit den Dateien wechseln und das Script ausführen. Dabei werden die Namen aller Dateien ausgegeben, deren lokaler Inhalt sich von dem der im Projekt covid19-de-stats archivierten Dateien unterscheidet (dazu werden die Werte von md5sum verglichen).
  3. Gegebenenfalls die beiden heruntergeladenen Dateien wieder löschen.

Bei Unterschieden kann ich die entsprechenden Dateien vom Projekt covid19-de-stats zur Verfügung stellen.

Es kann jedoch durchaus sein, dass auch Dateien, die im Projekt covid19-de-stats archiviert wurden, nach deren Abruf auf der Seite von Esri noch aktualisiert wurden.

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.