infoculture / hubofdata Goto Github PK
View Code? Open in Web Editor NEWHub of open data for Russia and other cyrillic countries / Хаб открытых данных на русском языке
Hub of open data for Russia and other cyrillic countries / Хаб открытых данных на русском языке
Написать код сбора и импорта данных из http://data.gov.spb.ru/ в хаб открытых данных
Цель: архивация открытых данных Санкт-Петербурга
Необходимо:
В хабе много наборов данных из системы ЕСИМО (http://portal.esimo.ru/)
У всех у них префикс esimo_ru_ и тег "есимо"
Пример : https://hubofdata.ru/dataset/esimo_ru_typhoon_43
Нужно перевести все эти наборы под организацию ВНИИМГИ-МЦД https://hubofdata.ru/organization/rihmi
На портале Минприроды опубликованы государственные доклады http://www.mnr.gov.ru/docs/gosudarstvennye_doklady/o_sostoyanii_i_ispolzovanii_vodnykh_resursov_rossiyskoy_federatsii/ в которых приведены цифры и таблицы с состоянием водных ресурсов по территориям, городам и индикаторам
Необходимо проанализировать эти отчёты, спроектировать структуры данных и извлечь данные из докладов и выложить их как открытые данные.
Ожидаемое время на задачу не более 3 недель
Вопросы можно писать на [email protected] или в комментариях к этой задаче
На хабе много данных с префиксом "fomru_", пример: https://hubofdata.ru/dataset/fomru_10495
Необходимо:
Поменяв только логотип и цвета
Есть наборы данных с префиксом "minjust_". Все они сейчас - это статистика Минюста.
Пример:
Необходимо:
Собрать базу открытых данных с сайта Московской патриархии о персоналиях, организациях, богослужебных указаниях и храмах, структурировать их и загрузить в хаб открытых данных
Задача должна занять не более 1 недели.
На портале Минприроды опубликованы государственные доклады http://www.mnr.gov.ru/regulatory/list.php?part=1257 в которых приведены цифры и таблицы с состоянием минирально-сырьевых ресурсов по территориям, городам и индикаторам
Необходимо проанализировать эти отчёты, спроектировать структуры данных и извлечь данные из докладов и выложить их как открытые данные.
Ожидаемое время на задачу не более 3 недель
Вопросы можно писать на [email protected] или в комментариях к этой задаче
Релиз вот тут
https://github.com/ckan/ckan/releases/tag/ckan-2.8.0
Необходимо архивировать данные с госпорталов открытых данных на хаб. Для этой цели необходимо:
Сделать сервис мониторинга данных хаба. Для примера можно взять метрики с data.gov.uk
На портале unsecret.rusarchives.ru размещена общедоступная база рассекреченных документов. Необходимо собрать данные из этой базы и выложить их как открытые данные.
Ожидаемое время на задачу не более 1 дня
Вопросы можно писать на [email protected] или в комментариях к этой задаче
Собрать базу открытых данных с сайта правительства, government,ru
Задача должна занять не более 1 недели.
На сайте управления Росстата http://obdx.gks.ru/ публикуются результаты обследования домохозяйств с 2003 по 2012 годы, в форматах NESSTAR (http://www.nesstar.com/), Excel и описанием структур данных в DOC файлах.
Собрать данные из базы данных сайта управление статистики уровня жизни и обследований домашних хозяйств Федеральной службы государственной статистики (Росстат) и перенести на хаб открытых данных
Ожидаемое время на задачу не более 1-3 дня (8-24 часа).
В хабе много наборов данных из системы ЕМИСС - https://fedstat.ru не привязанных к Росстату
Эти наборы данных имеют префикс "emiss_" и тэг "емисс".
Необходимо:
Есть наборы данных являющиеся архивами сайтов. Они собраны в группе "Архивы сайтов" https://hubofdata.ru/group/webarchive
Необходимо:
Внести задачи по сбору следующих данных:
В хабе есть некоторое количество наборов данных загруженных с префиксами "7710168360-", пример: https://hubofdata.ru/dataset/7710168360-budgetdebt
Необходимо:
Обновление статистики для rev20170910
Новые данные здесь
С hubofdata.ru удалить кучу мелких неактуальных наборов данных с префиксом "gkz_" - их много и они бесполезны.
Неполный список, задачу необходимо обновлять.
Данные курсов валют хранились на сайте Rackspace. Необходимо их переуказать с Rackspace на cdn.ruarxive.org
https://hubofdata.ru/dataset?tags=%D0%BA%D1%83%D1%80%D1%81%D1%8B+%D0%B2%D0%B0%D0%BB%D1%8E%D1%82
Вместо ссылок с префиком
http://d2f6aadeaff96aaafda4-614b9ac7aa1f2556da9aa7df0eee2346.r98.cf2.rackcdn.com/
https://cdn.ruarxive.org/public/OGDHub/
Создать карточки организаций таких как:
В хабе много наборов данных отчётов политических партий с префиксом "cikrf", пример: https://hubofdata.ru/dataset/cikrf7f6f7f6a
Необходимо:
На базе Seeweedfs и организовать загрузку файлов туда
Текущий код является смешением кода на C# по выгрузке индикаторов и на Python по загрузке в хаб
Код доступен тут: https://github.com/infoculture/hubofdata/tree/master/scripts/catalogs/cbr_opendata
Необходимо:
Пример ранее загруженных наборов данных: https://hubofdata.ru/dataset/cbrf_ind_91
На портале Минприроды опубликованы государственные доклады http://www.mnr.gov.ru/regulatory/list.php?part=1101 в которых приведены цифры и таблицы с состоянием окружающей среды по территориям, городам и индикаторам
Необходимо проанализировать эти отчёты, спроектировать структуры данных и извлечь данные из докладов и выложить их как открытые данные.
Ожидаемое время на задачу не более 3 недель
Вопросы можно писать на [email protected] или в комментариях к этой задаче
Есть наборы данных с префиксом "cbrf_ind_", пример: https://hubofdata.ru/dataset/cbrf_ind_91
Необходимо:
A declarative, efficient, and flexible JavaScript library for building user interfaces.
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
An Open Source Machine Learning Framework for Everyone
The Web framework for perfectionists with deadlines.
A PHP framework for web artisans
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
Some thing interesting about web. New door for the world.
A server is a program made to process requests and deliver data to clients.
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
Some thing interesting about visualization, use data art
Some thing interesting about game, make everyone happy.
We are working to build community through open source technology. NB: members must have two-factor auth.
Open source projects and samples from Microsoft.
Google ❤️ Open Source for everyone.
Alibaba Open Source for everyone
Data-Driven Documents codes.
China tencent open source team.