Giter Club home page Giter Club logo

spider's Introduction

Why MyData.Homes 社区

  • 个人数据蕴含巨大的价值, 未来的世界核心就是数据, 这是一个万亿级的市场. 众多的公司利用用户数据获得巨额利益, 如对用户的数据收集分析后进行定制的广告推送,收取高额广告费. 但作为生产数据的最终用户,却没能分享属于自己的数据收益.

  • 个人数据分散在各种各样的公司之间, 经常形成数据孤岛, 多维数据无法融合. 很多优秀的创业公司,被极大限制. 有算法、有创新,但缺乏合法且高效的途径访问数据.

  • MyData.Homes 社区旨在提供最全的工具帮助用户安全快捷的从数据寡头拿回自己的数据, 自由选择提供给数据需求方, 挖掘自己数据的金矿, 分享自己数据的价值.

MyDataHomes.Spider工具是什么

要想实现个人数据资产化, 如何拿回自己的数据是第一步, 一些数据寡头已经开始提供工具能让用户自由导出数据, 如谷歌公司,已经提供方式让用户下载自己的数据.

这是一个好的开始, 但还不够, 还有很多公司没有提供官方工具或者只能下载很有限的数据.

而目前市面上的数据获取工具要么数据源不全, 要么不开源不透明. 无法保证工具本身不会偷偷窃取用户的数据, 甚至用户的用户名和密码.

MyDataHomes.Spider旨在安全快捷的帮助用户拿回自己的数据,工具代码开源,流程透明。

如何使用本工具

依赖安装

  1. 安装python3和Chrome浏览器

  2. 安装与Chrome浏览器相同版本的驱动

  3. 安装依赖库 ./install_deps.sh (windows下只需pip install -r requirements.txt)

工具运行

  1. 进入 tools目录

  2. 运行 python3 main.py

  3. 在打开的窗口点击数据源按钮

  4. 弹出的浏览器输入用户密码后会自动开始爬取数据,爬取完成浏览器会自动关闭. 在对应的目录下可以查看下载下来的数据(xxx.json)

如何贡献代码

CONTRIBUTING

数据源

目前已支持数据源:

  • 淘宝
  • 京东
  • 支付宝
  • 三大运营商
  • 公积金
  • 学信网
  • 邮箱
  • 携程

后续但不限于:

  • 社保
  • 保单
  • 健康报告
  • 微信
  • 浏览器历史 ...

开发者交流

开发者论坛:http://mydata.homes

Membership

TrustMirror

TEEX.io

协议

GPL-3.0

spider's People

Contributors

yarnauy avatar charleshua666 avatar hzqmwne avatar mydatahomes avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.