Giter Club home page Giter Club logo

spiderman's Introduction

SpiderMan

本库已经放弃维护, 您可以尝试功能更加齐全的管理系统: https://github.com/crawlab-team/crawlab

English | 中文

目录

声明

SpiderManWeb 页面使用了大量 百度图片的无标注版权图片, 如有涉嫌侵权请联系我!

背景介绍

SpiderMan 基于Scrapy、scrapyd、Scrapyd_API、tornado 爬虫分布式管理框架。

SpiderMan功能包括爬虫调度,Web端的代码编辑器和新建Scrapy项目等。

项目介绍

SpiderMan 的设计初衷是给大家提供一个便捷的分布式爬虫管理框架

SpiderMan 是基于scrapyd api 来开发, 不会对现有爬虫代码做任何的侵入
SpiderMan 嵌入了web编辑器这样一来就可以在web页面中编写代码,发布代码,部署新的爬虫项目至指定服务器
SpiderMan 目前仅仅利用tornado.ioloop.PeriodicCallback 来完成定时任务, 对各个服务器上单个爬虫进行定时调度

使用说明

获取代码

使用实例

界面

  • 首页 由于首页我实在是不知道到底应该放一些什么东西, 但是如果没有首页的话,总是感觉觉怪怪的!
    Shurnim icon
  • 服务器 主要是用于对scrapyd 服务器的管理包括了: 添加新的服务器、调度服务器指定的蜘蛛、删除指定服务器的项目
  • 项目 新建本地项目部署至指定服务器, 该页面包含了: 添加新的项目, 删除项目, 编辑项目代码, 部署项目

界面样式

  • 首页
    Shurnim icon
  • 服务器
    Shurnim icon
  • 项目
    Shurnim icon
  • 还有一些子页面.....

部署

克隆项目至本地
git clone https://github.com/PerrorOne/SpiderMan.git
cd SpiderMan
python setup.py install
# 初始化项目
SpiderMan init
# 创建管理员账号
SpiderMan admin
#=================使用docker部署======================
git clone https://github.com/PerrorOne/SpiderMan.git
cd SpiderMan
docker build -t spiderman:v1 .
# 进入系统创建admin用户
docker run -it -p 8080:8080 spiderman:v1 /bin/bash
# sh
/root/anaconda3/envs/spderman/bin/SpiderMan init
# 启动
docker run -d -p 8080:8659 spiderman:v1
# 支持从环境变量中读取配置
--env MYSQL_PORT=3306
--env MYSQL_HOST=127.0.0.1
--env MYSQL_USER=root
--env MYSQL_PASS=99999
--env ADMIN_USER=perror // 创建管理员
--env ADMIN_PASS=123456 // 管理员密码
--env CMD=1 // 由于某些原因这个参数是必需的
# 示例:
docker run -d -p 8080:8659 --env MYSQL_PORT=3306 --env MYSQL_HOST=127.0.0.1 \
--env MYSQL_USER=root --env MYSQL_PASS=99999 --env ADMIN_USER=perror \
--env ADMIN_PASS=123456 --env CMD=1 spiderman:v1
# 浏览器中输入:127.0.0.1:8080

其他

由于本人编程水平有限并且只有我一个人在开发,
页面没有实现国际化, 定时任务程序过于简单,等等...
如果各位朋友有更好的想法、更好的实现或是发现bug.欢迎fork修改!
最后祝各位生活愉快!
Shurnim icon

spiderman's People

Contributors

perrornet avatar

Stargazers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

Watchers

 avatar  avatar  avatar

spiderman's Issues

运行后报错

File "C:\Users\59574\Anaconda3\envs\py36\lib\site-packages\spiderman-0.0.1-py3.6.egg\SpiderMan\utils_init_.py", line 43, in SpiderManConf
MYSQL, SQLLITE, HOST, PORT = obj.MYSQL, obj.SQLLITE, obj.HOST, obj.PORT
AttributeError: module 'SpiderManConf' has no attribute 'MYSQL'

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.