Giter Club home page Giter Club logo

post-sl-ugr's Introduction

post-sl-ugr

Dame posts y te diré de quienes son

Tarea

La tarea no es complicada, para cada post que aparece en la página principal del blog de la Oficina de Software Libre de la UGR, deberás obtener lo siguiente:

Título.
Autor.
Contenido.
Lista de categorías.
Lista de etiquetas.

Estos datos deberán ser almacenados en algún fichero (por ejemplo en formato XML), y si alguna de estas entradas no tiene asignada ninguna etiqueta, almacenar los datos en otro fichero distinto (también puede ser en formato XML).

Entrega

Tienes dos formas de poder entregar la tarea, que son las siguientes:

  • Archivo comprimido. Comprime el directorio de la tarea con TODOS los ficheros que se generen y súbelo a la plataforma.
  • Uso de una forja. Si decides subir el código a una forja, entrega un fichero de texto con la url donde está alojado. Continua leyendo el apartado de la evaluación.

Evaluación

  • Si el proyecto no funciona la valoración no será más de 50/100.

  • Si se usa GITHUB desde la primera línea de código que se escribe (no es buena práctica subir todo el proyecto con un sólo commit & push) la valoración será triplemente positiva. Puedes añadirme en GITHUB como 'seravb'.

  • Así el diseño del scraper se valorará en un 50% y el otro 50% se valorará sobre el control de eventos, funciones, controlar errores básicos, control de excepciones...

  • Si los resultados obtenidos aparte de almacenarlos en un fichero XML o JSON los guardas de forma que se cree un fichero HTML y que en este aparezca una tabla con los datos formateados este aspecto se valorará altamente. Recomendación: No te compliques y almacena los datos básicos y más simples en la tabla si no quieres que se muestre todos los datos que si son básicos para el formato de exportación.

INSTALACION

Se necesita Python 2.x y Scrapy 1.x

Para instalar la araña:

git clone https://github.com/deepb/post-sl-ugr.git
cd post-sl-ugr

Y para ejecutarla:

scrapy crawl PostGrabber

Los resultados de la araña se encuentran en:

PostGrabber.xml

y

PostGrabber.html

post-sl-ugr's People

Contributors

deepb avatar

Watchers

 avatar  avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.