Giter Club home page Giter Club logo

salarios3dg's Introduction

Salarios 3DG (2022)

Intro

Dos simples scripts para calcular y mostrar la media de salarios (en bruto) a partir de los datos vertidos por usuarios anónimos en un thread del foro de 3DGames:

2022 - ¿Cuánto ganás/cobrás?

La idea nace de mera curiosidad de querer saber cuál era promedio de salarios, notando los elevados montos que los usuarios subían al thread. Estos salarios no parecían demasiado representativos en un principio, teniendo en mente los datos públicos que uno puede ver de encuestas como las de SysArmy, Encuestas IT, cuantoGano o incluso datos de CESSI.

Descripción

El 1° script (obtener_salarios.py) se encarga de buscar todos los posts del mencionado thread. Después se filtra los mismos según determinados parámetros (empleado para esta tarea tanto regex como la librería spaCy) y así obtener todos los salarios brutos que fueron recolectados de todos los posts (o más específicamente, de aquellos posts siguieron un formato de mensaje establecido en el 1° mensaje del thread):

Imagen 1

El 2° script (plotear_salarios.py) se encargar de mostrar en un gráfico los resultados obtenidos, empleado la librería Seaborn. Pero antes de hacer esto se obtiene primero el valor del dolar blue del día desde la API de CriptoYa.com y del euro blue desde la web de PrecioEuroBlue.com.ar. Ya con estos valores a disposición se puede realizar la conversión a pesos y obtener los valores medios necesarios:

Imagen 2

Para así mostrar finalmente el plot con todos los salarios en bruto convertidos a pesos y una linea de salario medio:

Imagen 3

Instalación y uso

  1. Si se tiene ya instalado Git en nuestro sistema operativo, basta nomás con clonar el presente repositorio:
git clone [email protected]:FedeHC/salarios3dg.git

Con el repo clonado y dentro de la carpeta de descarga del repositorio, procedemos con el resto:
  1. a) OPCIONAL: Antes es recomendable usar un entorno virtual como por ej. VirtualEnv:
virtualenv salarios3DG
  1. b) Y recién luego instalar dentro de éste último todas las librerías usadas por ambos scripts:
pip install -r requirements.txt
  1. c) OPCIONAL: Tener presente que la librería spaCy puede darnos algunos inconvenientes para instalarlo y usarlo. En ocasiones es necesario descargar un módulo (pipeline de entrenamiento) necesario para poder usar la librería:
python -m spacy download es_core_news_sm

Y dentro del script (obtener_salarios.py) ir a la linea 96, comentarla (#) y descomentar la linea siguiente, tal como se muestra a continuación:

# nlp = en_core_web_sm.load()
nlp = spacy.load("es_core_news_sm")

  1. a) Una vez terminado, basta nomás con ejecutar ambos scripts en el sig. orden:
python obtener_salarios.py
  1. b) Y luego:
python plotear_salarios.py

salarios3dg's People

Contributors

fedehc avatar

Watchers

 avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.