Giter Club home page Giter Club logo

ia-practicacalificada2's Introduction

IA-PracticaCalificada2

Inteligencia Artificial, César Lara, Práctica Calificada 2, 2021-I Predicción de tarifas de taxis.

Herramientas

Apache Spark Apache spark

Apache Spark™ es un motor de análisis unificado para el procesamiento de datos a gran escala.

pyspark 3.1.1

PySpark es una interfaz para Apache Spark en Python. No solo le permite escribir aplicaciones Spark utilizando las API de Python, sino que también proporciona el shell de PySpark para analizar interactivamente sus datos en un entorno distribuido. PySpark es compatible con la mayoría de las funciones de Spark, como Spark SQL, DataFrame, Streaming, MLlib (Machine Learning) y Spark Core.

El objetivo de esta evaluación es construir un modelo de aprendizaje que sea capaz de predecir la tarifa que cobra un taxi.

El conjunto de datos contiene alrededor de 55 millones de registros de viajes en taxi.

Cada registro contiene la siguiente información:

  1. ID: cadena que identifica de manera única a cada registro.

  2. pickup_datetime: timestamp indicando cuando el viaje a empezado.

  3. pickup_longitude: número real indicando la ubicación en longitud en donde el viaje empezó.

  4. pickup_latitude: número real indicando la ubicación en latitud en donde el viaje empezó.

  5. dropoff_longitude: número real indicando la ubicación en longitud en donde el viaje término.

  6. dropoff_latitude: número real indicando la ubicación en latitud en donde el viaje término.

  7. passenger_count: número entero indicando el número de pasajeros en el servicio de taxi.

  8. fare_amount: número real indicando el costo del taxi. Esta es la variable a predecir.

El documento Presente Predicción de tarifas de taxi limpia el conjunto de datos eliminando duplicados y nulos, asi mismo se creo nuevos atributos como :

  1. diferencia de longitud

  2. diferencia de latitud.

  3. dia de la semana

  4. mes

  5. año

Se visualizó la correlación entre estas nuevas variables y se visualizó el conjunto de datos.

En este repositorio utilizamos el 4% del conjunto total: Entrenamos modelos de :

1. Random Forest Regressor

2. Gradient Boosting Tree Regressor

3. AFTSurvivalRegression

4. Linear Regressor

El mejor modelo fue el Random Forest Regressor con un RMSE de 4.33.

Grupo 9

Integrantes:

  • Peralta Haro Katheryn Ximena
  • Quispe Amao Renzo Renato
  • Campó Beraún José Javier
  • Jara Ocas Franklin Hamer

ia-practicacalificada2's People

Contributors

renzoqamao avatar kx22peralta avatar josec24 avatar franklinhamer2727 avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.