Giter Club home page Giter Club logo

forecasting-djia-prices's Introduction

Forecasting DJIA Prices

Progetto A.A 2020-2021 del corso di Programmazione di Applicazioni Data Intensive
Alessio Arcara

Dataset

Il dataset scelto è composto da due file csv :

  1. Stocks data: Indice Dow Jones Industrial Average (DJIA) composto dalle trenta imprese industriali statunitensi più redditizie del mercato.
    (Range: 2008-08-08 to 2016-07-01)
  2. News data: i titoli dei post dal canale Reddit WorldNews (/r/worldnews). Sono classificate con i voti degli utenti reddit, e solo i 25 migliori titoli sono considerati per singolo giorno.
    (Range: 2008-06-08 to 2016-07-01)

Le 32 colonne considerate sono le seguenti:

  • "Date" (intervallo): data giornaliera di scambio del titolo azionario,
  • "Open, High, Low, Close, Adj Close" (numerica): prezzo di apertura, chiusura e prezzo minimo, massimo giornaliero del titolo azionario.
  • "Volume" (ratio): quantità scambiata giornalmente del titolo azionario.
  • "Top1,...,Top25" (testo): i titoli dei migliori 25 post giornalieri del canale Reddit WorldNews.

Le istanze fornite sono 1989 e la variabile da predire "Label", che verrà creata e spiegata nel dettaglio nelle seguenti sezioni, è una variabile discreta multiclasse (-1, 0, 1).

Obiettivo: È possibile prevedere il mercato?

Una "passeggiata aleatoria" è un fenomeno statistico in cui una variabile non segue un andamento distinguibile e si muove apparentemente in modo casuale. La teoria del random walk, applicata ai mercati finanziari, delineata più chiaramente da Burton Malkiel, postula che il prezzo dei titoli si muove casualmente, e che, quindi, ogni tentativo di prevedere il movimento futuro dei prezzi, attraverso l'analisi fondamentale o tecnica, è inutile.

L'obiettivo è generare modelli in grado di prevedere se l'indice DJIA avrà al giorno $t$ un movimento rialzista o ribassista, in modo da generare un profitto investendo in un fondo che si basi su tale indice.

Il progetto è suddiviso in due parti:

  1. Nella prima parte verranno utilizzati solo i dati storici sull'andamento dell'indice DJIA per generare una predizione al tempo t sul movimento rialzista (1) o ribassista (-1);
  2. Nella seconda parte si utilizzerà il testo dei titoli dei post per cercare una correlazione tra l'andamento dell'indice DJIA e notizie generiche attraverso il Natural Language Process (NLP) e dunque, migliorare i risultati precedentemente ottenuti;

forecasting-djia-prices's People

Contributors

alessioarcara avatar

Stargazers

 avatar  avatar

Watchers

 avatar  avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.