So, how it all works:
- folder /data: the anonymized dataset used for analysis
- folder /getting_data_EDA: data loading, preparation and EDA
- folder /word_embeddings: CBOW and Skipgram models, clustering, TSNE
- folder /rf_classifier: word2vec, LDA, random forest
- sentiments were predicted here https://github.com/olgasilyutina/socialsent/tree/master
message: Я в тюрьме всем нашим ауе здесь так плохо и одиноко лучше сюда непопадать здесь ломается моя жизнь
recommended emojis: 😭😔😒😪😢
original emoji: 😪
Authored by Aina Nurmagombetova 🤙 Alina Cherepanova 🙋 Anya Bataeva 🤯 Olya Silyutina 🤔