Giter Club home page Giter Club logo

coronathon-fct's Introduction

Fact Checker's Tool

Problem

Teknolojinin gelişimiyle birlikte yaşanan gelişmeler kötü niyetli kullanıcılar tarafından suistimal edilmeye devam ediliyor.

Şu günlerde yaşadığımız Covid-19 Salgını esnasında ortaya çıkan sahte haberlerin insanlar üzerindeki etkisi ise karantinanın getirdiği psikolojik problemler ve paranoyayla birlikte çok daha artmış vaziyette.

Haber doğrulama organizasyonları bu sahte haberlerle savaşmak için yüksek miktarda efor sarf etseler de sahte haberlerin yayılması çok kısa sürerken bir haberin doğrulanması neredeyse 1 gün sürüyor.

Çözüm

Twitter, sahip olduğu çok miktarda bot hesabın yanında bilinçsiz ve kötü niyetli kullanıcıların da etkisiyle pek çok sahte haberin yayılmasına katkıda bulunan bir sosyal mecra.

Biz FCT ile twitter üzerinden elde ettiğimiz verileri kullanarak haber doğrulama organizasyonlarına 3 adet imkan sunuyoruz.

  • Yanlış haberlerin ortaya çıkması durumunda organizasyona alarm verilmesi.
  • Organizasyonun ortaya çıkan bir haberle ilgili güvenilirlik ve kaynak sorgulaması yapması.
  • Organizasyonun ortaya çıkan haberin kaynağıyla ilgili sorgulama yapabilmesi, kaynağın kendi güvenilirliğinin test edilebilmesi.

Aynı şekilde sorgulayan, doğruyu öğrenmek isteyen bireylerimize de 2 farklı imkan sunuyoruz.

  • Ortaya çıkan yeni doğrulanmış veya yalanlanmış haberlerle ilgili anlık bilgi sahibi olabilme şansı.
  • Merak ettikleri haberleri sorgulayabilme, doğruluklarıyla ilgili bilgi alabilme şansı.

Nasıl

Çözümümüzün çalışma mantığı aşağıdaki gibi:

Twitter hesaplarının attıkları tweetlerin teyit.org makaleleri ve sağlık bakanlığı açıklamalarıyla paralleliklerini inceleyip, yalan haber(makalelere/açıklamalara zıt) yayan hesapların güvenilirlik puanlarının düşürülmesi, doğru haberleri yayan hesapların güvenilirlik puanlarının yükselmesine dayalı bir sistem. Sonrasında twitter hesaplarının kendi iç dinamiklerine(follow/retweet), hesapların özelliklerine(açılma tarihi, tweet sıklığı) ve geleceğe yönelik tweetlerinin yine teyit edilmiş haberlerle olan korelasyonuna göre hesapların puanlarını dinamik bir şekilde günden güne güncelliyoruz.

Düşük puanlı hesaplar arasında yayılmaya başlayan haberlerin yalan olma ihtimalini göz önüne alıp bunları müşterimiz olan haber doğrulama sistemlerine bildiriyoruz. Aynı şekilde sorgulanan haberle veya twitter profiliyle ilgili yorum yapabiliyoruz.

Sistemimiz HITS(Hubs and Authorities) Algoritması ile çeşitli NLP Algoritmaları üzerinden işliyor.

HITS Algoritmasında Twitter hesaplarını güvendiğimiz kaynaklar(authorities) ve diğerleri(hubs) olarak 2'ye ayırıyoruz.

Otoriteler Covid-19 kapsamında bizim için: Sağlık Bakanlığı, WHO, Teyit.Org, İl Sağlık Müdürlükleri...

Diğer hesapların attıkları tweetlerin bu otoritelerin açıklamalarıyla olan paralleliklerini-zıtlıklarını ölçmek için bazı doğal dil işleme yöntemleri kullanıyoruz.

Sistem aşağıdaki gibi işliyor:

Teyit.Org Makalesi --> Makale Özeti --> Makale Duruşu

İlk geçiş için metin özetleyici(text summarization), ikinci geçiş içinse duruş çıkarımı(stance detection) kullanıyoruz.

Aynı şekilde;

Kişinin Tweeti --> Tweetin Duruşu

Tweetin Duruşu ile makalenin duruşu karşılaştırıldıktan sonra bu iki metnin korelasyon ölçümleri yapılıyor.

Metinlerde pozitif korelasyon => Kişinin Güvenilirlik Puanı Artar Metinlerde negatif korelasyon => Kişinin Güvenilirlik Puanı Azalır

Kişilerin güvenilirlik puanları ilk başta diğer faktörlerle birlikte(hesabın açılma tarihi, tweet sıklığı) hesaplandıktan sonra yalan haberlerle ilişkilendirildikçe düşer, doğru haberlerle ilişkilendirildikçe yükselir, sistem parametrik olarak istikrara dayalı çalışır.

Yanlış Haber Alarmı Verme

Güvenilmeyen hesaplar arasında yeni bir haber ortaya çıkmaya başladığında sistem haber doğrulayıcılara ve abone kullanıcılara haber verir.

Haber Sorgulama

Sistemde bir haber sorgulandığında, sistem o haberle ilgili tweetleri inceler, eğer otoritelerden gelen bir tweet varsa kesin bir sonuç vermekle birlikte diğer şartlarda ihtimallerle yanıt verir, şeffaf bir şekilde bu sonuçların sebeplerini güvenilirlik kıstasları üzerinden açıklar.

Kaynak Sorgulama

Haber doğrulayıcılar, bir haberin kaynağını sistem üzerinden sorgulayabilir. Twitterda haberin ilk nerede, ne zaman ortaya çıktığı, bu hesaplar arasında bir bağlantı(güvenilirlik, lokasyon...) olup olmadığını öğrenebilir.

Kişi Güvenilirlik Sorgulama

Haber doğrulayıcılar kendi buldukları kaynakların doğruluklarını sistem üzerinden sorgulayabilirler, sistem şeffaf bir şekilde bu sonuçların sebeplerini güvenilirlik kıstasları üzerinden açıklar.

coronathon-fct's People

Contributors

alpaylan avatar ahmety21 avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.