Giter Club home page Giter Club logo

risale-i-nur-kelime-frekans's Introduction

Risale-i Nur Kelime Frekansı

Risale-i Nur'da Sıklıkla Kullanılan Kelimelerin Periyodik Olarak Tekrarlanma Oranı (Frekansı)

Sayfa altlarındaki sözlüğe bakmaktan kurtulmak mümkün!

Risale-i Nur okuyanların en fazla yaşadığı problem, birçok kelimeyi bilmemek veya anlamını hatırlayamamaktır. Aslında eserlerde geçen pek çok kelimeyi, Türkçe bilen hemen hemen herkesin bilmesine rağmen kelimeleri çok az kullandığından, zihninde anlamı oturtması için tekrar etmesi gerekiyor. Bu durumdan dolayı yorulan kimseler ümitsizliğe kapılıp eseri okumayı terk edebiliyorlar. Burada amaçladığm, kelimelerin öğrenme sürecini ALFABETİK sıraya göre değil kelimelerin sıklık sırasına göre düzenlemek. Böylelikle her yeni okuyucu çok hızlı bir şekilde eserlerden tek başına daha doğru istifade edebilmeye başlayacaktır.

Frekansı en çok olanı önce öğrenerek sözlüklere daha az bakmaya matematiksel bir yaklaşım.

Yaptığım çalışmada aşağıdaki değerlere ulaştım. Bu değerlere göre örneğin Sözler adlı kitaptaki 13629 farklı kelimeyi (bunların bir kısmı eklerle türetilmiştir; hakiki, hakikat, hakaik gibi) bilebilseydik 56385 defa sayfa altına bakma ihtiyacı duymazdık. Tabi bu kadar kelimeyi öğrenmek zaman alacaktır fakat başlangıç için en çok kullanılan kelimelerin ilk 100 adeti acaba bize ne kazandırırdı? En çok tekrarlanan ilk 300 veya 500 kelime toplamda kaç tekrar gücüne sahip? Bizi kaç defa sayfa altlarına bakmaktan kurtarabilir?



Kelimelerin karşıladığı rakamsal değerler.

Bu şu demek; 100 kelimeyi bildiğinizden emin olduğunuzda, bir sözlüğe veya sayfa altı lügate bakma ihtiyacınız Sözler'de 12234 defa azalmış olacaktır.

Kitap Toplam Kelime Özgün Kelime 100 Kelime 200 Kelime 300 Kelime 400 Kelime 500 Kelime 1000 Kelime 2000 Kelime
Sözler 56385 13629 12234 17185 20647 23231 25288 32042 39050
Mektubat 33331 9473 7074 9953 12007 13616 14930 19229 23570
Lem_alar 32288 8151 7467 10538 12712 14351 15689 20118 24364
Şuâlar 46138 9227 11551 16019 19227 21752 23740 30135 35967
Asâ-yı Mûsâ 17228 4839 4868 6667 7908 8843 9595 12033 14344
Barla Lâhikası 23344 7953 5273 7362 8753 9824 10700 13554 16533
Kastamonu Lâhikası 15357 4854 4532 6109 7169 7972 8606 10587 12503
Emirdağ Lâhikası 29171 6689 7666 10844 13014 14618 15888 19867 23590
İman ve Küfür Muvazeneleri 12218 4380 3086 4318 5168 5833 6372 8143 9838
Tarihçe-i Hayat 39720 9745 7987 11592 14232 16294 18014 23633 29012

Kelimelerin karşıladığı yüzdelik dilimler.

Bu şu demek; 100 kelimeyi bildiğinizden emin olduğunuzda, bir sözlüğe veya sayfa altı lügate bakma ihtiyacınız Sözler'de yüzde 21.7 oranında azalmış olacaktır.

Kitap Toplam Kelime 100 % 200 % 300 % 400 % 500 % 1000 % 2000 %
Sözler 56385 21.7% 30.5% 36.6% 41.2% 44.8% 56.8% 69.3%
Mektubat 33331 21.2% 29.9% 36.0% 40.9% 44.8% 57.7% 70.7%
Lem_alar 32288 23.1% 32.6% 39.4% 44.4% 48.6% 62.3% 75.5%
Şuâlar 46138 25.0% 34.7% 41.7% 47.1% 51.5% 65.3% 78.0%
Asâ-yı Mûsâ 17228 28.3% 38.7% 45.9% 51.3% 55.7% 69.8% 83.3%
Barla Lâhikası 23344 22.6% 31.5% 37.5% 42.1% 45.8% 58.1% 70.8%
Kastamonu Lâhikası 15357 29.5% 39.8% 46.7% 51.9% 56.0% 68.9% 81.4%
Emirdağ Lâhikası 29171 26.3% 37.2% 44.6% 50.1% 54.5% 68.1% 80.9%
İman ve Küfür Muvazeneleri 12218 25.3% 35.3% 42.3% 47.7% 52.2% 66.6% 80.5%
Tarihçe-i Hayat 39720 20.1% 29.2% 35.8% 41.0% 45.4% 59.5% 73.0%



Aşağıdaki kod yaptığım çalışmada kullandığım bir parça. Kodların tamamını yukarıdaki "Risale_i_Nur_Kelime_Analizleri_2022_07_28.ipynb" dosyasında bulabilirsiniz.

Buradan yola çıkarak kelimelerin pek çoğunun ilgili konuya özel ve sadece yerinde kullanıldığını görebiliriz. Ayrıca sayfa altlarında bulunan kelimeleri derleme şeklimiz %100 doğru sonuca ulaşmamızı engellediğini de belirtmek gerekli. Çünkü sayfa altındaki kelime listesine erisale.com gibi sitelerden derledik. Bir sayfada birden fazla tekrarı olmuş olsa bile sayfa altında bir defa geçtiğinden frekans değeri etkilenmiş olacaktır. Fakat ilk 500 kelime listesi içinde sırası değişse de liste içinde kalacağını (%90+) söyleyebiliriz.


Şimdi en çok kullanılan kelimelerin tekrarlarına odaklanalım. İlk 100, 200 ... 1000 ve 2'den fazla tekrarlananların toplam değerini bulalım.

ozgun = sozler['kelime'].value_counts()

for x in [100, 200, 300, 400, 500, 1000, 2000]:
    print(f"Sözler'deki ilk {x} kelimenin tekrar toplamı : ",  ozgun.head(x).sum())

Yukarıdaki kod çıktı olarak aşağıdaki sonuçları vermektedir.

Sözler'deki ilk 100 kelimenin tekrar toplamı :  12234
Sözler'deki ilk 200 kelimenin tekrar toplamı :  17185
Sözler'deki ilk 300 kelimenin tekrar toplamı :  20647
Sözler'deki ilk 400 kelimenin tekrar toplamı :  23231
Sözler'deki ilk 500 kelimenin tekrar toplamı :  25288
Sözler'deki ilk 1000 kelimenin tekrar toplamı :  32042
Sözler'deki ilk 2000 kelimenin tekrar toplamı :  39050

Sözler adlı kitapta sayfa altlarındaki sözlükte bulunan kelime sayısı, tekrarlar dahil 56385
Sözler adlı kitapta sayfa altlarındaki sözlükte bulunan kelime sayısı, tekrarlar hariç 13629

Evet 100 kelime tekrarların yaklaşık %25'ini karşılıyor. Başlangıç için çok iyi öyle değil mi?

Kitap 100 Kelime 200 Kelime 300 Kelime 400 Kelime 500 Kelime 1000 Kelime 2000 Kelime
Sözler 21.7% 30.5% 36.6% 41.2% 44.8% 56.8% 69.3%
Mektubat 21.2% 29.9% 36.0% 40.9% 44.8% 57.7% 70.7%
Lem_alar 23.1% 32.6% 39.4% 44.4% 48.6% 62.3% 75.5%
Şuâlar 25.0% 34.7% 41.7% 47.1% 51.5% 65.3% 78.0%
Asâ-yı Mûsâ 28.3% 38.7% 45.9% 51.3% 55.7% 69.8% 83.3%
Barla Lâhikası 22.6% 31.5% 37.5% 42.1% 45.8% 58.1% 70.8%
Kastamonu Lâhikası 29.5% 39.8% 46.7% 51.9% 56.0% 68.9% 81.4%
Emirdağ Lâhikası 26.3% 37.2% 44.6% 50.1% 54.5% 68.1% 80.9%
İman ve Küfür Muvazeneleri 25.3% 35.3% 42.3% 47.7% 52.2% 66.6% 80.5%
Tarihçe-i Hayat 20.1% 29.2% 35.8% 41.0% 45.4% 59.5% 73.0%

Kelime sayısı arttıkça sıklık azalıyor. 300 kelime %40'ı karşılıyor! 1000 kelime ise %60+ kelimeyi karşılıyor ve lügata bakmaktan kurtarıyor.

Sonuç olarak yeni başlayanlar ve çocuklar için ilk 300-500 kelimenin öğrenileceği basit bir sözlük çok elverişli olacağı apaçık ortadadır. Peki ilk 100 kelimede neler var? Burada çok yer tutacağından python kodlarını ve zamanla sonuçları da haricen yüklemek niyetindeyim.

Merak edileceği üzere Sözler'deki ilk 100 kelime aşağıdadır.

Aşağıdaki 100 kelimeden acaba bildikleriniz kaç tanesi? Örneğin nazar, zemin, aciz, kainat, alem gibi bildiklerinizi de düşünürseniz 1000 kelimeyi öğrenmek sizce ne kadar zaman alır?

suret, hakikat, kâinat, hikmet, nefis, mevcudat, kudret, âlem, nazar, nihayetsiz, mazhar, rahmet, zemin, cihet, hadsiz, hakikî, şehadet, sair, beyan, saadet, intizam, icad, temsil, nevi, nuranî, nam, umum, Hâlık, muntazam, muhtelif, arz, Kur’ân-ı Hakîm, âhiret, Cenâb-ı Hak, mahiyet, mâlik, beşer, cilve, mahlûkat, vücud, lisan, cüz’î, tabiat, lâtif, zîhayat, kat’î, Sâni, medar, ulvî, ziya, acz, âciz, zerre, küllî, dalâlet, ubûdiyet, mahlûk, kemâl, nisbet, haşir, esmâ, istidat, âyine, kelâm, saadet-i ebediye, esbab, ebedî, Sâni-i Hakîm, azîm, ihsan, acip, mukabil, ziyade, delâlet, taife, Sâni-i Zülcelâl, muvazene, nihayet, câmid, inkâr, mizan, elhasıl, muhabbet, hak, ihtiyar, nev’, zikretmek, burhan, haşiye, ekser, Aleyhissalâtü Vesselâm, irade, bekà, menzil, muhal, Zât-ı Zülcelâl, vahdet, semâ, musahhar, eşya >

İnşallah pek yakında güncellenmeye devam edecek...

risale-i-nur-kelime-frekans's People

Contributors

alitekdemir avatar

Stargazers

 avatar  avatar  avatar  avatar  avatar  avatar

Watchers

 avatar  avatar  avatar  avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.