Giter Club home page Giter Club logo

dict_uk's People

Stargazers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

Watchers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

dict_uk's Issues

немає розрізнення ні́ким і ніки́м (немає категорії emphatic)

Зацініть різницю: там тобі не знати ніко́го / там тобі не знати ні́кого (всі відомі).

Це ті, що в MTE emphatic. Цінна інфа, а не просто формальність для звідності в MTE. Можна не вносити окрему категорію (бо всі emphatic є negative), а лиш додати позначку, але тут треба подумати: вони зовсім різні, у них зовсім різний синтаксис: емфатичне включає в себе й присудок, тобто ні́ким це скорочення до немає ким. Їх всього два: нікого і нічого з відмінками.

@mariana-scorp @vstarko @Olvija

_кожен_ без :&pron

кожний adj:m:v_naz:&pron:def
  кожного adj:m:v_rod:&pron:def
  …
  кожен adj:m:v_naz:short
  кожен adj:m:v_zna:short

такого-сякий

Неузгоджені складені займенники, ще наприклад сякий-такого тощо.

Initiate and approach dic into t9 databases

We should inject vocabulary into modern operation systems like

  • Android
  • iOs

Also we need to take care about aspell, ispell libraries and basic libs like timezone (change kiev to kyiv) and others

стафілокок

ULIF каже стафілокок — це істота (відмінюється, як тварина)
ГС дає парадигму, що не є ані істотою, ані неістотою (власне як вони й кажуть): там подвійний знахідний множини (як у тварин: =р.в. і =н.в.) і подвійний знахідний однини (=р.в. і =н.в.).
Мені здається, що мати одну лему з такою парадигмою краще, ніж вводити омонімію двох лем anim/inanim. От лише не знаю чи тоді треба для бактерій вводити третю форму «істотності» (bacanim? :))

Дубльовані Називний і Знахідний у вусах

у згенерованому словнику:

вуса noun:inanim:p:v_naz:ns
  вуса noun:inanim:p:v_naz  <————
  вусів noun:inanim:p:v_rod:ns
  вусам noun:inanim:p:v_dav:ns
  вуса noun:inanim:p:v_zna:ns
  вуса noun:inanim:p:v_zna  <————
  вусами noun:inanim:p:v_oru:ns
  вусах noun:inanim:p:v_mis:ns

(може трапляється ще десь)

TODO.txt -> TODO.md

Переробити TODO у markdown. А краще завести для цього окремий issue і відмічати пункти по ходу виконання…


До першого випуску

  • додати коментар для омонімів у dict_corp_vis.txt

Після першого випуску

  • присвійні прикметники від імен прапорцем

  • розвести омоніми/омографи тощо

  • додати решту населених пунктів України

  • переглянути групування прапорців дієслів

  • наблизити теги словника правил LT до тегів словника корпусу

  • додати скрипт сортування входових файлів словника (після ручного редагування)

  • наразі деяки (коротші) дублети не мають всіх форм, якщо вони перетинаються з формами довшої леми

    (стягти - стягнути, відвологти - відвологнути, сп'ястися - зіпнутися…)

  • кличний відмінок для займенників та решти іменників

поміняти теги

  • impr -> imprt (щоб краще відрізняти від imprs)
  • додати тег :geo

Покращення структури

  • перенести теги базових форм з коду в афікси (?)
  • переписати скрипти з python на groovy
  • замінити скрипти командного рядку сценарієм gradle

Тестування/регресії

  • перевіряти лат. в укр. словах
  • перевіряти наявність всіх відмінків
  • різні рівні регресії

Інше

  • Firefox/LibreOffice.org addons
  • Вебсторінка для пошуку слів
  • додати словник синонімів
  • додати словник перенесення слів

“піти в солдати”, “їх було з десять” — rv_naz?

Андрій сказав, що про це щось було в Синявського, але я швидко не знайшов.
Проте є в СУМі: “…8. із знах. (у давній формі, яка збігається з сучасним називним множини)” (http://sum.in.ua/s/v)
Нехай знахідний у давній формі, але солдати в словнику зараз або солдати noun:anim:p:v_naz або солдати noun:anim:p:v_kly, тож зробити щось треба: або додати давній знахідний, або додати :rv_naz, або? Що скажете?

пасти гусей і пасти навколішки — одна лема

пасти verb:imperf:inf
  пади verb:imperf:impr:s:2
  паси verb:imperf:impr:s:2
  падім verb:imperf:impr:p:1
  пасім verb:imperf:impr:p:1
  падімо verb:imperf:impr:p:1
  пасімо verb:imperf:impr:p:1
  падіть verb:imperf:impr:p:2
  пасіть verb:imperf:impr:p:2
  ⋮

Глюк чи ще руки не дійшли до розрізнення за наголосом? Ця штука шкодитиме.

відпасти
припасти
підпасти
зади́ха́тися
коли́са́тися
заколи́са́тися
пле́ска́тися
розпле́ска́тися
струменітися ? — там лексема на 51 форму, не можу зрозуміти
о́бі́д

+m змінює лему на :m

До +m:

штунда noun:anim:f:v_naz
  штунди noun:anim:f:v_rod
  штунді noun:anim:f:v_dav
  …

Після +m:

штунда noun:anim:m:v_naz
  штунди noun:anim:m:v_rod
  штунді noun:anim:m:v_dav
  …
  штунда noun:anim:f:v_naz
  штунди noun:anim:f:v_rod
  …

Таким чином втрачається інфа про те, що штундин рідний рід — жіночий.

Очікується:

штунда noun:anim:f:v_naz
  штунда noun:anim:m:v_naz
  штунди noun:anim:m:v_rod
  …
  штунди noun:anim:f:v_rod
  штунді noun:anim:f:v_dav
  …

мну verb:imperf:futr:s:1

а також

verb:imperf:futr:s:3: мне
verb:imperf:futr:p:1: мнем, мнемо
verb:imperf:futr:p:2: мнете

Треба .gitingore’ити виходові файли

Вигенерувані файли заважають при розробці. Не знаю чи їх по одному в ігнор додати, чи патерном, чи в одну папку всіх направити і її ігнорити…

Немає типу для семи займенників

Для котрих є, в дужках наводжу тип з уліфа. Чи правильний не знаю.

будь-котрий (indefinite)
будлі-який
казна-який (indefinite)
будлі-котрий
жодний (negative)
подеякий
такісінький (demonstrative)

плутанина лем для :emph

adv:&pron:emph є лемою для adv:&pron:neg, наприклад

нізвідки adv:&pron:emph
  нізвідки adv:&pron:neg

Іменникові emph йдуть окремою лемою:

нічим noun:inanim:v_oru:&pron:emph
але якщо є два омоніми, то один стає лемою для іншого:
нічого noun:inanim:v_rod:&pron:emph
  нічого noun:inanim:v_zna:&pron:emph

дублювання _щонайменше_ та інших

Є

мало adv:compb
  менш adv:compr
  менше adv:compr
  найменш adv:super
  найменше adv:super
  щонайменш adv:super
  якнайменш adv:super
  щонайменше adv:super

А є щонайменше adv:super окремою лемою. Те ж з іншими.

Все одно проблеми з вусами

вуса noun:inanim:p:v_naz
  вуса noun:inanim:p:v_naz:ns
  вусів noun:inanim:p:v_rod:ns
  вусам noun:inanim:p:v_dav:ns
  вуса noun:inanim:p:v_zna
  вуса noun:inanim:p:v_zna:ns
  вусами noun:inanim:p:v_oru:ns
  вусах noun:inanim:p:v_mis:ns

(дивись #8)

часу :v_mis

жокею :v_mis, в’їзду :v_mis
Так правильно чи глюк?

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.