Giter Club home page Giter Club logo

dict_uk's Issues

+m змінює лему на :m

До +m:

штунда noun:anim:f:v_naz
  штунди noun:anim:f:v_rod
  штунді noun:anim:f:v_dav
  …

Після +m:

штунда noun:anim:m:v_naz
  штунди noun:anim:m:v_rod
  штунді noun:anim:m:v_dav
  …
  штунда noun:anim:f:v_naz
  штунди noun:anim:f:v_rod
  …

Таким чином втрачається інфа про те, що штундин рідний рід — жіночий.

Очікується:

штунда noun:anim:f:v_naz
  штунда noun:anim:m:v_naz
  штунди noun:anim:m:v_rod
  …
  штунди noun:anim:f:v_rod
  штунді noun:anim:f:v_dav
  …

_кожен_ без :&pron

кожний adj:m:v_naz:&pron:def
  кожного adj:m:v_rod:&pron:def
  …
  кожен adj:m:v_naz:short
  кожен adj:m:v_zna:short

стафілокок

ULIF каже стафілокок — це істота (відмінюється, як тварина)
ГС дає парадигму, що не є ані істотою, ані неістотою (власне як вони й кажуть): там подвійний знахідний множини (як у тварин: =р.в. і =н.в.) і подвійний знахідний однини (=р.в. і =н.в.).
Мені здається, що мати одну лему з такою парадигмою краще, ніж вводити омонімію двох лем anim/inanim. От лише не знаю чи тоді треба для бактерій вводити третю форму «істотності» (bacanim? :))

такого-сякий

Неузгоджені складені займенники, ще наприклад сякий-такого тощо.

немає розрізнення ні́ким і ніки́м (немає категорії emphatic)

Зацініть різницю: там тобі не знати ніко́го / там тобі не знати ні́кого (всі відомі).

Це ті, що в MTE emphatic. Цінна інфа, а не просто формальність для звідності в MTE. Можна не вносити окрему категорію (бо всі emphatic є negative), а лиш додати позначку, але тут треба подумати: вони зовсім різні, у них зовсім різний синтаксис: емфатичне включає в себе й присудок, тобто ні́ким це скорочення до немає ким. Їх всього два: нікого і нічого з відмінками.

@mariana-scorp @vstarko @Olvija

“піти в солдати”, “їх було з десять” — rv_naz?

Андрій сказав, що про це щось було в Синявського, але я швидко не знайшов.
Проте є в СУМі: “…8. із знах. (у давній формі, яка збігається з сучасним називним множини)” (http://sum.in.ua/s/v)
Нехай знахідний у давній формі, але солдати в словнику зараз або солдати noun:anim:p:v_naz або солдати noun:anim:p:v_kly, тож зробити щось треба: або додати давній знахідний, або додати :rv_naz, або? Що скажете?

часу :v_mis

жокею :v_mis, в’їзду :v_mis
Так правильно чи глюк?

пасти гусей і пасти навколішки — одна лема

пасти verb:imperf:inf
  пади verb:imperf:impr:s:2
  паси verb:imperf:impr:s:2
  падім verb:imperf:impr:p:1
  пасім verb:imperf:impr:p:1
  падімо verb:imperf:impr:p:1
  пасімо verb:imperf:impr:p:1
  падіть verb:imperf:impr:p:2
  пасіть verb:imperf:impr:p:2
  ⋮

Глюк чи ще руки не дійшли до розрізнення за наголосом? Ця штука шкодитиме.

відпасти
припасти
підпасти
зади́ха́тися
коли́са́тися
заколи́са́тися
пле́ска́тися
розпле́ска́тися
струменітися ? — там лексема на 51 форму, не можу зрозуміти
о́бі́д

Все одно проблеми з вусами

вуса noun:inanim:p:v_naz
  вуса noun:inanim:p:v_naz:ns
  вусів noun:inanim:p:v_rod:ns
  вусам noun:inanim:p:v_dav:ns
  вуса noun:inanim:p:v_zna
  вуса noun:inanim:p:v_zna:ns
  вусами noun:inanim:p:v_oru:ns
  вусах noun:inanim:p:v_mis:ns

(дивись #8)

Немає типу для семи займенників

Для котрих є, в дужках наводжу тип з уліфа. Чи правильний не знаю.

будь-котрий (indefinite)
будлі-який
казна-який (indefinite)
будлі-котрий
жодний (negative)
подеякий
такісінький (demonstrative)

мну verb:imperf:futr:s:1

а також

verb:imperf:futr:s:3: мне
verb:imperf:futr:p:1: мнем, мнемо
verb:imperf:futr:p:2: мнете

TODO.txt -> TODO.md

Переробити TODO у markdown. А краще завести для цього окремий issue і відмічати пункти по ходу виконання…


До першого випуску

  • додати коментар для омонімів у dict_corp_vis.txt

Після першого випуску

  • присвійні прикметники від імен прапорцем

  • розвести омоніми/омографи тощо

  • додати решту населених пунктів України

  • переглянути групування прапорців дієслів

  • наблизити теги словника правил LT до тегів словника корпусу

  • додати скрипт сортування входових файлів словника (після ручного редагування)

  • наразі деяки (коротші) дублети не мають всіх форм, якщо вони перетинаються з формами довшої леми

    (стягти - стягнути, відвологти - відвологнути, сп'ястися - зіпнутися…)

  • кличний відмінок для займенників та решти іменників

поміняти теги

  • impr -> imprt (щоб краще відрізняти від imprs)
  • додати тег :geo

Покращення структури

  • перенести теги базових форм з коду в афікси (?)
  • переписати скрипти з python на groovy
  • замінити скрипти командного рядку сценарієм gradle

Тестування/регресії

  • перевіряти лат. в укр. словах
  • перевіряти наявність всіх відмінків
  • різні рівні регресії

Інше

  • Firefox/LibreOffice.org addons
  • Вебсторінка для пошуку слів
  • додати словник синонімів
  • додати словник перенесення слів

Треба .gitingore’ити виходові файли

Вигенерувані файли заважають при розробці. Не знаю чи їх по одному в ігнор додати, чи патерном, чи в одну папку всіх направити і її ігнорити…

плутанина лем для :emph

adv:&pron:emph є лемою для adv:&pron:neg, наприклад

нізвідки adv:&pron:emph
  нізвідки adv:&pron:neg

Іменникові emph йдуть окремою лемою:

нічим noun:inanim:v_oru:&pron:emph
але якщо є два омоніми, то один стає лемою для іншого:
нічого noun:inanim:v_rod:&pron:emph
  нічого noun:inanim:v_zna:&pron:emph

Initiate and approach dic into t9 databases

We should inject vocabulary into modern operation systems like

  • Android
  • iOs

Also we need to take care about aspell, ispell libraries and basic libs like timezone (change kiev to kyiv) and others

Дубльовані Називний і Знахідний у вусах

у згенерованому словнику:

вуса noun:inanim:p:v_naz:ns
  вуса noun:inanim:p:v_naz  <————
  вусів noun:inanim:p:v_rod:ns
  вусам noun:inanim:p:v_dav:ns
  вуса noun:inanim:p:v_zna:ns
  вуса noun:inanim:p:v_zna  <————
  вусами noun:inanim:p:v_oru:ns
  вусах noun:inanim:p:v_mis:ns

(може трапляється ще десь)

дублювання _щонайменше_ та інших

Є

мало adv:compb
  менш adv:compr
  менше adv:compr
  найменш adv:super
  найменше adv:super
  щонайменш adv:super
  якнайменш adv:super
  щонайменше adv:super

А є щонайменше adv:super окремою лемою. Те ж з іншими.

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.