Giter Club home page Giter Club logo

rime-huma's People

Contributors

ywxt avatar

Stargazers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

Watchers

 avatar

Forkers

alxbnct white1033

rime-huma's Issues

Todo

目前的方案已經初步完成,但是還有很多問題。

  1. 能反映大陸用字的繁體字頻表很難找到,因此常有常用字簡碼被罕用字擠佔的情況。
  2. 與第一條相關,「國字表」包含很多古籍用字,但未包含大陸香港的常用字與異體字,這部分需要刪補。
  3. 詞表很爛,收了太多無意義詞,反倒某些常用詞丟失。

接下來目標:

  • #2
  • #3
  • 調整詞表,可能需要重做
  • #7
  • #5
  • #8

部分拆分改用「T」源字形

暫定包含以下部件的漢字如有「T」源,則此部件優先使用 「T」源字形

  • 䍃(⿱𱼀缶)
  • 杀(包含「殺」「閷」等字,字形爲 「⿱乂朮」,但不含「杀」等陸標字形)
  • 𥁕

異體字選擇

以下標註✅的異體字優先安排簡碼,除以下所列項之外,亦當包含 #5 中所涉及之漢字。

  • 群✅ 羣 ❌
  • 峰✅ 峯 ❌
  • 裏✅ 裡 ❌
  • 爲✅ 為 ❌ (包括作部件所構成的異體字)
  • 衮✅ 袞 ❌ (包括作部件所構成的異體字)

刪補「常用」字集

目前使用 OpenCC + 簡體字集的方式生成了「常用」字集,現在共不到10000個字。
好處是大陸常用字不會缺失,缺點是由於OpenCC的「異體字表」還未動工,部分異體字丟失,用字向OpenCC標準靠近。

保留此issue以追蹤後續優化。

編碼與官網不一致:如、强、犟

您好!發現這三個字的編碼跟官網不太一樣:

 字头:如
-编码:bd bdk
+编码:b bdk
 拆分:女口

 字头:強
-编码:bdc bdcc
+编码:bd bdcc
 拆分:弓口虫
 
 字头:强
-编码:bkc bkcq
+编码:bdc bdcq
-拆分:弓厶虫牛
+拆分:弓口虫牛

紅色來自 rime-huma,綠色來自虎碼的拆分查詢

簡碼修改

mzj 犯 mzjn 碎猝
mz 奇 mzk 砢奇

修改後應爲

mz 犯 mzj 碎 mzjn 猝碎
mzk 奇砢

理由:砢 字頻太低,其與 奇 重碼相較於 碎猝 兩個常用字重碼更加合理。

調整詞組簡碼

目前的詞組的簡碼是根據GKB的字集做的,需要重新做。

添加額外字根

爲了解決「微」「贏」「穀」這幾組重碼,添加了以下字根:

  • 「微」組:「⿰彳攵」Wc
  • 「贏」組:吂 Fw
  • 「穀」組:「⿱士冖」 Gs

關于回頭碼的添加

出于個人需求,我添加了 huma.extended.dict.yaml 文件,竝在亓中寫入了回頭碼。
當所加回頭碼原爲空碼,亓䏻正常工作;而當亓與全碼有重時,如 yyii𢇏 字之全碼,補爲 字之回頭碼,
則被後置。設想中應令回頭碼作前置。
經查,乃「全碼後置」功䏻所致,復查亓實現,竊㠯爲亓實現的邏輯不夠健全。

目前吾有一粗略想灋,可模仿字根之解,然不便後續調整。

支持非qwerty佈局

可否支持其他非qwerty鍵盤佈局?或者自定義佈局?

如果開發者沒有時間精力的話,可否給一點建議,謝謝🙏

完善三簡

三簡存在大量空碼,可攷慮完善。
大致思路爲合幷碼表,改用lua脚本进行常用篩選。
若我有閑時我亦可做此事。
此外,建議爲一簡加入原版之快符作次選,該功䏻極實用,尤其在移動設备上。

最後,十分感謝您提供該方案,爲形碼輸入正字帶來了巨大便利!😄️

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.