idvel / rime-ice Goto Github PK

View Code? Open in Web Editor NEW

9.0K 56.0 610.0 162.82 MB

Rime 配置：雾凇拼音 | 长期维护的简体词库

Home Page: https://dvel.me/posts/rime-ice/

License: GNU General Public License v3.0

Lua 59.84% Go 40.16%

rime rime-schema rime-config rime-squirrel rime-custom rime-weasel

rime-ice's People

Contributors

Stargazers

Watchers

Forkers

twlz0ne ggb6070 zllx666 protonuniverse morpheusxxxxx ivu99 goosina snake-git hzhgino seyrenus hxzhao527 hawie linruohan qcmuu ssuyuchan fenejifen lisansas zmyxpt 50ways2sayhard hqyel leigingban lvii yy306525121 lightmark yanjunhui dragonboom pettyferlove mordorx dalanan programfan buyaobeishang antonchen tumashu zolyn isgasho skyfireitdiy sunznx loda13 tywtyw2002 st-saint gogoclothes dumpmemory luckmoon maxojj galentwww lixing0016 lingcongdesu weiying-robotic shewer marvinjee tksmly jackygeng2008 iamlaom naiqixiao lokchunyu danielweiv wuyou1024 researchmore zhjnerv jiefy pohrom islder linxing datacruiser game-challenge arattt good0007 all-forks qxmao jinzaizhichi maeganyork big-aaron scomper yi jn7163 sxtywjj huangkai brianapple blairbai hezhizhen weiqiyiji linuer hateonion washanhanzi stricklandf go1869 nehcuh ann61c bb33bb ccbikai rick-yao cuzv dkphhh 2218675712 ydxydx926 kolasky1977 jinriwushi zhlmnet lixin-x flay0303

rime-ice's Issues

","和"."翻页快捷键无效

我在default.custom.yaml这个文件中将默认的用"="和"-"翻页的两行设置注释掉，同时取消","和"."那两行的注释，

# paging_with_minus_equal: 翻页：- =
# - { when: has_menu, accept: minus, send: Page_Up }
# - { when: has_menu, accept: equal, send: Page_Down }

# paging_with_comma_period: 翻页：, .
- { when: paging, accept: comma, send: Page_Up }
- { when: has_menu, accept: period, send: Page_Down }

但是重新部署后快捷键完全不反应。我测试了如果设置用[]翻页是可以生效的。看了一圈也没找到答案，请问是哪里我忽视了吗？谢谢！

ext.dict.yaml 存在重复词

如:

一个坏消息 1
一个坏消息 1

...

一个好消息 1
一个好消息 1

只是偶然注意到，不确定是否还有更多重复词语，建议系统性去重。

方案文件 rime_ice.schema.yaml 中 punctuator 注释文本不准确

你好，输入法和词库太好用了，感谢分享。
我注意到在commit d35692a 更新了rime_ice.schema.yaml punctuator 部分的注释，表述的确更清晰易懂，但有一处不准确。
原为

# 引入自己的修改过的 symbols
punctuator:
  # import_preset: symbols
  import_preset: symbols_custom  # 标点符号和 v 模式在里面

现为

# 标点符号
# 预设的 punctuation.yaml 包含了 full_shape half_shape （全角和半角的符号映射）
# 预设的 symbols.yaml     包含了 full_shape half_shape symbols
# symbols 的功能是支持以「/」前缀开头输出一系列字符，自定义的 symbols_custom.yaml 修改成了「v」开头。
punctuator:
  # punctuator 部分 | symbols  # 从应用目录引入自带的默认配置
  import_preset: symbols_custom           # 从 symbols_custom.yaml 引入自己自定义的
  # half_shape:                           # 也可以直接在这里配置

由于 rime 自带的 punctuation.yaml 格式不完整，import_preset: punctuation 会部署失败，建议改为 import_preset: default

一些比较好的字库来源

现代汉语词典7 是从官方app中提取出来做成的mdx词典，质量还是可靠的

现代汉语词典7

其他

新华成语大词典文字版
 同义词词林2020.3.26修订版

三本 csv 数据 share.dict.zip

外国人名中间·的拼音输入

偶然看到你小狼毫输入方案，感觉不错，试了一下，各方面满意。唯一的是外国人名中间·的拼音输入键似乎被改了，不知哪里可以设置？比如比尔盖茨中间的那个小圆点。

关于备份方面的问题

再Mac 鼠须管下面，因为输入法自带了同步用户数据功能，所以经常用这个备份。
但我查看了下，发现并没有备份cn_dicts, en_dicts, opencc这几个目录

opencc config not found

emoji相关的功能都无法实现报错里大概是这行有相关

I20221101 12:53:52.664253  2124 simplifier.cc:36] initializing opencc: C:\Users\Klein\AppData\Roaming\Rime\opencc\emoji.json
E20221101 12:53:52.673254  2124 simplifier.cc:45] opencc config not found: C:\Users\Klein\AppData\Roaming\Rime\opencc\emoji.json
I20221101 12:53:54.152715  2124 engine.cc:204] Oops, got a futile translation.

所使用的平台版本是https://github.com/fxliang/weasel/releases/tag/0.14.3_dev_0.95
搜了下opencc相关的东西但是不知道怎么排除问题

❯ opencc -c C:\Users\Klein\AppData\Roaming\Rime\opencc\emoji.json
Invalid format: The text dictionary contains duplicated keys: 一一一一一一一.

小鹤双拼下一个奇奇怪怪的bug。

在windows 11 使用小狼毫的小鹤双拼下输入“同”的时候打出 ts 首选是一串数字。且还不会因为使用其他选项把他优先顺序顶下去

ps：我用另外一台windows电脑也能复现这个问题

select-character 与方括号翻页冲突

见 wongdean/rime-settings#39 (comment)

建议删去lua代码中的默认键位, 如果要使用的话在配置文件中加上 key_binder/select_first_character key_binder/select_last_character

en_ext.dict.yaml 1665~1666行重复

词库en_ext.dict.yaml 1665行 1666行重复

1665: Impostor Factory
1666: Impostor Factory ImpostorFactory

pinyin_simp.schema.yaml 这两行不加引号会有什么问题吗？

这两行不加引号会有什么问题吗？

[需求]希望添加码长限制。

rime/weasel#733

里面的lua脚本研究了一下午实在不会添加，希望大佬能将这个lua合并。

请问怎么更新呢

现在用的很舒服，请问怎么和您的保持更新了。如果下载之后复制更换文件，一些自己做的设置（例如翻页、在某些app限定英文）不就被覆盖了吗？

希望得到您的解答，谢谢！

设置模糊音

在pinyin_simp.schema.yaml尝试设置模糊音，但部署后无法生效。

....
# 拼写设定
speller:
  # alphabet: zyxwvutsrqponmlkjihgfedcba
  # 因为 melt_eng 是以依赖的形式加载的，所以它自己的 alphabet 不管用，必须在此方案设定支持大写
  alphabet: zyxwvutsrqponmlkjihgfedcbaZYXWVUTSRQPONMLKJIHGFEDCBA
  delimiter: " '"
  algebra: 

    # 模糊音
    # en eng in ing
    - derive/([ei])n$/$1ng/            # en => eng, in => ing
    - derive/([ei])ng$/$1n/            # eng => en, ing => in
    # 模糊音定義先於簡拼定義，方可令簡拼支持以上模糊音  （https://gist.github.com/lotem/2320943）

    # 超级简拼
    - erase/^hm$/ # 响应超级简拼，取消「噷 hm」的独占
    - erase/^m$/  # 响应超级简拼，取消「呣 m」的独占
    - erase/^n$/  # 响应超级简拼，取消「嗯 n」的独占
    - erase/^ng$/ # 响应超级简拼，取消「嗯 ng」的独占
    - abbrev/^([a-z]).+$/$1/   # 超级简拼
    - abbrev/^([zcs]h).+$/$1/  # 超级简拼中，zh ch sh 视为整体（ch'sh → 城市），而不是像这样分开（c'h's'h → 吃好睡好）。
....

【问题】请问直接在腾讯词库中标明拼音会改善性能吗？

虽然目前是这样做，但如果直接注音是否会改善性能？
单纯出于疑问，不是request

---
name: tencent
version: "2022-11-18"
sort: by_weight
columns:
  - text
  - weight
...
# +_+
一一七	100

用了你的配置，有些字只打首字母打不出来，你也存在这个问题吗

比如 rmb 人民币，　
比如lm 或者 lim 李明黎明
只能打全拼才能出来。

如果我想加一个和主translator设置不一样的table_translator我应该怎么操作？
我在engine:translators:增加了table_translator@example，并且挂载了词库，但词库还是无效。
请问是不是一定要写一个新的scheme.yaml文件，并在其中的主translator上挂载才可以？
pinyin_simp.schema.yaml中的
dependencies:
- melt_eng
是必须的么？

关于使用个人词库双拼下不能在打词语最后一个字的首字母下出候选字，该如何解决。

是这样的，我使用Rime-ice的全拼方案根据下面官方收录的小鹤双拼rime-double-pinyin修改拼写规则，使用Rime-ice的词库可以按下 kdi (kai ch)、kdv (kai zh)、kdq (kai q)、hcq (hao q) 之类的提前出字。

但是使用我个人的词库却无法完全达到打词语最后一个字的首字母下出候选字，不知道怎么处理。

我的方案
rao_scheme.zip

可以直接添加双拼方案吗？

RT
请问能否直接导入双拼方案？

请问，如何给同文输入法部署这套方案呢？

双拼如何使用该词库

比较小白，修改了配置文件，使用双拼方案，但词库没有生效。大佬有时间帮帮孩子///

仓库：https://github.com/snxq/rime-ice

zhwiki: 重复的条目

只check了zhwiki,不确定其他字典中的情况

可以用以下项目把一些人名地名之类的移出来

https://github.com/fighting41love/funNLP/tree/master/data
https://github.com/fighting41love/funNLP/tree/master/data/%E4%B8%AD%E8%8B%B1%E6%97%A5%E6%96%87%E5%90%8D%E5%AD%97%E5%BA%93
https://github.com/xiangyuecn/AreaCity-JsSpider-StatsGov/releases
https://github.com/getActivity/ProvinceJson
https://github.com/modood/Administrative-divisions-of-China

部分名字name.txt

Caps_Lock: noop下 Backspace 按键会失效

请问下，双拼是不是就没办法使用英文字典？

双拼输入的字符会转化为音节，此时是以转化前的字符来查询英文字典还是转化后的？

抱歉，没有折腾过鼠须管，关于模糊音

第一次折腾鼠须管，问题比较白，
怎么添加模糊音，大概找了下，没有看到相关。

支持 rime_latex

能否进一步支持rime_latex (https://github.com/shenlebantongying/rime_latex), 以\开头来输入各种latex code从而得到相应symbols.

自定义短句如何添加？

目前用的是鼠须管，网上看了些，照做了，不知道哪里做的不对没有效果。

该怎么操作呢？

在哪个文件中修改？

🔴 关于 cn_tencent.dict.yaml

cn_tencent.dict.yaml 文件里红框的部分是不是多余的？
因为在 pinyin_simp.dict.yaml 文件已经导入了 8105 词典

该仓库如何使用?

需要先删除本地 rime 下的所有文件吗？还是直接覆盖就行？

在vscode中输入的时候，总是一跳一跳的。

使用环境：
系统：macos ven
软件：vscode+markdown all in one

在vscode中编辑markdown，每次输入的时候，那一行总是一跳一跳的，不知道要怎么解决。

🔴 关于「简化字八股文」

简化字八股文仓库：https://github.com/rime/rime-essay-simp

简化字八股文文件：https://github.com/rime/rime-essay-simp/blob/master/essay-zh-hans.txt

pinyin_simp.dict.yaml 文件里引用「简化字八股文」了「vocabulary: essay-zh-hans」
但是在仓库的文件里并没有「essay-zh-hans.txt」的文件

感觉固项词没有生效

如题，fixed 文件中定义的词感觉还是会加入动态调频的

请问有考虑过英文的临时造词模式吗

您好，我最近发现一个新玩法，就是可以使用临时前缀来让英文进入造词模式，拓充英文词库。
可以参考这个项目。

但是我尝试后发现两个问题，一是大写字母翻译后都会变成小写，二是造词功能好像不能生效。

请问怎么验证八股模型是否已生效

有没有标志性的一段话，可以方便验证的？

铸模是 zhu mu 还是 zhu mo?

腾讯AI Lab开源的汉语词汇语料库腾讯词向量

提取自腾讯词向量

Small (2,000,000)
Large (12,287,936)

删除掉不必要的条目以及单字条目，Large 再逆序生成词频，再把Small从Large 中交集出一份。
Large 和Small都分割成1-5个字的和5个字以上的两份文件。
感觉这玩意跟搜狗输入法的有点...嗯...熟悉

-_-y 有个别条目没有删干净，含有@等符号，不过不影响...

https://encrypt.lanzout.com/b06udvaxe
密码: 23fa

候选字有20个的时候，后面10个字要按哪个键位

上图

前面10个字是用键盘的1234567890
后面10个字要按哪个键位，好像都不行。

另外，就是本人想把后面的10个字往下挪动，就是单行变双行。怎么搞
我按ctrl+shift+p无效

关于短语的长度

你好！Dvel's
不知有无研究过短语的长度？我日常需要用到较长的短语，有时一个短语需要200多个汉字，但我发现一旦设置几个长一点的短语，在输入使用时，就会导致输入界面重启，很不理想。
于是做了几次测试，发现当候选词个数设置为5时，同一个码显示的词条字数合计超过287个汉字时，就会发生崩溃的情况。
当候选词个数设置为9时，同一个码显示的词条字数合计超过260个汉字时时，就会发生崩溃的情况。
请问你，不知道原作者的限制规则是怎样的？能不能通过设置进行扩展？谢谢！

小鹤双拼下又一个奇怪bug

在windows 11 使用小狼毫的小鹤双拼下打「输入」的时候按「uuru」时，候选第二个开始并非「shu」的候选而是日语「ru」的各种假名。

bug.mp4