idvel / rime-ice Goto Github PK
View Code? Open in Web Editor NEWRime 配置:雾凇拼音 | 长期维护的简体词库
Home Page: https://dvel.me/posts/rime-ice/
License: GNU General Public License v3.0
Rime 配置:雾凇拼音 | 长期维护的简体词库
Home Page: https://dvel.me/posts/rime-ice/
License: GNU General Public License v3.0
我在default.custom.yaml这个文件中将默认的用"="和"-"翻页的两行设置注释掉,同时取消","和"."那两行的注释,
# paging_with_minus_equal: 翻页:- =
# - { when: has_menu, accept: minus, send: Page_Up }
# - { when: has_menu, accept: equal, send: Page_Down }
# paging_with_comma_period: 翻页:, .
- { when: paging, accept: comma, send: Page_Up }
- { when: has_menu, accept: period, send: Page_Down }
但是重新部署后快捷键完全不反应。我测试了如果设置用[]翻页是可以生效的。看了一圈也没找到答案,请问是哪里我忽视了吗?谢谢!
如:
一个坏消息 1
一个坏消息 1
...
一个好消息 1
一个好消息 1
只是偶然注意到,不确定是否还有更多重复词语,建议系统性去重。
你好,输入法和词库太好用了,感谢分享。
我注意到 在commit d35692a 更新了rime_ice.schema.yaml punctuator 部分的注释 ,表述的确更清晰易懂,但有一处不准确。
原为
# 引入自己的修改过的 symbols
punctuator:
# import_preset: symbols
import_preset: symbols_custom # 标点符号和 v 模式在里面
现为
# 标点符号
# 预设的 punctuation.yaml 包含了 full_shape half_shape (全角和半角的符号映射)
# 预设的 symbols.yaml 包含了 full_shape half_shape symbols
# symbols 的功能是支持以「/」前缀开头输出一系列字符,自定义的 symbols_custom.yaml 修改成了「v」开头。
punctuator:
# punctuator 部分 | symbols # 从应用目录引入自带的默认配置
import_preset: symbols_custom # 从 symbols_custom.yaml 引入自己自定义的
# half_shape: # 也可以直接在这里配置
由于 rime 自带的 punctuation.yaml 格式不完整,import_preset: punctuation 会部署失败,建议改为 import_preset: default
现代汉语词典7 是从官方app中提取出来做成的mdx词典,质量还是可靠的
偶然看到你小狼毫输入方案,感觉不错,试了一下,各方面满意。唯一的是外国人名中间·的拼音输入键似乎被改了,不知哪里可以设置?比如比尔 盖茨中间的那个小圆点。
25亿字语料汉字字频表
对于调整字频,或许有帮助。
如题
再Mac 鼠须管下面,因为输入法自带了同步用户数据功能,所以经常用这个备份。
但我查看了下,发现并没有备份cn_dicts, en_dicts, opencc这几个目录
emoji相关的功能都无法实现 报错里大概是这行有相关
I20221101 12:53:52.664253 2124 simplifier.cc:36] initializing opencc: C:\Users\Klein\AppData\Roaming\Rime\opencc\emoji.json
E20221101 12:53:52.673254 2124 simplifier.cc:45] opencc config not found: C:\Users\Klein\AppData\Roaming\Rime\opencc\emoji.json
I20221101 12:53:54.152715 2124 engine.cc:204] Oops, got a futile translation.
所使用的平台版本是https://github.com/fxliang/weasel/releases/tag/0.14.3_dev_0.95
搜了下opencc相关的东西但是不知道怎么排除问题
❯ opencc -c C:\Users\Klein\AppData\Roaming\Rime\opencc\emoji.json
Invalid format: The text dictionary contains duplicated keys: 一一一一一一一.
我想了解下原因,以便我下次遇到类似的问题的时候可以解决。
见 wongdean/rime-settings#39 (comment)
建议删去lua代码中的默认键位, 如果要使用的话在配置文件中加上 key_binder/select_first_character
key_binder/select_last_character
词库en_ext.dict.yaml 1665行 1666行 重复
1665: Impostor Factory
1666: Impostor Factory ImpostorFactory
请问
里面的lua脚本研究了一下午实在不会添加,希望大佬能将这个lua合并。
现在用的很舒服,请问怎么和您的保持更新了。如果下载之后复制更换文件,一些自己做的设置(例如翻页、在某些app限定英文)不就被覆盖了吗?
希望得到您的解答,谢谢!
在pinyin_simp.schema.yaml尝试设置模糊音,但部署后无法生效。
....
# 拼写设定
speller:
# alphabet: zyxwvutsrqponmlkjihgfedcba
# 因为 melt_eng 是以依赖的形式加载的,所以它自己的 alphabet 不管用,必须在此方案设定支持大写
alphabet: zyxwvutsrqponmlkjihgfedcbaZYXWVUTSRQPONMLKJIHGFEDCBA
delimiter: " '"
algebra:
# 模糊音
# en eng in ing
- derive/([ei])n$/$1ng/ # en => eng, in => ing
- derive/([ei])ng$/$1n/ # eng => en, ing => in
# 模糊音定義先於簡拼定義,方可令簡拼支持以上模糊音 (https://gist.github.com/lotem/2320943)
# 超级简拼
- erase/^hm$/ # 响应超级简拼,取消「噷 hm」的独占
- erase/^m$/ # 响应超级简拼,取消「呣 m」的独占
- erase/^n$/ # 响应超级简拼,取消「嗯 n」的独占
- erase/^ng$/ # 响应超级简拼,取消「嗯 ng」的独占
- abbrev/^([a-z]).+$/$1/ # 超级简拼
- abbrev/^([zcs]h).+$/$1/ # 超级简拼中,zh ch sh 视为整体(ch'sh → 城市),而不是像这样分开(c'h's'h → 吃好睡好)。
....
雀巣冰爽茶蜂蜜雪梨味
麦当劳雀巣冰爽茶蜂蜜雪梨味
虽然目前是这样做,但如果直接注音是否会改善性能?
单纯出于疑问,不是request
---
name: tencent
version: "2022-11-18"
sort: by_weight
columns:
- text
- weight
...
# +_+
一一七 100
当前Emoji中, 😝 对应 [可怕], 感觉应该用[😨 😱] 更为恰当?
比如:
笑得打滚儿 笑得打滚儿 🤣 🤣
尖叫 尖叫 😱 😱
感觉可以适度去重.
如果我想加一个和主translator设置不一样的table_translator我应该怎么操作?
我在engine:translators:增加了table_translator@example,并且挂载了词库,但词库还是无效。
请问是不是一定要写一个新的scheme.yaml文件,并在其中的主translator上挂载才可以?
pinyin_simp.schema.yaml中的
dependencies:
- melt_eng
是必须的么?
是这样的,我使用Rime-ice
的全拼方案根据下面官方收录的小鹤双拼rime-double-pinyin修改拼写规则,使用Rime-ice
的词库可以按下 kdi (kai ch)、kdv (kai zh)、kdq (kai q)、hcq (hao q) 之类的提前出字。
但是使用我个人的词库却无法完全达到打词语最后一个字的首字母下出候选字,不知道怎么处理。
我的方案
rao_scheme.zip
RT
请问能否直接导入双拼方案?
比较小白,修改了配置文件,使用双拼方案,但词库没有生效。大佬有时间帮帮孩子///
https://github.com/fighting41love/funNLP/tree/master/data
https://github.com/fighting41love/funNLP/tree/master/data/%E4%B8%AD%E8%8B%B1%E6%97%A5%E6%96%87%E5%90%8D%E5%AD%97%E5%BA%93
https://github.com/xiangyuecn/AreaCity-JsSpider-StatsGov/releases
https://github.com/getActivity/ProvinceJson
https://github.com/modood/Administrative-divisions-of-China
双拼输入的字符会转化为音节,此时是以转化前的字符来查询英文字典还是转化后的?
第一次折腾鼠须管,问题比较白,
怎么添加模糊音,大概找了下,没有看到相关。
能否进一步支持rime_latex (https://github.com/shenlebantongying/rime_latex), 以\开头来输入各种latex code从而得到相应symbols.
目前用的是鼠须管,网上看了些,照做了,不知道哪里做的不对没有效果。
该怎么操作呢?
在哪个文件中修改?
需要先删除本地 rime 下的所有文件吗?还是直接覆盖就行?
使用环境:
系统:macos ven
软件:vscode+markdown all in one
在vscode中编辑markdown,每次输入的时候,那一行总是一跳一跳的,不知道要怎么解决。
简化字八股文仓库:https://github.com/rime/rime-essay-simp
简化字八股文文件:https://github.com/rime/rime-essay-simp/blob/master/essay-zh-hans.txt
pinyin_simp.dict.yaml 文件里引用「简化字八股文」了「vocabulary: essay-zh-hans」
但是在仓库的文件里并没有「essay-zh-hans.txt」的文件
如题,fixed 文件中定义的词感觉还是会加入动态调频的
您好,我最近发现一个新玩法,就是可以使用临时前缀来让英文进入造词模式,拓充英文词库。
可以参考 这个项目。
但是我尝试后发现两个问题,一是大写字母翻译后都会变成小写,二是造词功能好像不能生效。
有没有标志性的一段话,可以方便验证的?
提取自腾讯词向量
Small (2,000,000)
Large (12,287,936)
删除掉不必要的条目以及单字条目,Large
再逆序生成词频,再把Small
从Large
中交集出一份。
Large
和Small
都分割成1-5个字的和5个字以上的两份文件。
感觉这玩意跟搜狗输入法的有点...嗯...熟悉
-_-y 有个别条目没有删干净,含有@等符号,不过不影响...
你好!Dvel's
不知有无研究过短语的长度?我日常需要用到较长的短语,有时一个短语需要200多个汉字,但我发现一旦设置几个长一点的短语,在输入使用时,就会导致输入界面重启,很不理想。
于是做了几次测试,发现当候选词个数设置为5时,同一个码显示的词条字数合计超过287个汉字时,就会发生崩溃的情况。
当候选词个数设置为9时,同一个码显示的词条字数合计超过260个汉字时时,就会发生崩溃的情况。
请问你,不知道原作者的限制规则是怎样的?能不能通过设置进行扩展?谢谢!
在windows 11 使用小狼毫的小鹤双拼下打「输入」的时候 按「uuru」时,候选第二个开始并非「shu」的候选而是日语「ru」的各种假名。
A declarative, efficient, and flexible JavaScript library for building user interfaces.
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
An Open Source Machine Learning Framework for Everyone
The Web framework for perfectionists with deadlines.
A PHP framework for web artisans
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
Some thing interesting about web. New door for the world.
A server is a program made to process requests and deliver data to clients.
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
Some thing interesting about visualization, use data art
Some thing interesting about game, make everyone happy.
We are working to build community through open source technology. NB: members must have two-factor auth.
Open source projects and samples from Microsoft.
Google ❤️ Open Source for everyone.
Alibaba Open Source for everyone
Data-Driven Documents codes.
China tencent open source team.