感谢兰友Evanee,本文根据他最初的步骤进行整理而得
主要目的
将搜狗积累的词库转换为幽兰默认输入法fcitx5可用的词典文件。
步骤
- 搜狗输入法中备份词库-sogou.bin;
- 使用git“深蓝词库转换”将搜狗词库转为libpinyin格式-libpinyin.txt;
GitHub链接 - 对libpinyin.txt进行处理,对中文+英文的词组进行删除,比如“我的IP地址”,“按reset”这类词组。
一种处理方法是在幽兰vim里面用通配符匹配删除。:g/[[:alpha:]] /d 1 :g/[^\x00-\xff]\w/d 1
- 在幽兰上转换词典文件,执行
libime_pinyindict libpinyin.txt sougou.dict
- 将词典文件sougou.dict拷贝到幽兰
~/.local/share/fcitx5/pinyin/dictionaries
- 重启幽兰,正常的话在输入法设置里面可以看到词典文件已加载。
参考资料
- https://github.com/felixonmars/fcitx5-pinyin-zhwiki/releases
- https://github.com/wuhgit/CustomPinyinDictionary
- https://wiki.archlinux.org/title/Fcitx5#Import_Sogou_words_library
作者:沈根成 创建时间:2023-06-08 17:29
最后编辑:Zhang Yinkui 更新时间:2024-11-15 17:44
最后编辑:Zhang Yinkui 更新时间:2024-11-15 17:44