感谢兰友Evanee,本文根据他最初的步骤进行整理而得

主要目的

将搜狗积累的词库转换为幽兰默认输入法fcitx5可用的词典文件。

步骤

  1. 搜狗输入法中备份词库-sogou.bin;
  2. 使用git“深蓝词库转换”将搜狗词库转为libpinyin格式-libpinyin.txt;
    GitHub链接
  3. 对libpinyin.txt进行处理,对中文+英文的词组进行删除,比如“我的IP地址”,“按reset”这类词组。
    一种处理方法是在幽兰vim里面用通配符匹配删除。
    :g/[[:alpha:]] /d 1    
    :g/[^\x00-\xff]\w/d 1
  4. 在幽兰上转换词典文件,执行libime_pinyindict libpinyin.txt sougou.dict
  5. 将词典文件sougou.dict拷贝到幽兰 ~/.local/share/fcitx5/pinyin/dictionaries
  6. 重启幽兰,正常的话在输入法设置里面可以看到词典文件已加载。

参考资料

  1. https://github.com/felixonmars/fcitx5-pinyin-zhwiki/releases
  2. https://github.com/wuhgit/CustomPinyinDictionary
  3. https://wiki.archlinux.org/title/Fcitx5#Import_Sogou_words_library
作者:沈根成  创建时间:2023-06-08 17:29
最后编辑:Zhang Yinkui  更新时间:2024-12-20 17:01