OpenCC 字典格式转换教程:TXT、OCD、OCD2 完整指南
OpenCC 是常用的繁简转换工具,其字典主要有三种格式:
- TXT(可读可编辑)
- OCD(旧版字典格式)
- OCD2(新版字典格式)
本文介绍所有格式之间的互相转换方法,适用于 Linux、Ubuntu、Debian、CentOS、Alibaba Cloud Linux 等服务器。
📌 一、检查 opencc 与 opencc_dict 是否安装
✔ 查看 OpenCC 版本:
opencc -v
✔ 检查是否存在 opencc_dict:
opencc_dict -h
如果提示 command not found → 你的系统没有安装字典工具。
📌 二、TXT → OCD2(新版格式)
TXT 文件必须用 TAB 分隔:
麼 么
裏 里
麼麼 么么
使用以下命令转换为 ocd2:
opencc_dict -i dict.txt -o dict.ocd2 -f text -t ocd2
📌 三、OCD2 → TXT
将字典从 ocd2 解压回 txt:
opencc_dict -i dict.ocd2 -o dict.txt -f ocd2 -t text
📌 四、TXT → OCD(旧格式)
opencc_dict -i dict.txt -o dict.ocd -f text -t ocd
📌 五、OCD → TXT(旧格式)
opencc_dict -i dict.ocd -o dict.txt -f ocd -t text
📌 六、如果你的系统没有 opencc_dict
不同系统安装方法不同。
✔ Ubuntu / Debian
sudo apt install opencc-tools
或:
sudo apt install libopencc-tools
✔ CentOS / Alibaba Cloud Linux / Anolis OS
sudo yum install opencc-tools
若无该包,需要源码编译:
📌 七、源码编译 opencc_dict(通用方法)
① 安装必要环境
sudo yum install -y gcc gcc-c++ cmake git make
或 Ubuntu:
sudo apt install -y gcc g++ cmake git make
② 下载源码
git clone https://github.com/BYVoid/OpenCC.git
cd OpenCC
③ 编译
make
④ 安装
sudo make install
⑤ 添加软链接
sudo ln -s /usr/local/bin/opencc_dict /usr/bin/opencc_dict
📌 八、常见问题解答
❓ TXT 转换出错:“Tabular not found”
原因:使用了空格,应改为 TAB。
錯 错 ❌(错误,空格)
錯 错 ✔(正确,TAB)
❓ TXT 第一行乱码?(BOM 问题)
sed -i '1s/^\xEF\xBB\xBF//' dict.txt
❓ JSON 无法加载 ocd / ocd2?
检查 JSON 中的 file 路径是否一致。
📌 九、转换命令总结(速查表)
| 操作 | 命令 |
|---|---|
| TXT → OCD2 | opencc_dict -i t.txt -o t.ocd2 -f text -t ocd2 |
| OCD2 → TXT | opencc_dict -i t.ocd2 -o t.txt -f ocd2 -t text |
| TXT → OCD | opencc_dict -i t.txt -o t.ocd -f text -t ocd |
| OCD → TXT | opencc_dict -i t.ocd -o t.txt -f ocd -t text |
📌 十、总结
通过本教程,你可以轻松实现:
- TXT ↔ OCD(旧格式)
- TXT ↔ OCD2(新格式)
- 通过源码方式安装 opencc_dict 工具
发布者:彬彬笔记,转载请注明出处:https://www.binbinbiji.com/linux/3780.html