博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
折腾MDX词典
阅读量:5807 次
发布时间:2019-06-18

本文共 565 字,大约阅读时间需要 1 分钟。

  hot3.png

最近才知道GoldenDict,结果玩起来一发不可收拾

下载了一堆字典,很多格式太丑或词库不佳,于是自己加工了一轮

主要工具是:GetDict(2.6比较强,能导出MDD),MdxBuilder(3.0比较强,能生成MDD,但生成MDX会比较慢)。需要注意的是生成MDD时最好找个比较空的单词库文件,不明白为什么直接生成MDD,非要附带词库。

最后选中的词库为:

1、单词释义比例词典

2、简明英汉词典(在网上320W的基础上过滤掉组合词,留下60W,并删除“托六研。。。”)
3、剑桥高阶英汉双解词典(从学习角度不推荐)
4、剑桥高阶英英词典(在双解的基础上,把中文隐藏到title中,兼顾学习与提示,未充分处理好,不推荐)
5、开源汉英词典(CC-CEDICT,原样式难看得一蹋糊涂)
6、现代汉英词典(在现代汉英大词典37W基础上留下9W)
7、柯林斯英英词典V2 (调整样式)
8、柯林斯英汉词典V2 (在众筹的双解基础上,把中文隐藏到title)
9、电力双向词典(在网上版本的基础上过滤掉大量组合词、过滤掉在其他词库有的中英文词、合并重复词,修改更简洁的样式)

这里充分照顾了汉英、英汉、英英、电力的需求,词库量也够大,还算满意

转载于:https://my.oschina.net/sqhua/blog/896030

你可能感兴趣的文章
Redis学习笔记(1)-Key
查看>>
头条笔试题 分配任务
查看>>
数据库知识
查看>>
走出浮躁的泥沼:浮躁的社会原因
查看>>
SQL-20 查找员工编号emp_no为10001其自入职以来的薪水salary涨幅值growth
查看>>
【哈希表】Ural Championship April 30, 2017 Problem H. Hamburgers
查看>>
JS作用域理解(声明提升)
查看>>
Tomcat 系统架构与设计模式
查看>>
相似文本文档分析之SimHash算法
查看>>
【CodeForces】901 C. Bipartite Segments
查看>>
【BZOJ】1709: [Usaco2007 Oct]Super Paintball超级弹珠
查看>>
几种不同的json格式解析
查看>>
leetcode 45: Permutations
查看>>
被苹果店气走之后继续寻求售后服务的经历
查看>>
ASP.NET的一次奇遇:UserControl写成Control引发的w3wp进程崩溃
查看>>
Android Gradle 自定义任务执行命令行
查看>>
linux中常见命令操作(转)
查看>>
关于Unity树形插件Tree View Control的相关搜集
查看>>
Unhandled Exception:System.DllNotFoundException: Unable to load DLL"**":找不到指定的模块
查看>>
数组中连续重复数据删选且记下所在索引-demo
查看>>