与五笔输入法不同的是,拼音输入法的“重码”现象比较严重,这就使得拼音输入法厂商必须想办法优化智能组词算法,来提高首选词准确率(即候选的第一个词就是要输入的词的比例)。在搜狗拼音输入法2.0时代,其首选词准确率就被认为是拼音输入法中最高的。据称搜狗拼音输入法3.0正式版的词库核心有了较大改进,智能组词算法更先进。
为了真实的测试搜狗拼音输入法3.0正式版的首选词准确率,我从网络上随机选取了一百个词语作为测试样本,其中既有热门词汇,也有一些并不太常见的词语,来对比测试3.0正式版和2.0正式版,限于篇幅,本文选取其中20个作为说明。
| 搜狗拼音3.0版与2.0版的首选词准确率 | ||
| 词语样本 | 搜狗拼音输入法2.0 |
搜狗拼音输入法3.0 |
| 以厂为家> | 一场为佳> | 以厂为家> |
| 百不当一> | 摆布当以> | 百不当一> |
| 八面威风> | 八面威风> | 八面威风> |
| 天长日久> | 天长日久> | 天长日久> |
| 盛名之下其实难副> | 盛名之下其实南孚> | 盛名之下其实难副> |
| 爱国如家> | 爱国儒家> | 爱国儒家> |
| 盛情难却> | 盛情难却> | 盛情难却> |
| 西边日出东边雨> | 西边日出东便于> | 西边日出东边雨> |
| 师出无名> | 使出无名> | 师出无名> |
| 你是风儿我是沙> | 你是风儿我是沙> | 你是风儿我是沙> |
| 桃李不言下自成蹊> | 桃李不言下自成器> | 桃李不言瞎子称其> |
| 树倒猢狲散> | 数到户孙三> | 树倒猢狲散> |
| 风轻云淡> | 风轻云淡> | 风轻云淡> |
| 久而久之> | 久而久之> | 久而久之> |
| 国庆黄金周> | 国庆黄金周> | 国庆黄金周> |
| 北方男人> | 北方男人> | 北方男人> |
| 夜宴> | 夜宴> | 夜宴> |
| 美国大片> | 美国大片> | 美国大片> |
| 十载寒窗> | 十载寒窗> | 是在寒窗> |
| 识二五而不知十> | 十二五而不只是> | 十二五而不只是> |
| 准确率 | 60% | 88% |
从上面的测试结果中,我们不难看出,搜狗拼音输入法3.0正式版在首选词准确率上有了大大的提高。
最新相关文章
发表评论