X为了获得更好的用户体验,请使用火狐、谷歌、360浏览器极速模式或IE8及以上版本的浏览器
APP下载
欢迎光临,请  登录  |  注册
尊敬的,欢迎光临!  [会员中心]    [退出登录]
成果
成果 专家 院校 需求 政策
当前位置: 首页 >  科技成果  > 详细页

[00022404]一种基于汉字混淆集的错字词知识生成方法

交易价格: 面议

所属行业: 分析仪器

类型: 发明专利

技术成熟度: 正在研发

专利所属地:中国

专利号:CN201510917790.4

交易方式: 完全转让 许可转让 技术入股

联系人: 江苏科技大学

所在地:江苏 镇江市

服务承诺
产权明晰
资料保密
对所交付的所有资料进行保密
如实描述
分享
|
收藏
|

技术详细介绍

本发明公开了一种基于汉字混淆集的错字词知识生成方法,该方法首先利用正确词词典和汉字混淆集生成混淆词集合;通过语料和规则对生成的混淆词集合进行剪枝完成初步过滤;再采用正向最大匹配分词对初步过滤完后的混淆词集合中的混淆词进行分词,根据预先设置的错字词判断规则利用统计知识对混淆词进行验证,最终生成错字词知识。本发明方法解决了现有的人工校对效率低且劳动量大的问题,利用本发明方法所得到的错字词知识进行自动校对和纠错,提高了中文文本自动校对的纠错质量和纠错速度。

推荐服务:

龙岩市科技创新服务平台

福建省龙岩市龙岩大道1号市行政办公中心

联系方式:0597-2601001,400-649-1633

|    关于我们    |    帮助中心    |

Copyright © 2019 龙岩市科技开发与科技特派员服务中心 版权所有

闽ICP备20015298号-1

闽公网安备 35080202351102号