X为了获得更好的用户体验,请使用火狐、谷歌、360浏览器极速模式或IE8及以上版本的浏览器
APP下载
欢迎光临,请  登录  |  注册
尊敬的,欢迎光临!  [会员中心]    [退出登录]
成果
成果 专家 院校 需求 政策
当前位置: 首页 >  科技成果  > 详细页

[00044644]一种改进的SimHash代码相似度检测方法

交易价格: 面议

所属行业: 分析仪器

类型: 发明专利

技术成熟度: 正在研发

专利所属地:中国

专利号:CN201611203147.6

交易方式: 完全转让 许可转让 技术入股

联系人: 浙江工业大学

所在地:浙江 杭州市

服务承诺
产权明晰
资料保密
对所交付的所有资料进行保密
如实描述
分享
|
收藏
|

技术详细介绍

一种改进的SimHash代码相似度检测方法,包括以下步骤1)分词;2)hash;3)加权;4)合并将各个特征向量经过hash加权之后的结果累加,变成只有一个序列串;5)减值通过整理分析,选择一个阈值T,将最后合并得到的结果序列串每一项减去设定的阈值T,得到最终的结果序列串;6)降维对于n‑bit签名的累加结果进行降维处理,即对于最终序列串上的每一位,若大于0则置1,否则置0,从而得到该语句的simhash值,最后根据不同语句的simhash值的海明距离来判断它们的相似度。本发明提供了一种准确性较高的改进的SimHash代码相似度检测方法。

推荐服务:

龙岩市科技创新服务平台

福建省龙岩市龙岩大道1号市行政办公中心

联系方式:0597-2601001,400-649-1633

|    关于我们    |    帮助中心    |

Copyright © 2019 龙岩市科技开发与科技特派员服务中心 版权所有

闽ICP备20015298号-1

闽公网安备 35080202351102号