• 欢迎来到老丁学习笔记

利用余弦定理计算中文文本相似度

python数据分析 laoding 2年前 (2017-10-05) 1666次浏览 0个评论

余弦定理计算相似度解释:http://www.ruanyifeng.com/blog/2013/03/cosine_similarity.html

用同一个文本测试两种方法,得出的结果如下:

利用余弦定理计算中文文本相似度

余弦定理计算相似度结果)

完整代码如下:

注:

1、上篇文章:利用gensim计算两个中文文档/字符串的相似度(链接地址:http://www.niumou.com.cn/194);

2、核心代码借鉴brooks;


老丁笔记,如未注明 , 均为原创,欢迎转载丨转载请注明利用余弦定理计算中文文本相似度
喜欢 (1)
发表我的评论
取消评论
表情 贴图 加粗 删除线 居中 斜体 签到

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址