| 查看: 385 | 回复: 0 | ||
[求助]
有人熟悉网页去重的shingling算法吗?
|
|
super-shingling算法是在shingling算法基础上进行的修改,shingling算法也叫shingle算法,主要用来对搜索引擎的检索结果去重,也可以用来做文本聚类,最近小弟想实现一下,但是老板要求工期太紧了,时间不够,想向大家请教一下,有没有shingle开源的java代码? 或者有类似做这个方向的,大家一起交流一下。 [ Last edited by ttmusic on 2011-5-7 at 11:19 ] |
» 猜你喜欢
存款400万可以在学校里躺平吗
已经有5人回复
拟解决的关键科学问题还要不要写
已经有5人回复
基金委咋了?2026年的指南还没有出来?
已经有9人回复
基金申报
已经有5人回复
国自然申请面上模板最新2026版出了吗?
已经有17人回复
纳米粒子粒径的测量
已经有8人回复
疑惑?
已经有5人回复
计算机、0854电子信息(085401-058412)调剂
已经有5人回复
Materials Today Chemistry审稿周期
已经有5人回复
溴的反应液脱色
已经有7人回复
找到一些相关的精华帖子,希望有用哦~
《电网技术》要求作者修改,却没有外审意见,有人遇到过吗?
已经有7人回复
今年3月份的法国复合材料(JEC)展会有没有人去?
已经有3人回复
有没有人知道气体吸收瓶里面那层石英筛板孔径是多少?重赏!!!
已经有5人回复
资源与环境信息系统国家重点实验室石坚论坛第9讲会议通知
已经有6人回复
有人做过用石油醚-甲醇重结晶的么?
已经有9人回复
液相测试 峰面积重现性很差?该怎么办才好?
已经有12人回复
重金!关于udf的问题!
已经有5人回复
回家还是去上海
已经有3人回复
咨询中国原子能科学研究院怎么样?(必有重谢)
已经有22人回复
科研从小木虫开始,人人为我,我为人人











回复此楼
点击这里搜索更多相关资源