| 查看: 395 | 回复: 0 | ||
[求助]
有人熟悉网页去重的shingling算法吗?
|
|
super-shingling算法是在shingling算法基础上进行的修改,shingling算法也叫shingle算法,主要用来对搜索引擎的检索结果去重,也可以用来做文本聚类,最近小弟想实现一下,但是老板要求工期太紧了,时间不够,想向大家请教一下,有没有shingle开源的java代码? 或者有类似做这个方向的,大家一起交流一下。 [ Last edited by ttmusic on 2011-5-7 at 11:19 ] |
» 猜你喜欢
依托企业入选了国家启明计划青年人才。有无高校可以引进的。
已经有14人回复
表哥与省会女结婚,父母去帮带孩子被省会女气回家生重病了
已经有11人回复
江汉大学解明教授课题组招博士研究生/博士后
已经有3人回复
AI 太可怕了,写基金时,提出想法,直接生成的文字比自己想得深远,还有科学性
已经有11人回复
同年申请2项不同项目,第1个项目里不写第2个项目的信息,可以吗
已经有10人回复
依托企业入选了国家启明计划青年人才。有无高校可以引进的。
已经有11人回复
找到一些相关的精华帖子,希望有用哦~
《电网技术》要求作者修改,却没有外审意见,有人遇到过吗?
已经有7人回复
今年3月份的法国复合材料(JEC)展会有没有人去?
已经有3人回复
有没有人知道气体吸收瓶里面那层石英筛板孔径是多少?重赏!!!
已经有5人回复
资源与环境信息系统国家重点实验室石坚论坛第9讲会议通知
已经有6人回复
有人做过用石油醚-甲醇重结晶的么?
已经有9人回复
液相测试 峰面积重现性很差?该怎么办才好?
已经有12人回复
重金!关于udf的问题!
已经有5人回复
回家还是去上海
已经有3人回复
咨询中国原子能科学研究院怎么样?(必有重谢)
已经有22人回复
科研从小木虫开始,人人为我,我为人人













回复此楼
点击这里搜索更多相关资源