| 查看: 185 | 回复: 0 | |||
[求助]
找出字符串所共有的模式,自然语言处理问题
|
|
现在有一堆字符串,比如ACBD,CEBDFE,ACF,...等等,有没有什么方法可以找出这些字符串中所共有的一些模式,比如AC,DB之类的,字符串的数量级是在100K左右的。 我想到的方法是,可不可以先用<1,3,2,4>来表示ACDB字符串,然后用聚类找出比较相近的字符串,不过这个方法只是对相同长度的字符串有比较好的效果,不知道有没有其他方法可以解决这个问题,谢谢。有任何想法都可以说哦 [ Last edited by michaelym on 2011-6-29 at 22:29 ] |
» 猜你喜欢
之前让一硕士生水了7个发明专利,现在这7个获批发明专利的维护费可从哪儿支出哈?
已经有9人回复
心脉受损
已经有6人回复
博士申请都是内定的吗?
已经有8人回复
博士读完未来一定会好吗
已经有32人回复
读博
已经有5人回复
投稿精细化工
已经有4人回复
高职单位投计算机相关的北核或SCI四区期刊推荐,求支招!
已经有4人回复
导师想让我从独立一作变成了共一第一
已经有9人回复
Springer期刊投稿求助
已经有4人回复
找到一些相关的精华帖子,希望有用哦~
自然基金的同类型项目
已经有3人回复
紧急求助:发现了一篇外国人的文章中理论推导有误,该如何处理?
已经有8人回复
2012年国基申请是用“2011年度国家自然科学基金申请书”吗
已经有13人回复
辞职换单位的话,自然科学基金青年基金能带走么?
已经有8人回复
求助一句话翻译(农业/生态学)
已经有2人回复
【求助】各位前辈,关于信息提取,自然语言处理问题,请各位帮帮忙
已经有5人回复
【趣闻】《自然》:科学家发现迄今最强恒星黑洞喷射物
已经有3人回复
【求助】结果文件中字符串的搜索程序
已经有5人回复
科研从小木虫开始,人人为我,我为人人













回复此楼
点击这里搜索更多相关资源