| 查看: 187 | 回复: 0 | ||
[求助]
找出字符串所共有的模式,自然语言处理问题
|
|
现在有一堆字符串,比如ACBD,CEBDFE,ACF,...等等,有没有什么方法可以找出这些字符串中所共有的一些模式,比如AC,DB之类的,字符串的数量级是在100K左右的。 我想到的方法是,可不可以先用<1,3,2,4>来表示ACDB字符串,然后用聚类找出比较相近的字符串,不过这个方法只是对相同长度的字符串有比较好的效果,不知道有没有其他方法可以解决这个问题,谢谢。有任何想法都可以说哦 [ Last edited by michaelym on 2011-6-29 at 22:29 ] |
» 猜你喜欢
基金委咋了?2026年的指南还没有出来?
已经有9人回复
拟解决的关键科学问题还要不要写
已经有4人回复
基金申报
已经有5人回复
国自然申请面上模板最新2026版出了吗?
已经有17人回复
纳米粒子粒径的测量
已经有8人回复
疑惑?
已经有5人回复
计算机、0854电子信息(085401-058412)调剂
已经有5人回复
Materials Today Chemistry审稿周期
已经有5人回复
溴的反应液脱色
已经有7人回复
推荐一本书
已经有12人回复
找到一些相关的精华帖子,希望有用哦~
自然基金的同类型项目
已经有3人回复
紧急求助:发现了一篇外国人的文章中理论推导有误,该如何处理?
已经有8人回复
2012年国基申请是用“2011年度国家自然科学基金申请书”吗
已经有13人回复
辞职换单位的话,自然科学基金青年基金能带走么?
已经有8人回复
求助一句话翻译(农业/生态学)
已经有2人回复
【求助】各位前辈,关于信息提取,自然语言处理问题,请各位帮帮忙
已经有5人回复
【趣闻】《自然》:科学家发现迄今最强恒星黑洞喷射物
已经有3人回复
【求助】结果文件中字符串的搜索程序
已经有5人回复
科研从小木虫开始,人人为我,我为人人











回复此楼
点击这里搜索更多相关资源