24小时热门版块排行榜    

查看: 185  |  回复: 0

michaelym

新虫 (初入文坛)

[求助] 找出字符串所共有的模式,自然语言处理问题

现在有一堆字符串,比如ACBD,CEBDFE,ACF,...等等,有没有什么方法可以找出这些字符串中所共有的一些模式,比如AC,DB之类的,字符串的数量级是在100K左右的。

我想到的方法是,可不可以先用<1,3,2,4>来表示ACDB字符串,然后用聚类找出比较相近的字符串,不过这个方法只是对相同长度的字符串有比较好的效果,不知道有没有其他方法可以解决这个问题,谢谢。有任何想法都可以说哦

[ Last edited by michaelym on 2011-6-29 at 22:29 ]
回复此楼
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

智能机器人

Robot (super robot)

我们都爱小木虫

相关版块跳转 我要订阅楼主 michaelym 的主题更新
信息提示
请填处理意见