24小时热门版块排行榜    

CyRhmU.jpeg
查看: 2436  |  回复: 6
当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖

babaozhu

新虫 (初入文坛)

[求助] 关于语义特征提取的问题已有2人参与

求解答!拜谢

老板提了这样一个课题,比如给你一百句话,将他们聚类成几个簇,使得每个簇的语义相近。
当然可能实际的数据大小不止一百句。
我想知道如何将一句话当中的词汇转换为一组特征
这个怎么用matlab实现?
总不能是一句话一句话的分词吧。。。

我自己找了一些文本相关的论文
很多都是对文档当中的词频进行统计
感觉这种方法对语句这种不太行,同一个意思可能有多种表达方式,如果纯用词频可能并不精确
回复此楼

» 猜你喜欢

» 本主题相关价值贴推荐,对您同样有帮助:

已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

胡不归

木虫 (正式写手)

用word2vect对分词后的每个词建立一个对应的矢量,再利用相似性原则判断句子之间的接近程度,即分簇。
7楼2016-12-24 11:59:56
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 babaozhu 的主题更新
信息提示
请填处理意见