24小时热门版块排行榜    

CyRhmU.jpeg
查看: 592  |  回复: 11
当前主题已经存档。
当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖

feinix

金虫 (正式写手)

[交流] 【求助】请教,如有回答在下不胜感激【已搜无重复】

老板说你喜欢什么方向就选什么方向,由于我老板主要带数据挖掘。
我想选文本挖掘……
看了好多文本聚类的论文,发现一个个算法,不知道都是怎么实现的……比如用如何的工具,数据从何而来,还能画出来性能的图像。实在是不解,主要由于不上路,有没有兄弟肯帮帮我的上路,山东人在此多谢了!

[ Last edited by sinapdb on 2008-9-8 at 12:54 ]
回复此楼
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

想飞的猪

木虫 (正式写手)

★ ★
gjliu(金币+2,VIP+0):good 5-9 08:28
1、数据如何而来:
阁下做的是文本挖掘(不是很了解),既然是文本,那么数据的来源就是不同形式内容的文本文件了吧,那么我认为你第一步要做的是用某种语言(推荐C/C++)实现文本文件的读取!然后再根据你的需要,进行操作,我想会有文本的规范化、编码、特征提取什么的吧!但是最关键的是要会对文本进行操作!

2、画图像:
那MATLAB是最方便的了,当然如果要做那种实时的或在线的我感觉C/C++应该更好点!但是你去要花一些时间来学习这些编程语言!我自己编一个可以在可视化程序里画线(暂时是二维的目前正准备用OpenGL画高维的)的程序!

3、对于如何实现你看得算法:
我想有两件事:一你要真正看懂那些东西,二就是你要会编程序!当你编一些程序的时候你就会自然的把算法的东西在头脑中转化为程序格式了!

加油!
7楼2009-05-07 18:18:25
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
查看全部 12 个回答

jingtaocst

银虫 (小有名气)

★ ★
sinapdb(金币+2,VIP+0):thanks
一般论文后面都有实验部分,那里会提到所用的数据集和实现工具。会JAVA可以试试WEKA,会MATLAB可以直接用其自带的聚类工具箱。在GOOGLE上还可以搜到一些源码,自己好好找找吧。
2楼2008-09-05 08:43:58
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

feinix

金虫 (正式写手)

多谢楼下兄弟。我再仔细看看……
3楼2008-10-08 09:10:26
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

塞外飞雪

金虫 (初入文坛)


bslt(金币+1,VIP+0):鼓励交流,奖励一下! 5-7 12:17
如果使用matlab那么一般就有直接的函数可以调用了,matlab自带的,可以上网搜搜,如果用vc自己编,你自己要首先将你选用的聚类方法看懂,然后自己实现出来。
4楼2008-10-29 19:30:42
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
普通表情 高级回复(可上传附件)
信息提示
请填处理意见