24小时热门版块排行榜    

查看: 691  |  回复: 11
当前主题已经存档。

feinix

金虫 (正式写手)

[交流] 【求助】请教,如有回答在下不胜感激【已搜无重复】

老板说你喜欢什么方向就选什么方向,由于我老板主要带数据挖掘。
我想选文本挖掘……
看了好多文本聚类的论文,发现一个个算法,不知道都是怎么实现的……比如用如何的工具,数据从何而来,还能画出来性能的图像。实在是不解,主要由于不上路,有没有兄弟肯帮帮我的上路,山东人在此多谢了!

[ Last edited by sinapdb on 2008-9-8 at 12:54 ]
回复此楼
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

jingtaocst

银虫 (小有名气)

★ ★
sinapdb(金币+2,VIP+0):thanks
一般论文后面都有实验部分,那里会提到所用的数据集和实现工具。会JAVA可以试试WEKA,会MATLAB可以直接用其自带的聚类工具箱。在GOOGLE上还可以搜到一些源码,自己好好找找吧。
2楼2008-09-05 08:43:58
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

feinix

金虫 (正式写手)

多谢楼下兄弟。我再仔细看看……
3楼2008-10-08 09:10:26
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

塞外飞雪

金虫 (初入文坛)


bslt(金币+1,VIP+0):鼓励交流,奖励一下! 5-7 12:17
如果使用matlab那么一般就有直接的函数可以调用了,matlab自带的,可以上网搜搜,如果用vc自己编,你自己要首先将你选用的聚类方法看懂,然后自己实现出来。
4楼2008-10-29 19:30:42
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

摘星者

铁杆木虫 (正式写手)


bslt(金币+1,VIP+0):欢迎常来信息版交流讨论! 5-7 12:18
算法思想和步骤都写在文章里,自己编写就是了。个人使用的是C,也有用matlab和java的。有个别作者会将源代码放在个人主页上。你也可以向作者索要,有些作者会给的。

实验数据集网上有,看看别人用什么就知道了,用的较多的有UCI, Statlog, StatLib。
5楼2008-11-01 16:05:09
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

feinix

金虫 (正式写手)

多谢楼上两位!
6楼2008-11-05 09:46:26
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

想飞的猪

木虫 (正式写手)

★ ★
gjliu(金币+2,VIP+0):good 5-9 08:28
1、数据如何而来:
阁下做的是文本挖掘(不是很了解),既然是文本,那么数据的来源就是不同形式内容的文本文件了吧,那么我认为你第一步要做的是用某种语言(推荐C/C++)实现文本文件的读取!然后再根据你的需要,进行操作,我想会有文本的规范化、编码、特征提取什么的吧!但是最关键的是要会对文本进行操作!

2、画图像:
那MATLAB是最方便的了,当然如果要做那种实时的或在线的我感觉C/C++应该更好点!但是你去要花一些时间来学习这些编程语言!我自己编一个可以在可视化程序里画线(暂时是二维的目前正准备用OpenGL画高维的)的程序!

3、对于如何实现你看得算法:
我想有两件事:一你要真正看懂那些东西,二就是你要会编程序!当你编一些程序的时候你就会自然的把算法的东西在头脑中转化为程序格式了!

加油!
7楼2009-05-07 18:18:25
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

levone

木虫 (正式写手)


gjliu(金币+1,VIP+0):nice! 5-9 08:28
我们实验室在做支持向量机,用的是Matlab中的工具箱。
网上有很多,建议楼主从根源抓起。找一下自己这个方向的鼻祖人物,翻翻他们的论文、文章。顺藤摸瓜……
莫愁前途无知己!
8楼2009-05-07 23:37:39
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

tianshui

银虫 (正式写手)


bslt(金币+1,VIP+0):感谢交流。。。 6-16 11:59
呵呵,我也是搞数据挖掘的,这方面的知识很多的:
如:神经网络 遗传算法 微粒群  粗糙集 模糊集合 聚类,我感觉神经网络 粗糙集 模糊集的发展方向很好的
滴自己的汗,吃自己的饭,自己的事情自己办,不抱怨,不诉苦,走一步,是一步,一路朝前不回头,死到哪站算哪站。
9楼2009-06-12 19:27:16
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

wjiahai

木虫 (小有名气)


小木虫(金币+0.5):给个红包,谢谢回帖交流
还有智能数据挖掘的。如粒子群,微分演化,免疫计算可以做关联分类,投影聚类等,多目标关联规则挖掘等,也很有前途。
10楼2009-06-29 08:11:48
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 feinix 的主题更新
普通表情 高级回复 (可上传附件)
最具人气热帖推荐 [查看全部] 作者 回/看 最后发表
[公派出国] 售SCI一区文章,我:8 O5 51O 54,科目齐全 +3 5lbyq5wrhb 2026-02-07 3/150 2026-02-08 03:05 by vs90ilomwc
[考博] 售SCI一区文章,我:8 O5 51O 54,科目齐全 +3 5lbyq5wrhb 2026-02-07 3/150 2026-02-08 02:52 by vs90ilomwc
[论文投稿] 售SCI一区文章,我:8 O5 51O 54,科目齐全 +3 3rkserf6qr 2026-02-07 4/200 2026-02-08 02:45 by vs90ilomwc
[硕博家园] 售SCI一区文章,我:8 O5 51O 54,科目齐全 +3 3rkserf6qr 2026-02-07 3/150 2026-02-08 02:32 by vs90ilomwc
[硕博家园] 售SCI一区文章,我:8 O5 51O 54,科目齐全 +5 2h7du0nuhk 2026-02-07 5/250 2026-02-08 02:27 by vs90ilomwc
[考博] 售SCI一区文章,我:8 O5 51O 54,科目齐全 +4 2h7du0nuhk 2026-02-07 6/300 2026-02-08 02:07 by vs90ilomwc
[教师之家] 售SCI一区文章,我:8 O5 51O 54,科目齐全 +4 2h7du0nuhk 2026-02-07 6/300 2026-02-08 02:05 by vs90ilomwc
[找工作] 售SCI一区文章,我:8 O5 51O 54,科目齐全 +4 2h7du0nuhk 2026-02-07 6/300 2026-02-08 01:46 by vs90ilomwc
[公派出国] 售SCI一区文章,我:8 O5 51O 54,科目齐全 +4 2h7du0nuhk 2026-02-07 7/350 2026-02-08 01:45 by vs90ilomwc
[考博] 售SCI一区文章,我:8 O5 51O 54,科目齐全 +4 2h7du0nuhk 2026-02-07 7/350 2026-02-08 01:32 by vs90ilomwc
[教师之家] 售SCI一区文章,我:8 O5 51O 54,科目齐全 +4 2h7du0nuhk 2026-02-07 7/350 2026-02-08 01:26 by vs90ilomwc
[硕博家园] 售SCI一区文章,我:8 O5 51O 54,科目齐全 +4 2h7du0nuhk 2026-02-07 7/350 2026-02-08 01:12 by vs90ilomwc
[教师之家] 有院领导为了换新车,用横向课题经费买了俩车 +7 瞬息宇宙 2026-02-04 7/350 2026-02-07 21:47 by tfang
[有机交流] 酰胺脱乙酰基 10+5 chibby 2026-02-03 12/600 2026-02-07 19:29 by 江东闲人
[基金申请] 同年申请2项不同项目,第1个项目里不写第2个项目的信息,可以吗 +4 hitsdu 2026-02-06 4/200 2026-02-07 13:07 by jurkat.1640
[基金申请] 有时候真觉得大城市人没有县城人甚至个体户幸福 +9 苏东坡二世 2026-02-04 10/500 2026-02-07 12:37 by 小毛球
[考博] 天津大学招2026.09的博士生,欢迎大家推荐交流(博导是本人) +4 a793625982 2026-02-05 5/250 2026-02-07 10:57 by a793625982
[公派出国] CSC & MSCA 博洛尼亚大学能源材料课题组博士/博士后招生|MSCA经费充足、排名优 +4 雨念 2026-02-01 6/300 2026-02-06 23:32 by MelissaPon
[基金申请] 面上项目申报 +3 Tide man 2026-02-01 3/150 2026-02-05 22:56 by god_tian
[教师之家] 遇见不省心的家人很难过 +18 otani 2026-02-03 22/1100 2026-02-04 11:06 by tangmnt
信息提示
请填处理意见