24小时热门版块排行榜    

CyRhmU.jpeg
查看: 2250  |  回复: 15

cixiang

铁杆木虫 (正式写手)

引用回帖:
10楼: Originally posted by family086 at 2013-01-31 10:56:01
我实验室有多台电脑,能模拟集群吗,还需要哪些东西呢?...

多台就不用模拟了,就可以直接组个小集群了。需要的基本都是软件了。不过hadoop的安装比较麻烦,你可以去网上找找安装教程。

[ 发自手机版 http://muchong.com/3g ]
科研穷三代,读博毁一生
11楼2013-01-31 13:52:56
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

family086

禁虫 (初入文坛)

本帖内容被屏蔽

12楼2013-01-31 15:36:41
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

family086

禁虫 (初入文坛)

本帖内容被屏蔽

13楼2013-04-10 20:19:49
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

cixiang

铁杆木虫 (正式写手)

引用回帖:
13楼: Originally posted by family086 at 2013-04-10 20:19:49
您好,我想做网页文本分类,现在虚拟机下hadoop平台搭建好了,能以基于hadoop平台的文本分类为研究做毕业论文吗?求指点...

可以是可以,但是为什么你要用虚拟机下来搭建hadoop平台呢?为啥不用真实的机器搭建平台啊,这样实验跑出来的效果说服力比较弱啊。如果你想要做的是大幅度减少分类的时间,这样的平台实验效果说服力弱。如果你追求的是文本分类的精度,没必要非要用hadoop平台啊。小规模的文本分类感觉研究相对成熟了,大规模的话要看你有没有相应的数据集了。你也可以看看deep learning 的东西,看看能不能用这个来做大规模的文本分类。文本分类我不是内行,可能说的不太准确啊,呵呵
科研穷三代,读博毁一生
14楼2013-04-11 14:36:57
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

dameng

银虫 (小有名气)

大数据处理的理论研究现状,如果你想了解一下,哈工大的李建中现在就是专门搞这个,你可以问他实验室的学生。
研究方向:数据库。主要面向图数据管理、图数据挖掘、社会网络等。目前正在关注动态图算法。
15楼2013-04-11 16:45:09
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

fendor

银虫 (小有名气)

对于毫无经验的人搞大数据真的是纠结,纠结的很啊
有理想的人成也壮败也美
16楼2013-04-26 08:41:38
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 family086 的主题更新
信息提示
请填处理意见