| 查看: 1720 | 回复: 10 | ||
| 当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖 | ||
[求助]
云计算环境下的海量数据挖掘研究步骤是什么?从何处着手?先做什么后做什么? 已有3人参与
|
||
|
最近想做“元计算环境下的海量数据挖掘”研究,可是找不到头绪,不懂该从何处着手。是要先搭建云平台,然后从网络上获取海量数据,然后数据清理再把数据弄到云平台进行挖掘? 感觉做这个课题要做的事情好多哦,也不知道该找什么点来研究有价值。有没有办法做个算法研究然后用一个编程软件就可以实现验证的?或者拿到实际的海量数据之后用一个编程软件 就挖掘出想要的结果? 久了不搞科研,真的是一个头两个大,毫无头绪,不知道该做什么研究好。 |
» 猜你喜欢
国自然申请面上模板最新2026版出了吗?
已经有7人回复
常年博士招收(双一流,工科)
已经有4人回复
推荐一本书
已经有10人回复
纳米粒子粒径的测量
已经有6人回复
溴的反应液脱色
已经有4人回复
参与限项
已经有5人回复
有没有人能给点建议
已经有5人回复
假如你的研究生提出不合理要求
已经有12人回复
萌生出自己或许不适合搞科研的想法,现在跑or等等看?
已经有4人回复
Materials Today Chemistry审稿周期
已经有4人回复
» 本主题相关价值贴推荐,对您同样有帮助:
stanford大学--大数据挖掘PPT
已经有412人回复
《云计算与数据挖掘》很不错的PPT,分享一下
已经有683人回复
中科院深圳先进技术研究院2011年校园招聘开始了,敬请关注,待遇已补上
已经有79人回复

zzhlgzz
木虫 (正式写手)
- 应助: 56 (初中生)
- 金币: 5042.1
- 散金: 198
- 红花: 20
- 帖子: 928
- 在线: 326.4小时
- 虫号: 2445195
- 注册: 2013-05-02
- 专业: 计算机应用技术
3楼2015-06-24 10:13:17
zzhlgzz
木虫 (正式写手)
- 应助: 56 (初中生)
- 金币: 5042.1
- 散金: 198
- 红花: 20
- 帖子: 928
- 在线: 326.4小时
- 虫号: 2445195
- 注册: 2013-05-02
- 专业: 计算机应用技术
2楼2015-06-24 10:12:03
【答案】应助回帖
|
其实需要你所在的单位或学校提供研究条件,否则你需要自己搭建环境。 目前热门的环境是hadoop,他支持分布式并行计算的任务分派和分布式文件管理,解决了云计算的基础环境问题, 二就是你选择一个研究题目,然后从网上用爬虫程序爬取大量相关信息。 三就是你要对这些信息进行各种预处理,以便于你使用, 四就是用你设计的算法,在这个云平台环境下,对你下载的数据进行分析处理,为到达你的研究目标而努力 如果你关注的是云系统结构,最好自己动手一步一步搭建环境 如果你关注的是数据挖掘算法,可以基于已有的云环境,把你的算法运行于其上来做研究等工作, 其实这个题目看你怎么限定,云计算大数据方向的题也并不需要你做很大呀 |
» 本帖已获得的红花(最新10朵)

4楼2015-06-25 15:46:37
windoi
捐助贵宾 (著名写手)
机器学习爱好者
- 应助: 41 (小学生)
- 金币: 3629.5
- 红花: 7
- 帖子: 1090
- 在线: 421.9小时
- 虫号: 2482553
- 注册: 2013-05-26
- 性别: GG
- 专业: 计算机应用技术
【答案】应助回帖
|
首先学下Hadoop,找几台机子搭建个环境(新手需要两天时间吧,感觉比较简单); 学下Python,非常有用,上手容易; 最后,找数据集可以到加州大学尔湾分校UCI:http://archive.ics.uci.edu/ml/ 学点机器学习更好不过了。 |

5楼2015-06-26 19:10:19












回复此楼
hqy278