24小时热门版块排行榜    

CyRhmU.jpeg
查看: 1955  |  回复: 9

yyallen2003

木虫 (知名作家)

[求助] 类似这样的工作,算是数据挖掘吗?会使用到什么样的挖掘算法?

“根据Web网站的访问日志,来分析业务逻辑访问某一个特定的WebService的总次数以及总流量”
这样的工作,算是Web数据挖掘吗???
如果是的话,可能会使用到什么样的挖掘算法?
回复此楼

» 猜你喜欢

» 本主题相关价值贴推荐,对您同样有帮助:

人的生命是有限的, 但追求思想自由和学术独立的精神将永存。
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

nlyang

禁虫 (著名写手)

★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★
感谢参与,应助指数 +1
yyallen2003: 金币+20, ★★★很有帮助, 2 2012-05-27 23:04:20
本帖内容被屏蔽

2楼2012-05-26 09:42:55
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

twofirst

木虫 (正式写手)

挖掘机

【答案】应助回帖

★ ★ ★ ★ ★
感谢参与,应助指数 +1
yyallen2003: 金币+5, ★★★很有帮助 2012-05-27 23:06:31
请牢记一点:
数据挖掘是在原有数据信息的基础上,发现新的,有价值的知识及潜在的规律。
如果只是对原有的数据进行统计分析,而没有对未知的事物进行预测,应该不算数据挖掘。
我要挖得更深~挖得更深~~
3楼2012-05-26 13:00:07
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

yyallen2003

木虫 (知名作家)

引用回帖:
2楼: Originally posted by nlyang at 2012-05-26 09:42:55
这个应该不算。

从这个需求来分析,如果日志中有“业务逻辑访问某一个特定的WebService的次数以及流量”的信息(一般应该会有),那就是一个简单的统计功能,只不过可能在数据产生速度方面有要求。

如果中间层业务逻辑记录了数据库的查询日志,
我按照“时间段”和“查询结果类别”两个维度进行统计汇总,
(是一个电子商务网站,“查询结果类别”基本上就是:鞋类、食品……)
这样我就会知道“上午”哪一类的商品会被浏览的比较多,
将这类商品放在网站首页进行推荐。
这个算是数据挖掘吗?
人的生命是有限的, 但追求思想自由和学术独立的精神将永存。
4楼2012-05-27 23:13:00
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

yyallen2003

木虫 (知名作家)

引用回帖:
3楼: Originally posted by twofirst at 2012-05-26 13:00:07
请牢记一点:
数据挖掘是在原有数据信息的基础上,发现新的,有价值的知识及潜在的规律。
如果只是对原有的数据进行统计分析,而没有对未知的事物进行预测,应该不算数据挖掘。

如果中间层业务逻辑记录了数据库的查询日志,
我按照“时间段”和“查询结果类别”两个维度进行统计汇总,
(是一个电子商务网站,“查询结果类别”基本上就是:鞋类、食品……)
这样我就会知道“上午”哪一类的商品会被浏览的比较多,
将这类商品放在网站首页进行推荐。
这个算是数据挖掘吗?
人的生命是有限的, 但追求思想自由和学术独立的精神将永存。
5楼2012-05-27 23:13:18
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

mlanqiang

木虫之王 (文学泰斗)

蓝博士

【答案】应助回帖

肯定不是,只是简单地统计功能,数据挖掘是在原有数据信息的基础上,发现潜在的规律。
蓝精灵
6楼2012-05-28 06:02:43
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

nlyang

禁虫 (著名写手)

本帖内容被屏蔽

7楼2012-05-28 09:01:15
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

twofirst

木虫 (正式写手)

挖掘机

【答案】应助回帖

★ ★ ★ ★ ★
yyallen2003: 金币+5, ★★★很有帮助, 非常感谢 2012-06-01 20:12:21
引用回帖:
5楼: Originally posted by yyallen2003 at 2012-05-27 23:13:18
如果中间层业务逻辑记录了数据库的查询日志,
我按照“时间段”和“查询结果类别”两个维度进行统计汇总,
(是一个电子商务网站,“查询结果类别”基本上就是:鞋类、食品……)
这样我就会知道“上午”哪一类 ...

在我看来,这个不能算是数据挖掘,而且也没有用到什么算法,充其量是个“数据归纳”。
数据挖掘在电子商务方面应用的很广泛,通常用于个性化推荐方面。譬如你去Amazon网站买过一本《西游记》,等你再次登录后会发现,网站会推荐你买《水浒传》,《三国演义》等。
为什么?
因为通过挖掘其他用户的购买记录会发现,买了《西游记》的顾客同时也购买了《水浒传》或是《三国演义》等。
这样的信息在数据库中是无法通过简单的query获得的,所以发现这样的信息才是有价值的。这种信息在数据挖掘中被称作“association rules”。
一个经典的案例就是:
通过挖掘某超市的购物记录发现,很多顾客同时购买啤酒和尿不湿。这是一个奇怪关联现象。但通过调查证实,很多年轻妈妈不仅要给婴儿购买尿不湿,还要给丈夫购买啤酒。
发现这个规律之后,该超市将尿不湿和啤酒的货架摆在了一起,结果销量倍增。因为买完一件后,另一件商品只不过是“顺手”罢了。
我要挖得更深~挖得更深~~
8楼2012-05-28 09:34:37
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

zksn

金虫 (著名写手)

【答案】应助回帖

这个应该算不上数据挖掘,只能算是基础的数据统计。
9楼2012-06-11 15:05:45
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
10楼2012-10-24 15:55:44
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 yyallen2003 的主题更新
信息提示
请填处理意见