24小时热门版块排行榜    

CyRhmU.jpeg
查看: 3177  |  回复: 8
当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖

fatcat999

禁虫 (初入文坛)

本帖内容被屏蔽

已阅   关注TA 给TA发消息 送TA红花 TA的回帖

摘星者

铁杆木虫 (正式写手)

不能编辑......

“还有一点,比较两种算法并不是一定要用一样的数据集的”这里是说“和参考文献一样的数据集”。一个实验中的数据集是一样的。
6楼2011-06-14 22:16:01
已阅   关注TA 给TA发消息 送TA红花 TA的回帖
查看全部 9 个回答

摘星者

铁杆木虫 (正式写手)

【答案】应助回帖

fatcat999(金币+2): 非常感谢帮助~想送朵红花的 没资格 哈 新虫 2011-06-14 21:16:12
1、尝试找原作者索取代码
2、自行实现恢复,并根据文献的实验测试恢复的效果。至于有没有尽力优化别人的算法,这个就要看你自己的道德水平了。

无论用哪一种方法,你论文最终选择的数据集可以和参考文献完全不一样,依然有可比性。
2楼2011-06-14 18:28:08
已阅   关注TA 给TA发消息 送TA红花 TA的回帖

fatcat999

禁虫 (初入文坛)

本帖内容被屏蔽

3楼2011-06-14 21:13:49
已阅   关注TA 给TA发消息 送TA红花 TA的回帖

摘星者

铁杆木虫 (正式写手)

★ ★
mze04532(金币+2): 感谢热心~奖励~ 2011-06-15 08:57:07
“还有一个问题请教,那就是说的不同的数据集也可以对比”

我不是很清楚你这话什么意思。有些数据集确实需要抽样,例如做文本分析时常用的20新闻组,一般就会在每一个类别中抽取一定数量的样本生成数据集。将自己的算法和别人的算法都用在生成好的数据集上就可以比较了。对于这类情况,重复别人的实验会比较麻烦,正如你所说,这些抽样的数据集是很难和别人测试时的数据集完全一样的。这时能拿到别人的源代码是最好的。如果拿不到的话,可以试试多采样几次。不过一般情况下只要不是样本数很少,实验的结果应该不会有太大的波动,毕竟采样通常都是均匀的。
4楼2011-06-14 22:07:28
已阅   关注TA 给TA发消息 送TA红花 TA的回帖
信息提示
请填处理意见