24小时热门版块排行榜    

CyRhmU.jpeg
查看: 3176  |  回复: 8

fatcat999

禁虫 (初入文坛)

本帖内容被屏蔽

已阅   关注TA 给TA发消息 送TA红花 TA的回帖

摘星者

铁杆木虫 (正式写手)

【答案】应助回帖

fatcat999(金币+2): 非常感谢帮助~想送朵红花的 没资格 哈 新虫 2011-06-14 21:16:12
1、尝试找原作者索取代码
2、自行实现恢复,并根据文献的实验测试恢复的效果。至于有没有尽力优化别人的算法,这个就要看你自己的道德水平了。

无论用哪一种方法,你论文最终选择的数据集可以和参考文献完全不一样,依然有可比性。
2楼2011-06-14 18:28:08
已阅   关注TA 给TA发消息 送TA红花 TA的回帖

fatcat999

禁虫 (初入文坛)

本帖内容被屏蔽

3楼2011-06-14 21:13:49
已阅   关注TA 给TA发消息 送TA红花 TA的回帖

摘星者

铁杆木虫 (正式写手)

★ ★
mze04532(金币+2): 感谢热心~奖励~ 2011-06-15 08:57:07
“还有一个问题请教,那就是说的不同的数据集也可以对比”

我不是很清楚你这话什么意思。有些数据集确实需要抽样,例如做文本分析时常用的20新闻组,一般就会在每一个类别中抽取一定数量的样本生成数据集。将自己的算法和别人的算法都用在生成好的数据集上就可以比较了。对于这类情况,重复别人的实验会比较麻烦,正如你所说,这些抽样的数据集是很难和别人测试时的数据集完全一样的。这时能拿到别人的源代码是最好的。如果拿不到的话,可以试试多采样几次。不过一般情况下只要不是样本数很少,实验的结果应该不会有太大的波动,毕竟采样通常都是均匀的。
4楼2011-06-14 22:07:28
已阅   关注TA 给TA发消息 送TA红花 TA的回帖

摘星者

铁杆木虫 (正式写手)

还有一点,比较两种算法并不是一定要用一样的数据集的,特别是两种算法在所研究的问题上有某种偏好的情况下。这时选择对自己有利的数据集并没有什么不可以的。当然,如果能分析为什么在这些数据集上特别好就更完美了。但是,一般数据集的种类是比较一致的。就我所研究的领域而言,人工数据集、UCI数据集、高维数据集是必须的。至于每一种具体选择哪一个就是我的自由了。
5楼2011-06-14 22:13:08
已阅   关注TA 给TA发消息 送TA红花 TA的回帖

摘星者

铁杆木虫 (正式写手)

不能编辑......

“还有一点,比较两种算法并不是一定要用一样的数据集的”这里是说“和参考文献一样的数据集”。一个实验中的数据集是一样的。
6楼2011-06-14 22:16:01
已阅   关注TA 给TA发消息 送TA红花 TA的回帖

fatcat999

禁虫 (初入文坛)

本帖内容被屏蔽

7楼2011-06-15 08:28:21
已阅   关注TA 给TA发消息 送TA红花 TA的回帖

formleaf

木虫 (正式写手)

帖子真精彩!
已经收录到淘贴专辑《小木虫算法手册
8楼2011-08-30 13:40:11
已阅   关注TA 给TA发消息 送TA红花 TA的回帖

晨曦微

铁虫 (初入文坛)

我想问的是,人工数据集是自己生成的还是其他地方下的?怎么生成呢?,谢谢
9楼2012-10-09 09:50:45
已阅   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 fatcat999 的主题更新
信息提示
请填处理意见