24小时热门版块排行榜    

查看: 1757  |  回复: 6
【悬赏金币】回答本帖问题,作者ly205205将赠送您 5 个金币
当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖

ly205205

铜虫 (初入文坛)

[求助] 机器学习方面的论文,投稿人质疑样本数量不够,容易过拟合 已有1人参与

大修,审稿人的意见之一:
Huge potential problems with overfitting. The dataset is an unbalanced set of records of 303 patients, of whom 216 have CAD, with more than 50 attributes. To train a classifier with 50 attributes without overfitting would require a far larger database, with thousands of patients. It cannot be done with a dataset of 303 patient records.

因为用的是别人的数据集,所以无法对数据集的样本数量做变动,但是审稿人提出了意见,我应该如何应对比较好。
回复此楼

» 猜你喜欢

已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

Roanlys

新虫 (初入文坛)

【答案】应助回帖

想问一下,作者最后是如何回复审稿人的?因为我也有类似的问题。
7楼2019-06-18 16:09:11
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
查看全部 7 个回答

rainchxy

木虫 (小有名气)

算法官


sesame_oil: 金币+1, 鼓励交流 2017-10-05 10:57:16
你用通用的数据集啊

发自小木虫Android客户端
Constanteffortyieldssuresuccess.
2楼2017-10-03 19:59:51
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

ly205205

铜虫 (初入文坛)

引用回帖:
2楼: Originally posted by rainchxy at 2017-10-03 19:59:51
你用通用的数据集啊

通用数据集也是几百例样本,我用的这个数据集比通用数据集特征更多
3楼2017-10-03 20:02:10
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

byq123

铁杆木虫 (著名写手)

引用回帖:
3楼: Originally posted by ly205205 at 2017-10-03 20:02:10
通用数据集也是几百例样本,我用的这个数据集比通用数据集特征更多...

审稿人的意思,300多个样本,要训练出50多个特征,可能不行。
要么增加样本集,要目减少特征的数量。
4楼2017-10-03 20:05:27
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
不应助 确定回帖应助 (注意:应助才可能被奖励,但不允许灌水,必须填写15个字符以上)
信息提示
请填处理意见