24小时热门版块排行榜    

查看: 5044  |  回复: 53
当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖

gd0000

铁杆木虫 (正式写手)

[交流] CVPR2010奇文一篇共欣赏(已搜索,无重复)已有50人参与

这篇Paper的题目叫Paper Gestalt。文章以诙谐的笔调描述了一个基于vision + learning的自动paper review算法。

这篇Paper不是在会议中正式发表的,而是在TC Panel派发的。参加会议的朋友们可以很幸运的在会场获取这篇文章,至于没有来的朋友,我想只能向作者(这位兄弟(也许是姐妹)在paper中自称Carven von Bearnensquash, bearensquash@live.com)索要了。

这篇论文出炉的背景,就是最近几年CVPR或者ICCV的submission呈现急速的指数增长的趋势(在过去10年翻了三倍)。按照这个速度增长,在 10年后每次会议的投稿量就会超过5000篇!

文章的算法很简单(前提是你对Machine Learning或者Computer Vision有一点了解),把8页的pdf文档并排成一张长的image,然后就在上面抽feature。做自然语言处理的朋友们请不要激动,这是 Vision的paper,自然用的是Vision圈子自己的方法。好了,抽什么feature呢?主要是HOG(Histogram of Gradients),这是一种纯粹用于描述视觉观感的feature。显然,大段的文本,曲线图,图像,表格,数学公式,它们的feature应该是不 太一样的。然后作者用AdaBoost做feature selection训练得到一个分类器:纯粹根据paper的视觉观感来判断paper的好坏。

这篇文章的作者收集了CVPR 2008, ICCV 2009和CVPR 2009的全部1196篇paper构成正样本。那么负样本从何而来呢?被拒的paper显然作者是拿不到的。于是他很聪明的利用了一个众所周知但是大家 却不会公开明言的事实:workshop接纳的很多是在主要会议被拒收的paper。这样,很不幸的,workshop上发表的文章被用作负样本。

最有趣的部分要数实验结果了。从ROC曲线来看,结果其实还是不错的——以拒绝15%的正样本为代价,可以滤除一半的负样本。作者对于正负样本的特征做了 一些总结,也许对于大家以后投paper还是有点指导意义呢...

正样本的“视觉”特点:
1. 里面有几段公式,看上去文章显得似乎很专业,也显得作者似乎数学不错;
2. 实验部分里面多少要有几个曲线图,即使那几个曲线图说明不了什么。但是,只要有几个曲线图在那里,起码表示我做的是“科学实验”;
3. 最好在文章开头或者最后一页排列一堆图像。其实,我也注意到很多作者喜欢排列很多dataset里面的图像到paper上——即使那是一个 publically available的standard dataset——我不知道这样做的意义何在——除了审美效果。
4. 最好写满8页,代表分量足够。

负样本的特点:
1. 不够页数。在submission阶段,写不满6页的文章被录用的机会很小。虽然最后很多本来8页的文章还是能很神奇地被压缩到6页,如果作者想省掉 200美元的附加页费。题外话,我也一直不明白为什么多一页要多交100美元注册费。
2. 有很大的数字表,就是m行n列,排满数字那种。这篇文章表明,排列了很多曲线图和柱状图的文章比排列了很多数字表的文章有更大概率被接收。
3. 没有漂亮插图。

详细表述请看附件原文。[ Last edited by gd0000 on 2011-8-3 at 19:31 ]
回复此楼
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

chenn_victor

铁杆木虫 (正式写手)


小木虫: 金币+0.5, 给个红包,谢谢回帖
引用回帖:
907115楼: Originally posted by gd0000 at 2011-08-03 19:29:35
这篇Paper的题目叫Paper Gestalt。文章以诙谐的笔调描述了一个基于vision + learning的自动paper review算法。

这篇Paper不是在会议中正式发表的,而是在TC Panel派发的。参加会议的朋友们可以很幸运的在会场获取 ...

不错。能把想法用算法表达出来。很好!
35楼2012-10-14 16:40:48
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
查看全部 54 个回答

s云淡风轻s

木虫 (小有名气)


小木虫(金币+0.5):给个红包,谢谢回帖
哈哈~~~~~这篇paper太可爱了
2楼2011-08-03 20:36:11
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

rbs

木虫 (小有名气)


小木虫(金币+0.5):给个红包,谢谢回帖
哈哈,以后就照这个写论文啦。
5楼2011-08-04 20:40:50
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

ljia0

至尊木虫 (著名写手)

社会主义好青年之突击手


小木虫(金币+0.5):给个红包,谢谢回帖
将来将全民自动化。。。。。。。。。。。。
一切源自简单
6楼2011-08-06 09:31:31
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
最具人气热帖推荐 [查看全部] 作者 回/看 最后发表
[基金申请] F口信息学部拿面上,大概需要什么样的成果 +6 _奋黎_ 2024-06-16 9/450 2024-06-17 20:48 by _奋黎_
[基金申请] 博后基金刷到的BUG,图片来的更直观 +9 carolloo 2024-06-17 10/500 2024-06-17 20:44 by sunyuwei1994
[考博] 这个博士要读吗 +9 Sea Breeze 2024-06-16 17/850 2024-06-17 19:50 by zeolitess
[论文投稿] 论文已接收,但发现修改稿传的是旧版该怎么办? +3 zsq54321 2024-06-15 6/300 2024-06-17 19:45 by wjykycg
[基金申请] 最新消息:2024国自然下载文件名变了 +15 dream200606 2024-06-16 28/1400 2024-06-17 19:04 by 6543yes
[找工作] 初始合伙人来啦!(生物试剂耗材标准品) +11 欢快的小科研人 2024-06-15 21/1050 2024-06-17 18:47 by 欢快的小科研人
[找工作] 药学硕士找不到工作,打算去做科研助理了 +5 pom戴墨镜 2024-06-14 11/550 2024-06-17 17:16 by pom戴墨镜
[教师之家] 请问事业编制和年薪制冲突吗? +10 ZHONGWU_U 2024-06-14 10/500 2024-06-17 14:44 by 周周520
[催化] 镍负载氧化铝的保存问题 8+3 lwn0130 2024-06-15 4/200 2024-06-17 10:48 by adaihao
[基金申请] 关于博后基金的bug问题 +6 lxr1991 2024-06-14 9/450 2024-06-15 21:17 by since—2010
[基金申请] BO4的YQ答辩通知发布了吗? +6 博学笃行 2024-06-11 6/300 2024-06-15 16:04 by 悲催科研狗
[论文投稿] 投了一篇4区的SCI,审稿人一个拒稿,一个小修,编辑给了大修。 +9 安稳22123 2024-06-13 10/500 2024-06-14 23:45 by jurkat.1640
[基金申请] E12面上申请 +4 汉风之遗 2024-06-13 4/200 2024-06-14 15:28 by 天外飞去来
[论文投稿] 最近写了一篇控制优化领域的文章,可以投哪里啊?有没有水一些的期刊推荐 +7 香瓜木香 2024-06-12 13/650 2024-06-14 07:05 by 香瓜木香
[论文投稿] 文章proof要求使用机构的邮箱 5+3 不可不信缘 2024-06-11 11/550 2024-06-14 07:00 by 3001160025
[基金申请] 工材E10口函评结束了吗 10+3 我1的飞翔 2024-06-13 5/250 2024-06-14 06:35 by nono2009
[论文投稿] 投稿后发现其他作者的邮箱填错了该怎么办呀 10+4 在飞的猪 2024-06-13 6/300 2024-06-14 04:45 by 小虫子咔咔
[硕博家园] 科研求助 +5 杲www 2024-06-12 6/300 2024-06-13 16:16 by 姓李名明
[硕博家园] 考博应该从哪里开始准备 +6 亮姐2019 2024-06-11 8/400 2024-06-13 12:53 by 帕秋莉GO
[基金申请] 博后特助这周出结果吗?往年都是啥时候啊? +13 jsqy 2024-06-12 17/850 2024-06-12 19:55 by Lynn212
信息提示
请填处理意见