| 查看: 4000 | 回复: 9 | |||
| 当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖 | |||
[交流]
今年不知道还有没有爬虫大神 已有8人参与
|
|||
|
今年不知道还能还能用网络爬虫爬结果,上年有一个爬虫大神利用短暂的漏洞时间,爬了不少中标的项目 发自小木虫Android客户端 |
» 猜你喜欢
2026级硕士研究生招生/调剂
已经有5人回复
0703化学调剂
已经有7人回复
新疆大学地质与矿业工程学院招生
已经有32人回复
0856材料与化工353分求调剂
已经有4人回复
282分材料专业求调剂院校
已经有13人回复
315食品工程求调剂
已经有5人回复
环境调剂
已经有3人回复
接受26届调剂生
已经有20人回复
考研材料与化工,求调剂
已经有3人回复
欢迎211本科同学,过A区国家线,A区非偏远一本,交叉学科课题组
已经有35人回复
★
小木虫: 金币+0.5, 给个红包,谢谢回帖
小木虫: 金币+0.5, 给个红包,谢谢回帖
|
楼上说的罪名是一方面,另一方面,网站是否允许爬虫是有行规的,会写一个robots.txt的文件放在网站根目录 看看isisn是怎么写的(https://isisn.nsfc.gov.cn/robot.txt): user-agent: * disallow: / 第二行的意思就是,所有目录都不允许爬取。 当然可以无视这个文件,但是这个文件代表了官方的态度 不过不得不吐槽一下他们负责网站建设的人,这个robot.txt应该写成robots.txt,这个错误导致了百度在爬他们的网站 |
7楼2021-08-10 12:17:34
★
小木虫: 金币+0.5, 给个红包,谢谢回帖
小木虫: 金币+0.5, 给个红包,谢谢回帖
|
本帖内容被屏蔽 |
2楼2021-08-10 11:58:51
caiqing
铁杆木虫 (著名写手)
- 应助: 21 (小学生)
- 金币: 7636.8
- 散金: 2380
- 红花: 11
- 帖子: 2899
- 在线: 570.2小时
- 虫号: 339096
- 注册: 2007-04-06
- 性别: GG
- 专业: 敏感电子学与传感器
3楼2021-08-10 12:04:13
4楼2021-08-10 12:05:08













回复此楼