| 查看: 4022 | 回复: 9 | |||
| 当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖 | |||
[交流]
今年不知道还有没有爬虫大神 已有8人参与
|
|||
|
今年不知道还能还能用网络爬虫爬结果,上年有一个爬虫大神利用短暂的漏洞时间,爬了不少中标的项目 发自小木虫Android客户端 |
» 猜你喜欢
伙伴们,祝我生日快乐吧
已经有22人回复
调剂
已经有7人回复
289求调剂
已经有5人回复
一志愿武理314求调剂
已经有6人回复
欢迎申博同学联系
已经有5人回复
288求调剂
已经有4人回复
国自科面上基金字体
已经有4人回复
梁成伟老师课题组欢迎你的加入
已经有6人回复
274求调剂
已经有3人回复
化学调剂0703
已经有6人回复
★
小木虫: 金币+0.5, 给个红包,谢谢回帖
小木虫: 金币+0.5, 给个红包,谢谢回帖
|
楼上说的罪名是一方面,另一方面,网站是否允许爬虫是有行规的,会写一个robots.txt的文件放在网站根目录 看看isisn是怎么写的(https://isisn.nsfc.gov.cn/robot.txt): user-agent: * disallow: / 第二行的意思就是,所有目录都不允许爬取。 当然可以无视这个文件,但是这个文件代表了官方的态度 不过不得不吐槽一下他们负责网站建设的人,这个robot.txt应该写成robots.txt,这个错误导致了百度在爬他们的网站 |
7楼2021-08-10 12:17:34
★
小木虫: 金币+0.5, 给个红包,谢谢回帖
小木虫: 金币+0.5, 给个红包,谢谢回帖
|
本帖内容被屏蔽 |
2楼2021-08-10 11:58:51
caiqing
铁杆木虫 (著名写手)
- 应助: 21 (小学生)
- 金币: 7636.8
- 散金: 2380
- 红花: 11
- 帖子: 2899
- 在线: 570.2小时
- 虫号: 339096
- 注册: 2007-04-06
- 性别: GG
- 专业: 敏感电子学与传感器
3楼2021-08-10 12:04:13
4楼2021-08-10 12:05:08













回复此楼