24小时热门版块排行榜    

查看: 3691  |  回复: 19

惟舞幽游

新虫 (初入文坛)

[求助] 如何用python实现在某网页搜索框中输入字段后自动搜索信息并抓取 已有1人参与

如题,想要用python实现在某网页搜索框中输入自己想搜索的词后自动搜索相关信息,并对搜索出来的相关信息进行想要内容的抓取,后期还可加入解析和存库,如何实现这些功能,请大神指教有示例就更好了
回复此楼

» 猜你喜欢

已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
回帖支持 ( 显示支持度最高的前 50 名 )

菜鸟学python

新虫 (小有名气)

2楼2016-07-29 15:58:43
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
普通回帖

wy_zidu2012

金虫 (小有名气)

看下python codebook里面关于网络部分的样例代码,学会用python发送get或post请求。
然后看下三方库,类似bs4之类的可以解析html的。
最后用django写成网站的形式。

最基本的东西是这些,比较核心的地方在于抓取连接的方式,也就是个爬虫的实现过程。这里东西太多,可以先实现一个爬取百度、bing之类搜索引擎检索结果的简单版,然后后期再一步步加深,最后写一个全网的爬虫。

个人意见,仅供参考。
3楼2016-07-29 17:50:39
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

Scorpio_0

银虫 (著名写手)

你说的就是爬虫啊,网上能找到资源的。

发自小木虫Android客户端
Practice makes perfect
4楼2016-07-29 22:30:44
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

ghoulyy

银虫 (著名写手)

The most fascinating and interesting problems in
5楼2016-08-03 12:19:36
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

邪恶胖子

铜虫 (正式写手)

……爬虫简单,这个你就多抓包分析就好了,urllib和正则用好就行了,爬虫就是文本处理

发自小木虫Android客户端
Just fight like a real man.
6楼2016-08-05 13:35:03
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

惟舞幽游

新虫 (初入文坛)

引用回帖:
3楼: Originally posted by wy_zidu2012 at 2016-07-29 17:50:39
看下python codebook里面关于网络部分的样例代码,学会用python发送get或post请求。
然后看下三方库,类似bs4之类的可以解析html的。
最后用django写成网站的形式。

最基本的东西是这些,比较核心的地方在于抓 ...

谢谢你,目前用selenium实现了关键词自动输入搜索,但不知道怎么判断一个页面是否抓完,然后再翻页抓下一页

发自小木虫Android客户端
7楼2016-08-05 22:54:13
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

惟舞幽游

新虫 (初入文坛)

引用回帖:
6楼: Originally posted by 邪恶胖子 at 2016-08-05 13:35:03
……爬虫简单,这个你就多抓包分析就好了,urllib和正则用好就行了,爬虫就是文本处理

刚刚学习,老师催的急,有什么快速学习的好规划吗?

发自小木虫Android客户端
8楼2016-08-05 22:57:57
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

惟舞幽游

新虫 (初入文坛)

引用回帖:
4楼: Originally posted by Scorpio_0 at 2016-07-29 22:30:44
你说的就是爬虫啊,网上能找到资源的。

细节技术实现遇到很多问题…

发自小木虫Android客户端
9楼2016-08-05 22:59:41
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

惟舞幽游

新虫 (初入文坛)

引用回帖:
5楼: Originally posted by ghoulyy at 2016-08-03 12:19:36
网络爬虫



发自小木虫Android客户端
10楼2016-08-05 22:59:53
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 惟舞幽游 的主题更新
信息提示
请填处理意见