24小时热门版块排行榜    

CyRhmU.jpeg
查看: 2698  |  回复: 8
当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖

tymbiubiubiu

铁虫 (初入文坛)

[求助] 我想自学python,请大佬推荐我几本书。已有4人参与

因为是网络工程专业,但是对这方面不感兴趣,我就想自学爬虫,但是不知道怎么入手。请大佬教我怎么入门,最好推荐几本书,谢谢各位大佬

发自小木虫IOS客户端
回复此楼
什么时候可以把机器人变得代替人类
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

约束陶瓷装甲

金虫 (正式写手)

【答案】应助回帖

★ ★ ★ ★
conanwj: 金币+4, 感谢应助 2017-04-06 14:09:46
1.python基础:《A Byte of Python》

2.爬虫相关:《Web Scraping with Python》

3.各种爬虫模块的官方文档,比如:
https://www.crummy.com/software/BeautifulSoup/bs4/doc.zh/
http://scrapy-chs.readthedocs.io/zh_CN/1.0/intro/overview.html

4.学习路线
入门的话,其实结合官方文档或者网上的教程与实例,搞清楚以下几个模块怎么用就够了,我觉得最好自己先写几个爬虫练练手然后再去看书,
(1)打开网页、下载文件:urllib模块、requests模块
(2)解析网页:beautifulsoup4模块
(3)框架:Scrapy框架
(4)动态页面:Selenium/Selenium2模块
除此以外,正则表达式(re模块)、XPath选择器(lxml模块)也是解析网页时经常用到的

5.其他相关技术:
爬下来的数据怎么存储:MySOL、MongoDB数据库挑一个学,
数据分析:Numpy模块、Scipy模块、
画图:Matplotlib模块
9楼2017-04-06 11:49:10
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
查看全部 9 个回答

tuburfransth

金虫 (正式写手)

我目前正在看用python写网络爬虫这本书

发自小木虫Android客户端
2楼2017-03-24 12:34:53
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

tymbiubiubiu

铁虫 (初入文坛)

引用回帖:
2楼: Originally posted by tuburfransth at 2017-03-24 12:34:53
我目前正在看用python写网络爬虫这本书

谢谢,我也去看看

发自小木虫IOS客户端
什么时候可以把机器人变得代替人类
3楼2017-03-24 12:54:35
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

FMStation

至尊木虫 (知名作家)

【答案】应助回帖

★ ★ ★ ★
感谢参与,应助指数 +1
tymbiubiubiu(conanwj代发): 金币+4, 感谢应助 2017-04-06 14:09:09
the process of Python mastery
https://stackoverflow.com/questi ... -apprentice-to-guru

1 Discover list comprehensions
2 Discover generators
3 Incorporate map, reduce, filter, iter, range, xrange often into your code
4 Discover Decorators
5 Write recursive functions, a lot
6 Discover itertools and functools
7 Read Real World Haskell (read free online)
8 Rewrite all your old Python code with tons of higher order functions, recursion, and whatnot.
9 Annoy your cubicle mates every time they present you with a Python class. Claim it could be "better" implemented as a dictionary plus some functions. Embrace functional programming.
10 Rediscover the Strategy pattern and then all those things from imperative code you tried so hard to forget after Haskell.
11 Find a balance.
4楼2017-03-26 15:35:38
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
信息提示
请填处理意见