24小时热门版块排行榜    

查看: 1735  |  回复: 5

luck_cc

金虫 (正式写手)

[求助] 怎么使linux或者shell下的wget命令在python脚本中起作用

在linux虚拟终端下,wget命令可以下载网页上的信息,但是目前需要连续下载一系列信息,网址有规律性,但又不完全相同,想用一个脚本,把不同的序号分别输入时候,分别下载对应网址上的内容,其中这里说的序列号是网址的一部分。
但是wget又不是python脚本中的关键词,有什么方法可以转化或者是引入什么模块,可以实现在脚本中也是下载网页信息的意思呢?
回复此楼
认真目标,勇往直前
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

virtualzx

木虫 (著名写手)

【答案】应助回帖

感谢参与,应助指数 +1
from subprocess import call
然后就
retn=call(cmd,shell=True)
2楼2013-10-15 00:42:13
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

luck_cc

金虫 (正式写手)

引用回帖:
2楼: Originally posted by virtualzx at 2013-10-15 00:42:13
from subprocess import call
然后就
retn=call(cmd,shell=True)

首先谢谢你!
我大概了解下subprocess模块的用法,但是还不太清楚。比如可以这样用:
在python交互模式下,a= subprocess.call("ls -l",shell = True),直接回车就执行了linux下的ls命令
但是我现在遇到的问题是,需要在脚本里用到wget命令,但是后面接的网址不是完整的,需要后续接上从一个文件中一一读出一个序列号。比如需要下载的网址都是www.xxxxxxxxxx_A
                         www.xxxxxxxxxx_B
                         www.xxxxxxxxxx_C
                         www.xxxxxxxxxx_D
                          ...........
也就是说,wget 命令后续接的参数网址不是现成的,需要输入www.xxxxxxxxxx_+A/B...,其中A,B,C。。每个一行,存在另一个文件中。
需要怎么修改这个应用啊
认真目标,勇往直前
3楼2013-10-15 10:31:07
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

luck_cc

金虫 (正式写手)

引用回帖:
2楼: Originally posted by virtualzx at 2013-10-15 00:42:13
from subprocess import call
然后就
retn=call(cmd,shell=True)

假设每个网址需要后续加上的id号A,B,C.... 存在一个fille.txt中(每行一个),
id = open("file.txt".readline
cmd = ''' wget www.xxxxxxxxxx_+"id" '''
a = subprocess.call(cmd,shell = True)
我想大概是这样子写的吧,但是第二行应该有个问题,这个id 是变量名,怎么在引号内识别呢?这不知道该怎么写啊,不知道你有没有遇到过这样的问题
认真目标,勇往直前
4楼2013-10-15 11:27:03
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

锐利的碎片

木虫 (正式写手)

star watcher

【答案】应助回帖

★ ★ ★ ★ ★ ★ ★ ★ ★ ★
感谢参与,应助指数 +1
luck_cc: 金币+10, ★★★★★最佳答案 2013-10-15 15:19:32
引用回帖:
4楼: Originally posted by luck_cc at 2013-10-15 11:27:03
假设每个网址需要后续加上的id号A,B,C.... 存在一个fille.txt中(每行一个),
id = open("file.txt".readline
cmd = ''' wget www.xxxxxxxxxx_+"id" '''
a = subprocess.call(cmd,shell = ...

cmd = 'wget www.xxxxxxxxxx_%s' % id
5楼2013-10-15 12:15:24
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

luck_cc

金虫 (正式写手)

引用回帖:
5楼: Originally posted by 锐利的碎片 at 2013-10-15 12:15:24
cmd = 'wget www.xxxxxxxxxx_%s' % id...

已经解决了,谢谢你
认真目标,勇往直前
6楼2013-10-15 15:19:17
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 luck_cc 的主题更新
信息提示
请填处理意见