| 查看: 1738 | 回复: 5 | |||
| 当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖 | |||
luck_cc金虫 (正式写手)
|
[求助]
怎么使linux或者shell下的wget命令在python脚本中起作用
|
||
|
在linux虚拟终端下,wget命令可以下载网页上的信息,但是目前需要连续下载一系列信息,网址有规律性,但又不完全相同,想用一个脚本,把不同的序号分别输入时候,分别下载对应网址上的内容,其中这里说的序列号是网址的一部分。 但是wget又不是python脚本中的关键词,有什么方法可以转化或者是引入什么模块,可以实现在脚本中也是下载网页信息的意思呢? |
» 猜你喜欢
回收溶剂求助
已经有7人回复
职称评审没过,求安慰
已经有40人回复
硝基苯如何除去
已经有3人回复
A期刊撤稿
已经有4人回复
垃圾破二本职称评审标准
已经有17人回复
投稿Elsevier的Neoplasia杂志,到最后选publishing options时页面空白,不能完成投稿
已经有22人回复
申请26博士
已经有5人回复
EST投稿状态问题
已经有7人回复
毕业后当辅导员了,天天各种学生超烦
已经有4人回复
求助文献
已经有3人回复
» 本主题相关价值贴推荐,对您同样有帮助:
通过键级曲线和ELF/LOL/RDG等值面动画研究化学反应过程
已经有12人回复
编程入门应从那种语言开始学起
已经有34人回复
linux学习
已经有1人回复
使用AdNDP方法以及ELF/LOL、多中心键级研究多中心键
已经有14人回复
回答一些关于Multiwfn的疑问以及未来Multiwfn的发展打算
已经有37人回复
【讨论】建筑企业项目经理应具备的能力
已经有1人回复
【sobereva个人文集】制作动画分析电子结构特征
已经有29人回复
【转帖】GTK+ 3.0终于发布咯
已经有0人回复
【整理】《提问的智慧》——献给那些不会提问的人
已经有78人回复
【分享】推荐一款免费的论文作图工具asymptote【已搜索无重复】
已经有19人回复

锐利的碎片
木虫 (正式写手)
star watcher
- 应助: 136 (高中生)
- 金币: 3637.1
- 散金: 252
- 红花: 22
- 帖子: 988
- 在线: 1224.9小时
- 虫号: 961933
- 注册: 2010-03-05
- 专业: 凝聚态物性 II :电子结构
【答案】应助回帖
★ ★ ★ ★ ★ ★ ★ ★ ★ ★
感谢参与,应助指数 +1
luck_cc: 金币+10, ★★★★★最佳答案 2013-10-15 15:19:32
感谢参与,应助指数 +1
luck_cc: 金币+10, ★★★★★最佳答案 2013-10-15 15:19:32
|
cmd = 'wget www.xxxxxxxxxx_%s' % id |
5楼2013-10-15 12:15:24
virtualzx
木虫 (著名写手)
- 应助: 263 (大学生)
- 金币: 7161.3
- 红花: 54
- 帖子: 1605
- 在线: 317.6小时
- 虫号: 2069080
- 注册: 2012-10-18
- 性别: GG
- 专业: 理论和计算化学
2楼2013-10-15 00:42:13
luck_cc
金虫 (正式写手)
- 应助: 2 (幼儿园)
- 金币: 1136.1
- 红花: 1
- 帖子: 340
- 在线: 195.4小时
- 虫号: 2196366
- 注册: 2012-12-19
- 专业: 计算机软件
|
首先谢谢你! 我大概了解下subprocess模块的用法,但是还不太清楚。比如可以这样用: 在python交互模式下,a= subprocess.call("ls -l",shell = True),直接回车就执行了linux下的ls命令 但是我现在遇到的问题是,需要在脚本里用到wget命令,但是后面接的网址不是完整的,需要后续接上从一个文件中一一读出一个序列号。比如需要下载的网址都是www.xxxxxxxxxx_A www.xxxxxxxxxx_B www.xxxxxxxxxx_C www.xxxxxxxxxx_D ........... 也就是说,wget 命令后续接的参数网址不是现成的,需要输入www.xxxxxxxxxx_+A/B...,其中A,B,C。。每个一行,存在另一个文件中。 需要怎么修改这个应用啊 |

3楼2013-10-15 10:31:07
luck_cc
金虫 (正式写手)
- 应助: 2 (幼儿园)
- 金币: 1136.1
- 红花: 1
- 帖子: 340
- 在线: 195.4小时
- 虫号: 2196366
- 注册: 2012-12-19
- 专业: 计算机软件
|
假设每个网址需要后续加上的id号A,B,C.... 存在一个fille.txt中(每行一个), id = open("file.txt" .readlinecmd = ''' wget www.xxxxxxxxxx_+"id" ''' a = subprocess.call(cmd,shell = True) 我想大概是这样子写的吧,但是第二行应该有个问题,这个id 是变量名,怎么在引号内识别呢?这不知道该怎么写啊,不知道你有没有遇到过这样的问题 |

4楼2013-10-15 11:27:03













回复此楼
.readline