Re: [FZH] 用什么下载工具能实现批量下载呢？

Sunday, 7 November 2010

于 2010年11月05日 23:27, Merlin Web 写道:
...

实际上我是想下载人民教育出版社网站上的一些书籍，比如初中《生物》课本（http://www.pep.com.cn/czsw/jshzhx/qnxc/dzkb/）
 可以试一下 Firefox 下的 downthemall 插件：
1.在网页上右键进入DownThemAll后，选择需要到链接，也可以点开“快速过滤器” 
输入特征字符，如“t20040407“
2.Firefox--工具--DownThemAll --管理器--添加链接，其中支持支持批量下载， 
可以适用连续到网页。
...
 1.
它的页面链接是连续的，第一页的链接是：http://www.pep.com.cn/czsw/jshzhx/qnxc/dzkb/200404/t20040407_83141.htm，最后一页（122页）的链接是：http://www.pep.com.cn/czsw/jshzhx/qnxc/dzkb/200404/t20040407_83262.htm
 2. 只需要页面的图片
 我参照前面朋友的指点写了一个脚本

 #begin
 i=83141
 while test $i -le 83262
 do
 	wget -r -np -nd -A jpg -p
 "http://www.pep.com.cn/czsw/jshzhx/qnxc/dzkb/200404/t20040407_$i.htm"
 	let "i=i+1"
 done
 #end

 能把我需要的图片都下载下来，但是还没能实现批量改名。因为wget中我使用了-A
 jpg选项，所以不知道如何更好的使用-O选项来改名。我想生成的图片名字是p001，p002，……p112。

 BTW，CyrusYzGTt&lt;cyrusyzgtt(a)gmail.xn--com&gt;wget-618qu5fpyrcxshy1cwp1dto4e -p选项帮助我解决了几个问题，thanks。

 2010/11/5 CyrusYzGTt&lt;cyrusyzgtt(a)gmail.com&gt;:
> 于 2010年11月05日 02:45, Merlin Web 写道:
>> 我想下载一个网站上连续页面上的图片，
>>
>> 1. 页面的链接有规律，比如http://www.aaa.com/001.htm，... http://www.aaa.com/100.htm；
>> 2. 每个页面（001.htm，002.htm，……，100.htm）上的图片链接规律性不强；
>> 3.
每个页面只需要保存一个需要的图片，页面上也有一些不需要的图片，但是都是固定链接，比如每个页面有“图片A”，它的链接是http://www.aaa.com/logo.jpg，怎么排除这些链接？
>> 4.
保存的图片文件能不能连续排号，比如001.htm的图片（已经排除掉条件3中的不需要的图片），保存后的图片是001.jpg，以此，100.htm需要保存的图片是100.jpg。
>> _______________________________________________
> wget -l0 -p --reject=log.jpg http://www.aaa.com/
> _______________________________________________
> Chinese mailing list
> Chinese at lists.fedoraproject.org
> https://admin.fedoraproject.org/mailman/listinfo/chinese
>
 _______________________________________________
 Chinese mailing list
 Chinese at lists.fedoraproject.org
 https://admin.fedoraproject.org/mailman/listinfo/chinese 

2024

2023

2022

2021

2020

2019

2018

2017

2016

2015

2014

2013

2012

2011

2010

Re: [FZH] 用什么下载工具能实现批量下载呢？