爬取动漫图片：以后就有好看的桌面背景啦

小编 Python (258) 2023-06-26 13:37:14

正文

话不多说，直接上完整代码

importrequestsasr
importre
importos
importtime
file_name="动漫截图"
ifnotos.path.exists(file_name):
	os.mkdir(file_name)

forpinrange(1,34):
print("--------------------正在爬取第{}页内容------------------".format(p))
url='https://www.acgimage.com/shot/recommend?page={}'.format(p)
headers={"user-agent"
:"Mozilla/5.0(WindowsNT10.0;WOW64)AppleWebKit/537.36(KHTML,likeGecko)Chrome/80.0.3987.162Safari/537.36"}

resp=r.get(url,headers=headers)
html=resp.text

images=re.findall('data-original="(.*?)"',html)
names=re.findall('title="(.*?)"',html)
#print(images)
#print(names)
dic=dict(zip(images,names))
forimageinimages:
time.sleep(1)
print(image,dic[image])
name=dic[image]
#name=image.split('/')[-1]
i=r.get(image,headers=headers).content
try:
withopen(file_name+'/'+name+'.jpg','wb')asf:
f.write(i)
exceptFileNotFoundError:
continue

先导入要使用的库

importrequestsasr
importre
importos
importtime

然后去分析要去爬的网址：动漫截图网

下图是网址的内容：

好了 url已经确定

下面去寻找headers

找到下面是代码展示

url='https://www.acgimage.com/shot/recommend?page={}'.format(p)
headers={"user-agent"
:"Mozilla/5.0(WindowsNT10.0;WOW64)AppleWebKit/537.36(KHTML,likeGecko)Chrome/80.0.3987.162Safari/537.36"
}

然后检索要爬的图片内容

从上图就可以找到图片的位置：data-origina=后面的内容
以及图片的名字：title=后面的内容

然后用正则表达式re来检索就行了

images=re.findall('data-original="(.*?)"',html)
names=re.findall('title="(.*?)"',html)

最后将其保存就好了

i=r.get(image,headers=headers).content
withopen(file_name+'/'+name+'.jpg','wb')asf:
f.write(i)

然后将page后面的数字改动就可以跳到相应的页面
换页的问题也就解决了

orpinrange(1,34):
url='https://www.acgimage.com/shot/recommend?page={}'.format(p)

以及将爬到的图片放到自己建立的文件zh
使用了os库

file_name="动漫截图"
ifnotos.path.exists(file_name):
os.mkdir(file_name)

更多python相关文章，请关注python自学网。

THE END

发表回复取消回复

请先登录账户再评论哦

python有什么ide吗

Python入门必读的赋值运算符

爬取动漫图片：以后就有好看的桌面背景啦

正文

发表回复取消回复

相关文章阅读

python autoenv怎么用

python中如何画三维的图形？

python列表生成式的两种语法

如何用python画极坐标雷达图？

栏目最新文章

python autoenv怎么用

适合程序猿的专属代理IP

热门文章

Ip修改器的用途有哪些？

可以实现换IP的渠道有哪些呢？

代理IP在游戏中起到什么作用

代理ip能够解决什么问题？

换IP软件的操作原理是什么？

标签云

四叶天IP代理

爬取动漫图片：以后就有好看的桌面背景啦

正文

发表回复 取消回复

相关文章阅读

python autoenv怎么用

python中如何画三维的图形？

python列表生成式的两种语法

如何用python画极坐标雷达图？

栏目最新文章

python autoenv怎么用

适合程序猿的专属代理IP

热门文章

Ip修改器的用途有哪些？

可以实现换IP的渠道有哪些呢？

代理IP在游戏中起到什么作用

代理ip能够解决什么问题？

换IP软件的操作原理是什么？

标签云

四叶天IP代理

发表回复取消回复