之前给大家详细讲解过使用python去做了一系列的使用,其中最受大家欢迎的就是关于爬取内容了,最简单的就是数据爬取,后来还跟大家讲解过视频爬取,虽然大家现在都已经熟练掌握要怎么去运行这些内容,但是小编还是想针对这个爬取内容,给大家在详细概括下实例内容,比如今日要讲解的爬取音乐,详细内容请看下文哈~
本文内容主要介绍了python使用beautifulsoup4爬取酷狗音乐代码实例。
安装方法:
pipinstallbeautifulsoup4
实现完整代码如下
importrequests
frombs4importBeautifulSoup
importtime
headers={"User-Agent":"Mozilla/5.0(WindowsNT10.0;WOW64)AppleWebKit/537.36(KHTML,likeGecko)Chrome/63.0.3239.132Safari/537.36"}
defget_info(url):
wb_data=requests.get(url,headers=headers)
soup=BeautifulSoup(wb_data.text,'lxml')
#ranks=soup.select('#rankWrap>div.pc_temp_songlist>ul>li>span.pc_temp_num>strong')
titles=soup.select('#rankWrap>div.pc_temp_songlist>ul>li>a')
times=soup.select('#rankWrap>div.pc_temp_songlist>ul>li>span.pc_temp_tips_r>span')
fortitle,timeinzip(titles,times):
data={
'title':title.get_text().split('-')[0],
'song':title.get_text().split('-')[1],
'time':time.get_text().strip()
}
print(data)
#主函数(爬取酷狗TOP500歌曲)
if__name__=='__main__':
urls=['https://www.kugou.com/yy/rank/home/{}-8888.html'.format(str(i))foriinrange(1,3)]
forurlinurls:
get_info(url)
time.sleep(1)
大家可以以这个实例为参考,直接导入实例到自己的编程软件里,去试试是否可以实现一样的内容,同时大家也可以进行模仿,爬取自己喜欢的音乐哦~
上一篇