Python中实现URL的解析

小编 Python (336) 2023-04-11 23:59:31

在Python中的urlparse模块主要是用于解析url中的参数对url按照一定格式进行拆分或拼接

1.urlparse.urlparse

将url分为6个部分，返回一个包含6个字符串项目的元组：协议、位置、路径、参数、查询、片段。

importurlparse
url_change=urlparse.urlparse('https://i.cnblogs.com/EditPosts.aspx?opt=1')
printurl_change

　　输出结果为：

ParseResult(scheme='https',netloc='i.cnblogs.com',path='/EditPosts.aspx',params='',query='opt=1',fragment='')

其中 scheme 是协议 netloc 是域名服务器 path 相对路径 params是参数，query是查询的条件

urlparse.parse_qs(urlparse.urlparse(url).query)

这个是获取urlparse分割后元祖中的某一项 urlparse.urlparse(url).query 获取查询条件

parse_qs 有几种实现

urlparse.parse_qs返回字典
urlparse.parse_qsl返回列表

2. urlparse.urlsplit

和urlparse差不多，将url分为5部分，返回一个包含5个字符串项目的元组：协议、位置、路径、查询、片段。

importurlparse
url_change=urlparse.urlsplit('https://i.cnblogs.com/EditPosts.aspx?opt=1')
printurl_change
SplitResult(scheme='https',netloc='i.cnblogs.com',path='/EditPosts.aspx',query='opt=1',fragment='')

其中 scheme 是协议 netloc 是域名服务器 path 相对路径 query是查询的条件

3.urlparse.urljoin

将相对的地址组合成一个url，对于输入没有限制，开头必须是http://，否则将不组合前面。

importurlparse
new_url=urlparse.urljoin('https://baidu.com/ssss/','88888')
printnew_url
输出https://baidu.com/ssss/88888

如果输入错误信息如 new_url = urlparse.urljoin('122','88888') 并不会将两者合并输出‘88888’

THE END

发表回复取消回复

请先登录账户再评论哦

在Python中如何获取元素在数组中的索引号？

python中try except语句块怎么用？

Python中实现URL的解析

发表回复取消回复

相关文章阅读

python autoenv怎么用

python中如何画三维的图形？

python列表生成式的两种语法

如何用python画极坐标雷达图？

栏目最新文章

python autoenv怎么用

适合程序猿的专属代理IP

热门文章

Ip修改器的用途有哪些？

可以实现换IP的渠道有哪些呢？

代理IP在游戏中起到什么作用

代理ip能够解决什么问题？

换IP软件的操作原理是什么？

标签云

四叶天IP代理

Python中实现URL的解析

发表回复 取消回复

相关文章阅读

python autoenv怎么用

python中如何画三维的图形？

python列表生成式的两种语法

如何用python画极坐标雷达图？

栏目最新文章

python autoenv怎么用

适合程序猿的专属代理IP

热门文章

Ip修改器的用途有哪些？

可以实现换IP的渠道有哪些呢？

代理IP在游戏中起到什么作用

代理ip能够解决什么问题？

换IP软件的操作原理是什么？

标签云

四叶天IP代理

发表回复取消回复