资讯中心

第 5 篇:URL 组成、编码与 URL 解析

📅 2026/6/26 10:58:11
第 5 篇:URL 组成、编码与 URL 解析
一、URL:互联网的"门牌号"URL(Uniform Resource Locator)是你和爬虫每天打交道最多的东西。一个看似简单的 URL 背后,藏着很多学问:为什么 URL 里中文会变成%E4%B8%AD??后面那一串key=valuekey=value是什么?https://和http://的区别在哪?www.example.com:8080那个 8080 是干嘛的?#fragment会被服务器收到吗?这一篇,我们把 URL 拆到不能再碎。二、URL 的 9 大组成部分一个完整的 URL 最多包含 9 个部分(部分可省略):https://user:pass@www.example.com:8080/path/to/resource?key1=val1key2=val2#section2 └─┬─┘ └────┬─────┘ └──────┬──────┘└─┬─┘└──────┬──────┘ └─────────┬─────────┘└───┬────┘ │ │ │ │ │