统一资源定位符
字数 747 2025-11-12 04:12:39
统一资源定位符
统一资源定位符是用于完整描述互联网上资源地址的字符串标识。其基本结构遵循固定格式:scheme:[//authority]path[?query][#fragment]。以https://www.example.com:443/search?q=test#results为例:
-
协议方案(scheme)指定访问机制
- 位于冒号前的部分定义通信协议类型
- 常见方案包括http、https、ftp、mailto等
- 示例中
https表示采用加密的HTTP传输协议
-
认证信息(authority)标识资源宿主
- 包含在双斜杠
//后的部分,格式为[userinfo@]host[:port] - 主机地址可以是域名(如
www.example.com)或IP地址 - 端口号省略时使用协议默认端口(https默认443端口)
- 包含在双斜杠
-
路径(path)定位具体资源
- 使用斜杠分隔的层级结构模拟文件系统目录
- 示例中
/search指向服务器上的搜索处理程序 - 路径区分大小写,通常使用小写字母和连字符
-
查询参数(query)传递附加条件
- 问号
?后接键值对组合,格式为key1=value1&key2=value2 - 示例中
q=test表示向搜索程序传递查询关键词 - 参数值需进行URL编码处理特殊字符(如空格转为%20)
- 问号
-
片段(fragment)指定资源片段
- 井号
#后接锚点标识,客户端本地使用 - 示例中
results使浏览器自动滚动到页面结果区域 - 该部分不会发送到服务器,仅用于客户端定位
- 井号
完整示例的解析过程:浏览器先通过DNS解析域名,建立HTTPS连接到443端口,向/search路径发送包含q=test参数的请求,获取响应后自动定位到results锚点处。