# 基础知识 # URL 和HyperText 以及 HTTP一样,URL是WEB中的一个核心概念。他是浏览器用来检索WEB上公布的任何资源的机制。 URL是统一资源定位符的缩写(Uniform Resource Locator) URL由4部分组成: 协议 主机 端口 路径 URL的格式如下: `protocol :// hostname[:port]/path/[:parameters][?query]#fragment` 以下面的例例来分析URL的组成: http://www.example.com:80/path/to/myfile.html?key1=value1&key2=value2#SomewhereInTheDocument `http` 是协议,也可以是https (http协议的安全版本), 也可以是其他的协议,例如: ftp, file ... `www.example.com` 是域名,表示向哪个web服务器发起请求, 也可以直接使用IP Address。 `:80` 是端口号,WEB服务器根据端口号授予其资源的访问权限。 如果使用HTTP服务的标准端口(HTTP为80, HTTPS为443),则可以省略端口号。 `/path/to/myfile.html` 网络服务器上资源的路径 `?key1=value1&key2=value2` 是提供给网络服务器额外的参数,这些参数是用 `&` 分隔的键值对列表,WEB服务器可以使用这些参数来执行额外的操作。 `#SomewhereInTheDocument` 是资源本身的另一部分锚点,瞄点表示资源中的一种"书签", 只是给浏览器使用,`#`后面的部分(也称为片段标识符)不会发送给请求的服务器,给浏览器显示位于改书签位置的内容。 *protocol 指定传输协议* | protocol | description | | file | 表示资源是位于本地计算机上的文件,格式 `file:///` ,注意后边应是三个斜杠 | | ftp | 通过 FTP访问资源,格式 `ftp://` | | http | 通过 HTTP 访问该资源, 格式 `http://` | | https | 通过安全的 HTTPS 访问该资源, 格式 `https://` | | ed2k | 通过支持ed2k(专用下载链接)协议的P2P软件访问该资源,(代表软件:电驴) 格式 `ed2k://` |