Python知識(shí)分享網(wǎng) - 專(zhuān)業(yè)的Python學(xué)習(xí)網(wǎng)站 學(xué)Python,上Python222
python網(wǎng)絡(luò)爬蟲(chóng) PDF 下載
發(fā)布于:2024-03-15 10:55:07
(假如點(diǎn)擊沒(méi)反應(yīng),多刷新兩次就OK!)

python網(wǎng)絡(luò)爬蟲(chóng) PDF 下載 圖1

 

 

資料內(nèi)容:

4、URL的理解和舉例

URL是URI的一個(gè)子集。它是 Uniform Resource Locator的縮寫(xiě),譯為“統(tǒng)一資源定位符”。

通俗地說(shuō),URL是Internet上描述信息資源的字符串,主要用在各種wwW客戶(hù)程序和服務(wù)器程序上。

采用URL可以用一種統(tǒng)一的格式來(lái)描述各種信息資源,包括文件、服務(wù)器的地址和目錄等。

URL的格式由三部分組成:

①第一部分是協(xié)議(或稱(chēng)為服務(wù)方式)。

②第二部分是存有該資源的主機(jī)IP地址(有時(shí)也包括端口號(hào)).③第三部分是主機(jī)資源的具體地址,如目錄和文件名等。第一部分和第二部分用“://”符號(hào)隔開(kāi),

第二部分和第三部分用“I”符號(hào)隔開(kāi)。

第一部分和第二部分是不可缺少的,第三部分有時(shí)可以省略。

下面來(lái)看看兩個(gè)URL的小例子。

1.HTTP協(xié)議的URL示例:

使用超級(jí)文本傳輸協(xié)議HTTP,提供超級(jí)文本信息服務(wù)的資源。例: http://www.peopledaily.com.cn/channel/welcome.htm其計(jì)算機(jī)域名為www.peopledaily.com.cn。

超級(jí)文本文件(文件類(lèi)型為.html)是在目錄/channel 下的welcome.htm。

這是中國(guó)人民日?qǐng)?bào)的一臺(tái)計(jì)算機(jī)。

例:http://www.rol.cn.net/talk/talk1.htm其計(jì)算機(jī)域名為www.rol.cn.net。

超級(jí)文本文件(文件類(lèi)型為.html)是在目錄/talk下的 talk1.htm。這是瑞得聊天室的地址,可由此進(jìn)入瑞得聊天室的第1室。