logo
Loading...

REGEX:ASCII & url 問題 - Cupoy

您好,看了解答還是沒有很懂下面這兩部分的regex,可以比較詳細的說明嗎?下面我較清楚的說一下我哪裡...

REGEX:ASCII & url 問題

2020/03/22 05:58 下午
Python網路爬蟲討論版
葉素芳
觀看數:8
回答數:2
收藏數:0

您好,看了解答還是沒有很懂下面這兩部分的regex,可以比較詳細的說明嗎?下面我較清楚的說一下我哪裡不懂,共4小點問題...看了維基的ASCLL的說明還是沒有很懂他是甚麼。


hostname的名稱是以句號區隔所組成,每一個部分可以是ASCII字元、數字、連字號,但不能以連字號開始或結束,因此我們寫成:([a-z0-9]\.|[a-z0-9][-a-z0-9]*[a-z0-9]\.)+ 

這邊大概是說hostname的形式應該是"x.",這邊想請老師解釋:

1. [a-z0-9] 是什麼?

2. [-a-z0-9] 是什麼?跟上面那一個的差異?

3. [a-z0-9][-a-z0-9]*[a-z0-9] 是什麼?尤其是*的意思

URL的path 部分,可以有除了空白字元、控制字元<>(){}以外的大部分ASCII字元,因此我們寫成:[-a-z0-9_:@&?=+,.!\/~*\'%$]*

4. 這邊大概可以理解-a-z0-9是ASCLL,但後面那一串完全不懂是怎麼列出來的。