如何去除\t之前的文字?
2020/02/29 下午 11:37
機器學習共學討論版
Jason
觀看數:17
回答數:2
收藏數:0
請問如何將http之前的所有東西去除只留下網址可以進行讀取處理?
回答列表
-
2020/03/01 上午 00:38Allen贊同數:1不贊同數:1留言數:3
可以再使用一次split方法對 "\t"分割。
-
2020/03/02 上午 00:16張維元 (WeiYuan)贊同數:2不贊同數:0留言數:0
補充說明一下:
題目的 split('\n') 是把原本的 csv data 用換行切成一筆一筆的資料,轉成 DataFrame 就會有一筆一筆的資料。但我們觀察到每一筆資料是由 「編號 + \t + 網址」 的模式組成的,因此題目要求你把每一筆資料的 編號 與 網址 分開來。這邊有兩種做法:
① 轉成 DataFrame 前,用迴圈對每一筆資料再用 \t 切割一次
② 轉成 DataFrame 後,利用 DataFrame 的 split 方法對整個欄位資料一次切割
如果這個回答對你有幫助請主動點選「有幫助」的按鈕,也可以追蹤我的 GITHUB 帳號。若還有問題的話,也歡迎繼續再追問或者把你理解的部分整理上來,我都會提供你 Review 和 Feedback 😃😃😃