Loading...

爬取PPT文章出現了錯誤：twisted.internet.error.ReactorNotRestartable - Cupoy

可以成功爬第一個版的全部文章，第二個版會出現錯誤如下：第一個版爬完有 2020-03-28 20:4...

scrapy

爬取PPT文章出現了錯誤：twisted.internet.error.ReactorNotRestartable

2020/03/28 下午 08:56

Python網路爬蟲討論版

Karen Wang

觀看數：36

回答數：3

收藏數：1

scrapy

可以成功爬第一個版的全部文章，第二個版會出現錯誤如下：

第一個版爬完有 2020-03-28 20:40:15 [scrapy.core.engine] INFO: Spider closed (finished)，也有成功存檔，但到了第二的板後好像twisted.internet.就卡住。請問是因為什麼問題？

回答列表

2020/03/29 上午 08:40

黃琳芹

贊同數：1

不贊同數：0

留言數：1

Hello,

我也遇到同樣的問題，在我上網查過之後，發現「process.start()」只需在for loop 跑完後執行一次即可順利運作了喔。

以下是我查到解法的網址，供您參考:

https://stackoverflow.com/questions/39946632/reactornotrestartable-error-in-while-loop-with-scrapy
2020/03/29 下午 08:26

張維元 (WeiYuan)

贊同數：1

不贊同數：0

留言數：1

嗨，Karen

琳芹的說明是正確的，根據官方的用法，一個爬蟲中只能有一個 process.start() 。

如果這個回答對你有幫助請主動點選「有幫助」的按鈕，也可以追蹤我的GITHUB帳號。若還有問題的話，也歡迎繼續再追問或者把你理解的部分整理上來，我都會提供你 Review 和 Feedback 😃😃😃
2020/04/10 上午 00:15

張維元 (WeiYuan)

贊同數：0

不贊同數：0

留言數：0

「請問：按照上面琳芹提供的解答，可以順利執行、下載。但再次按下執行鍵，就會出現錯誤。請問這是甚麼問題?? raise error.ReactorNotRestartable() 」

=> 你要整個爬蟲重啟的意思，應該是不允許同一段程式重複執行。

如果這個回答對你有幫助請主動點選「有幫助」的按鈕，也可以追蹤我的GITHUB帳號。若還有問題的話，也歡迎繼續再追問或者把你理解的部分整理上來，我都會提供你 Review 和 Feedback 😃😃😃