跳到主要內容

發表文章

目前顯示的是 2月, 2021的文章

[Scrapy教學10]不可不知的Scrapy框架爬取下一層網頁資料實作

Photo by Surface on Unsplash 想要進行資料分析,除了利用Python網頁爬蟲蒐集第一層的網頁資料外,有時候為了要 更瞭解資料的內容或是 讓分析的結果更加精確,就會需要爬取下一層的網頁,也就是詳細資料。 舉例來說,筆者想要對不同廠牌的筆電進行分析,這時候使用Python網頁爬蟲除了取得網頁第一層的筆電名稱外,還需要爬取每個筆電的下一層網頁,來取得詳細的規格內容,才有辦法進行比較。

[Scrapy教學9]一定要懂的Scrapy框架結合Gmail寄送爬取資料附件秘訣

Photo by Solen Feyissa on Unsplash 在Python網頁爬蟲蒐集資料的過程中,除了能夠將資料 存入資料庫 或 匯出成檔案 外,另一個最常應用的場景就是「訊息通知」,也就是在利用Python網頁爬蟲蒐集到所需的資料後,透過訊息通知的管道來推送資料結果。 舉例來說, [Python爬蟲教學]Python網頁爬蟲結合LINE Notify打造自動化訊息通知服務 文章整合了LINE Notify服務,來通知使用者Python網頁爬蟲取得的降價訊息,而本文則要來和大家分享另一個訊息通知管道的結合,也就是電子郵件。

[Scrapy教學8]詳解Scrapy框架爬取分頁資料的實用技巧

Photo by Austin Distel on Unsplash 相信大家在瀏覽網頁的經驗中,都有看過利用分頁的方式來呈現,將內容切分為好幾頁,除了能夠提升網頁的執行效率外,也增加了使用者的體驗。 在前面的Scrapy網頁爬蟲框架系列教學中,皆分享了爬取單一網頁的內容,這時候如果想要利用Scrapy網頁爬蟲框架來爬取多頁的資料,該如何實作呢?本文就來延續 [Scrapy教學7]教你Scrapy框架匯出CSV檔案方法提升資料處理效率 文章的教學內容,一起來學習這個技巧吧。