Excel | 用三個指令,思考爬蟲邏輯演算法(以工研院產業學院課程網頁為例)

Excel | 用三個指令,思考爬蟲邏輯演算法(以工研院產業學院課程網頁為例)

繼上一篇實作篇:<Excel | 三個指令輕鬆完成excel爬蟲實作,以工研院產業學院課程網頁為例>
此篇談論策略,起心動念很簡單,藉由網路上的資料,可以透過某些功能與函數達成下載網頁資料到Excel表格中,而Excel表格中可利用函式找到需要的資訊。

策略發想

大概想了想,需要三個步驟:
  1. 下載網頁資料
  2. 找到資料所在的位置
  3. 把資料呈現到想要的表格

首先,將工研院產業學院網頁上的資料,下載至Excel中。
圖一.下載的資料 

從位置A112得到黑修斯需要的資料,而A113為需要回傳的資料。
圖二.下載的資料(續) 
MATCH()函式
利用MATCH()函式,找到需要的資料在A112的位置。
圖三.MATCH()使用說明 

ADDRESS()函式
利用ADDRESS()函式,還原正確的位置格式,並回傳A113位置的資料。下圖中A113格顯示 工作表3!A113 ,代表工作表3中的A113位置。
圖四.ADDRESS()使用說明
INDIRECT()函式
獲得正確位置後,下一步是將位置上的資料傳到想要呈現資料的地方,這個時候使用INDIRECT()函式完成任務。
圖五.INDIRECT()使用說明 

結論

藉由三個指令,完成所需要的任務,就如同演算法,而演算法更白話的說法就像是食譜,透過一個步驟一個步驟的執行,終將完成一道美味佳餚。
此篇主要是紀錄當初做這個Excel爬蟲實驗的發想,希望日後有助於回想,也能幫助需要的讀者。


轉貼本文時,需註明來自黑修斯隨手札記原創作者 hughes chen(黑修斯),及附上原文連結,同時 禁止修改,禁止商業使用 。

張貼留言

0 留言