上次,我教你如何安裝章魚收集器。這個小編將向你展示如何使用octopus collector并開始你的第一次數(shù)據(jù)收集。熟練之后,就可以隨心所欲的抓取想要的數(shù)據(jù),比如天氣數(shù)據(jù),購物網(wǎng)站數(shù)據(jù)等。
用這些數(shù)據(jù)來分析社會,了解人們的需求,讓數(shù)據(jù)遙不可及!
第一步
我們找到octopus collector的安裝位置,雙擊或者右鍵——打開運行【Octopus.exe】,右鍵不能運行的伙伴——以管理員身份運行;也可以通過桌面上章魚收集器的快捷操作方式打開。
第二步
開始運行后,會彈出登錄界面。如果您沒有帳戶,可以點擊免費注冊進行注冊。
第三步
登錄后,進入主界面。如果你剛開始使用它,可能會彈出一個調(diào)查問卷。如實填寫即可。
當我們將光標移動到新建按鈕時,會顯示一個下拉菜單,分別是自定義任務(wù)、模板任務(wù)、導入任務(wù)和新建任務(wù)組。我們在這里選擇模板任務(wù)。
第四步
章魚收集器在這里為我們預設(shè)了很多模板,在這里邊肖用JD.COM作為演示內(nèi)容。
第五步
點擊選擇JD.COM,會出現(xiàn)幾個不同功能的模板。這里我們點開第一個【JD。COM-商品搜索]。
單擊[立即使用]
第六步
這個界面是設(shè)置抓取內(nèi)容參數(shù)的,我們會一一講解。
任務(wù)名稱:顧名思義,設(shè)置這個任務(wù)的名稱。
任務(wù)組:這個任務(wù)將被歸入哪個組?因為我們沒有設(shè)置,所以只有一個【我的任務(wù)組】。朋友可以創(chuàng)建自己的組,在[新建]按鈕中選擇[新建任務(wù)組]。
搜索關(guān)鍵字:您希望在網(wǎng)頁中搜索已爬網(wǎng)的內(nèi)容。
頁數(shù):爬取了多少頁數(shù)據(jù),未指定為全部爬取。
在這里,邊肖設(shè)置抓取3頁的手機數(shù)據(jù)。點擊【保存并開始】開始抓取。
第七步
點擊后會彈出這個界面。有條件的朋友可以購買【云收藏服務(wù)】。這里邊肖使用[開始本地收集]。
稍作等待后,軟件會自動開始抓取指定頁面上的數(shù)據(jù)。
在這里,邊肖沒有等待所有的抓取完成,并點擊停止收集。這里我們可以選擇直接導出或者以后導出。
第八步
如果單擊[導出數(shù)據(jù)],我們可以指定導出格式。在這里,邊肖被導出到Excel。
選擇導出位置
導出完畢
查看內(nèi)容
到這里八爪魚采集器新手采集教程就結(jié)束了,爬取數(shù)據(jù)是不是很有意思呢,當各位熟練八爪魚采集器的各項操作后,就可以爬取自己想要的數(shù)據(jù)了,希望本文能為初次使用的小伙伴們帶來幫助。