上次,我教你如何安裝章魚收集器。這個(gè)小編將向你展示如何使用octopus collector并開始你的第一次數(shù)據(jù)收集。熟練之后,就可以隨心所欲的抓取想要的數(shù)據(jù),比如天氣數(shù)據(jù),購(gòu)物網(wǎng)站數(shù)據(jù)等。
用這些數(shù)據(jù)來(lái)分析社會(huì),了解人們的需求,讓數(shù)據(jù)遙不可及!
第一步
我們找到octopus collector的安裝位置,雙擊或者右鍵——打開運(yùn)行【Octopus.exe】,右鍵不能運(yùn)行的伙伴——以管理員身份運(yùn)行;也可以通過(guò)桌面上章魚收集器的快捷操作方式打開。
第二步
開始運(yùn)行后,會(huì)彈出登錄界面。如果您沒有帳戶,可以點(diǎn)擊免費(fèi)注冊(cè)進(jìn)行注冊(cè)。
第三步
登錄后,進(jìn)入主界面。如果你剛開始使用它,可能會(huì)彈出一個(gè)調(diào)查問(wèn)卷。如實(shí)填寫即可。
當(dāng)我們將光標(biāo)移動(dòng)到新建按鈕時(shí),會(huì)顯示一個(gè)下拉菜單,分別是自定義任務(wù)、模板任務(wù)、導(dǎo)入任務(wù)和新建任務(wù)組。我們?cè)谶@里選擇模板任務(wù)。
第四步
章魚收集器在這里為我們預(yù)設(shè)了很多模板,在這里邊肖用JD.COM作為演示內(nèi)容。
第五步
點(diǎn)擊選擇JD.COM,會(huì)出現(xiàn)幾個(gè)不同功能的模板。這里我們點(diǎn)開第一個(gè)【JD。COM-商品搜索]。
單擊[立即使用]
第六步
這個(gè)界面是設(shè)置抓取內(nèi)容參數(shù)的,我們會(huì)一一講解。
任務(wù)名稱:顧名思義,設(shè)置這個(gè)任務(wù)的名稱。
任務(wù)組:這個(gè)任務(wù)將被歸入哪個(gè)組?因?yàn)槲覀儧]有設(shè)置,所以只有一個(gè)【我的任務(wù)組】。朋友可以創(chuàng)建自己的組,在[新建]按鈕中選擇[新建任務(wù)組]。
搜索關(guān)鍵字:您希望在網(wǎng)頁(yè)中搜索已爬網(wǎng)的內(nèi)容。
頁(yè)數(shù):爬取了多少頁(yè)數(shù)據(jù),未指定為全部爬取。
在這里,邊肖設(shè)置抓取3頁(yè)的手機(jī)數(shù)據(jù)。點(diǎn)擊【保存并開始】開始抓取。
第七步
點(diǎn)擊后會(huì)彈出這個(gè)界面。有條件的朋友可以購(gòu)買【云收藏服務(wù)】。這里邊肖使用[開始本地收集]。
稍作等待后,軟件會(huì)自動(dòng)開始抓取指定頁(yè)面上的數(shù)據(jù)。
在這里,邊肖沒有等待所有的抓取完成,并點(diǎn)擊停止收集。這里我們可以選擇直接導(dǎo)出或者以后導(dǎo)出。
第八步
如果單擊[導(dǎo)出數(shù)據(jù)],我們可以指定導(dǎo)出格式。在這里,邊肖被導(dǎo)出到Excel。
選擇導(dǎo)出位置
導(dǎo)出完成
查看內(nèi)容
至此,新手章魚收藏家收藏教程結(jié)束。抓取數(shù)據(jù)有意思嗎?當(dāng)你熟練了章魚收集器的操作,你就可以抓取你想要的數(shù)據(jù)了。希望這篇文章能對(duì)初次使用的用戶有所幫助。