上次,我教你如何安裝章魚(yú)收集器。這個(gè)小編將向你展示如何使用octopus collector并開(kāi)始你的第一次數(shù)據(jù)收集。熟練之后,就可以隨心所欲的抓取想要的數(shù)據(jù),比如天氣數(shù)據(jù),購(gòu)物網(wǎng)站數(shù)據(jù)等。
用這些數(shù)據(jù)來(lái)分析社會(huì),了解人們的需求,讓數(shù)據(jù)遙不可及!
第一步
我們找到octopus collector的安裝位置,雙擊或者右鍵——打開(kāi)運(yùn)行【Octopus.exe】,右鍵不能運(yùn)行的伙伴——以管理員身份運(yùn)行;也可以通過(guò)桌面上章魚(yú)收集器的快捷操作方式打開(kāi)。
第二步
開(kāi)始運(yùn)行后,會(huì)彈出登錄界面。如果您沒(méi)有帳戶,可以點(diǎn)擊免費(fèi)注冊(cè)進(jìn)行注冊(cè)。
第三步
登錄后,進(jìn)入主界面。如果你剛開(kāi)始使用它,可能會(huì)彈出一個(gè)調(diào)查問(wèn)卷。如實(shí)填寫(xiě)即可。
當(dāng)我們將光標(biāo)移動(dòng)到新建按鈕時(shí),會(huì)顯示一個(gè)下拉菜單,分別是自定義任務(wù)、模板任務(wù)、導(dǎo)入任務(wù)和新建任務(wù)組。我們?cè)谶@里選擇模板任務(wù)。
第四步
章魚(yú)收集器在這里為我們預(yù)設(shè)了很多模板,在這里邊肖用JD.COM作為演示內(nèi)容。
第五步
點(diǎn)擊選擇JD.COM,會(huì)出現(xiàn)幾個(gè)不同功能的模板。這里我們點(diǎn)開(kāi)第一個(gè)【JD。COM-商品搜索]。
單擊[立即使用]
第六步
這個(gè)界面是設(shè)置抓取內(nèi)容參數(shù)的,我們會(huì)一一講解。
任務(wù)名稱:顧名思義,設(shè)置這個(gè)任務(wù)的名稱。
任務(wù)組:這個(gè)任務(wù)將被歸入哪個(gè)組?因?yàn)槲覀儧](méi)有設(shè)置,所以只有一個(gè)【我的任務(wù)組】。朋友可以創(chuàng)建自己的組,在[新建]按鈕中選擇[新建任務(wù)組]。
搜索關(guān)鍵字:您希望在網(wǎng)頁(yè)中搜索已爬網(wǎng)的內(nèi)容。
頁(yè)數(shù):爬取了多少頁(yè)數(shù)據(jù),未指定為全部爬取。
在這里,邊肖設(shè)置抓取3頁(yè)的手機(jī)數(shù)據(jù)。點(diǎn)擊【保存并開(kāi)始】開(kāi)始抓取。
第七步
點(diǎn)擊后會(huì)彈出這個(gè)界面。有條件的朋友可以購(gòu)買(mǎi)【云收藏服務(wù)】。這里邊肖使用[開(kāi)始本地收集]。
稍作等待后,軟件會(huì)自動(dòng)開(kāi)始抓取指定頁(yè)面上的數(shù)據(jù)。
在這里,邊肖沒(méi)有等待所有的抓取完成,并點(diǎn)擊停止收集。這里我們可以選擇直接導(dǎo)出或者以后導(dǎo)出。
第八步
如果單擊[導(dǎo)出數(shù)據(jù)],我們可以指定導(dǎo)出格式。在這里,邊肖被導(dǎo)出到Excel。
選擇導(dǎo)出位置
導(dǎo)出完畢
查看內(nèi)容
到這里八爪魚(yú)采集器新手采集教程就結(jié)束了,爬取數(shù)據(jù)是不是很有意思呢,當(dāng)各位熟練八爪魚(yú)采集器的各項(xiàng)操作后,就可以爬取自己想要的數(shù)據(jù)了,希望本文能為初次使用的小伙伴們帶來(lái)幫助。