如題,藍(lán)天采集器要采集多層級(jí)的網(wǎng)頁時(shí),例如一些常見的模板站。模板站除了有列表頁,詳情介紹頁,然后還有一個(gè)展示演示地址的DEMO頁面,而DEMO頁面里面又是框架調(diào)用了外部的鏈接。這種情況下如何使用藍(lán)天集體器來采集呢?
其他的設(shè)置照常如采集普通網(wǎng)站一樣設(shè)置,然后到內(nèi)容起始頁的時(shí)候我們這樣來設(shè)置。如圖:
首先,加多一個(gè)層級(jí):
然后點(diǎn)開這個(gè)層級(jí)進(jìn)行設(shè)置他的抓取列表內(nèi)容。這里抓取的就是我們平時(shí)采集時(shí)的列表頁,抓取有多少篇文章。
設(shè)置好之后,第二步:設(shè)置詳情頁中點(diǎn)擊打開的DEMO網(wǎng)址獲取地址。也就是詳情頁中的跳轉(zhuǎn)地址。
列表設(shè)置就設(shè)置完了?,F(xiàn)在是設(shè)置內(nèi)容頁。選擇你想要獲取的字段,可以從剛才的列表中獲取,也可以說跳轉(zhuǎn)后的內(nèi)容頁中獲取。
設(shè)置完成,并保存,就可以進(jìn)入采集發(fā)布了。是不是很簡(jiǎn)單呢?希望對(duì)您有所幫助。
我們的網(wǎng)站后臺(tái)默認(rèn)有一個(gè)留言的提醒數(shù)據(jù):但是如果要有多個(gè)留言表單,那么我們自定義的留言表單卻沒有這個(gè)...
在之前的文章中,我們有講過,如何使用擴(kuò)展字段來此入HTML代碼并添加預(yù)覽功能。文章鏈接可查看:https://ww...
以下內(nèi)容來源于PB交流QQ群。第一:NGINX配置。#攔截常見敏感后臺(tái)路徑訪問(例如dede、admin、wp-login等),...
在外貿(mào)網(wǎng)站建設(shè)中,我們會(huì)遇到有客戶說需要用戶前端留言的時(shí)候可以上傳自定義的文件或者圖片等資料。那么這...