火車采集器使用教程介紹,采集規(guī)則寫法介紹
時間:2021-03-12 13:15:17 作者:無名 瀏覽量:53
如果你經(jīng)常會在大型的新聞或者資訊
網(wǎng)站中發(fā)表文章的話,一篇一篇的發(fā)送的話就會很耽誤時間,同時也耽誤我們工作的效率。為了提高更新網(wǎng)站的效率,這就能夠使用火車頭
采集器這款工具,在使用這款工具的過程中,需要提前設(shè)置采集規(guī)則,才能夠有更高的效率進行發(fā)送。本篇文章給大家來分享的就是火車頭采集器這款工具的采集規(guī)則寫法介紹,幫助小伙伴們更快的上手進行使用,快來詳細的了解一下吧!
方法介紹
1. 新建文章采集節(jié)點
我們打開火車采集器這款工具之后,成功登錄這款工具之后,我們在軟件主頁面中依次點擊“采集—采集節(jié)點管理—增加新節(jié)點—選擇普通文章”,以上選項完成之后,點“確定”按鈕進行下一步。
2. 填寫采集列表規(guī)則
節(jié)點名稱:在這里可以隨便進行編寫,但是需要用自己分清楚,因為節(jié)點多了會產(chǎn)生混亂。
匹配網(wǎng)址:是在采集目標列表頁面中,更好的查看列表的規(guī)則。在使用過程中,建議大家從第二頁開始進行采集查看,因為很多網(wǎng)站的列表的第一面跟其它內(nèi)頁是有很大的差別。
火車采集器使用教程介紹圖二
區(qū)域結(jié)束的HTML:在采集目標列表頁打開源代碼!在要采集的文章標題后面的附近找一段在本頁是唯一并且其它要采集的的頁面也是唯一的html標簽!
以上選項設(shè)置完成后,直接點擊保存信息,更好的進入下一步。如果規(guī)則寫作全部正確之后,就會出現(xiàn)內(nèi)容的網(wǎng)址獲取規(guī)則測試。
3. 采集內(nèi)容規(guī)則
文章標題:在文章標題的前后找兩個標簽之后,能夠幫助用戶更好的識別標題。
火車采集器使用教程介紹圖三
文章內(nèi)容:在文章內(nèi)容前后找兩個標簽,能識別出內(nèi)容的!采集的網(wǎng)站的文章內(nèi)容前后唯一標簽是<div class=”content”>…<ul class=”page clearfix”>,所以就寫成<div class=”content”>[內(nèi)容]<ul class=”page clearfix”>。
對于其他的功能也不用管了,確定之后點擊保存配置同時進行預(yù)覽,如果前面的列表規(guī)則跟內(nèi)容規(guī)則都寫對了的話,那現(xiàn)在就會預(yù)覽到內(nèi)容。
- 軟件性質(zhì):國產(chǎn)軟件
- 授權(quán)方式:免費版
- 軟件語言:簡體中文
- 軟件大。23789 KB
- 下載次數(shù):4599 次
- 更新時間:2021/3/11 12:34:25
- 運行平臺:WinAll...
- 軟件描述:火車采集器是使用人數(shù)比較多的互聯(lián)網(wǎng)數(shù)據(jù)挖掘軟件。能采集99%的網(wǎng)頁,就算網(wǎng)頁需要... [立即下載]
相關(guān)資訊
相關(guān)軟件