網際知識管家 CyberArticle 設定獲得文章正文外掛, Web Page Collector Software, eBook Software

友情鏈結

官方博客

網際知識管家 CyberArticle 設定取得文章正文外掛, Web Page Collector Software, eBook Software

WizBrother/CyberArticle/設定取得文章正文外掛

友情鏈結

官方博客

該外掛允許您在儲存網頁的時候，或者使用「批次文章處理」功能的時候，透過自訂的規則，來獲得文章正文，以去除不必要的廣告等其它資訊。

獲得文章正文外掛作用，就是透過自訂的一些規則，來獲得文章正文：下面的對話框，顯示了目前存在的規則。

匯入按鈕：允許從XML檔案匯入規則。您可以從使用者交流區，獲得其他使用者提供的規則。

匯出按鈕，允許將目前的規則，儲存成XML檔案，您可以將這個XML檔案，提供給其他使用者使用。

新增按鈕：允許您自己新增一個規則

編輯按鈕：允許您編輯已經存在的規則

刪除按鈕：允許您刪除存在的規則

複製按鈕：允許您複製一個已經存在的規則

向上按鈕：向上移動規則

向下按鈕：向下移動規則

規則：

描述：規則的描述

網址：規則適用的網址。程式會在網頁的原始網址裡面尋找，如果找到規則指定的網址，則使用該規則，否則不使用。如果網址為空，則適用於所有網頁。

尋找正文開始的文字：用來尋找文章HTML正文開始部分的文字標記，例如新浪新聞網頁裡面，文章正文開始，會有「」這樣的文字。

正則表示式：尋找正文開始的文字是一個正規表達式。

匹配大小寫：尋找正文開始的文字，需要匹配大小寫。

尋找正文結束的文字：用來尋找文章HTML正文結束部分的文字標記。

新增到正文之前的文字：程式將會把這部分文字，新增到已經獲得的文章正文前面。

裡面可以使用以下參數：

%NodeTitle%：會使用文章標題進行取代。

%NodeURL%：會使用文章來源URL進行取代。

追加到正文之後的文字：程式會把這部分文字，追加到已經獲得的文章正文之後。同樣，程式會取代上面的參數。

包含標記文字：在獲得的文章正文裡面，包含進行標記的文字。

包含HTML頭：最終的文章結果，包含HTML的 HEAD部分。

注意：

在瀏覽器內，選擇「檢視原始碼」功能看到的網頁原始碼，可能和CyberArticle獲得的網頁原始碼有所不同，因此，建議您先儲存一個網頁，然後在CyberArticle裡面檢視儲存後的網頁的原始碼，來尋找合適的文字標記，以取得文章正文。