發(fā)布時(shí)間:2020-09-05
欄目:織夢(mèng)新聞
織夢(mèng)CMS是廣大站長所熟知優(yōu)秀CMS建站程序,是同類產(chǎn)品中用戶最多,口碑最好,功能最強(qiáng)的開源CMS程序,織夢(mèng)管理員之家專注與織夢(mèng)CMS方面的研究,所開發(fā)的織夢(mèng)采集俠能夠很好的兼容織夢(mèng)CMS各大版本。
隨著織夢(mèng)采集俠V2.2版的發(fā)布,插件的功能也越趨完善,加入了全新的RSS采集和頁面監(jiān)控采集功能,這兩款新功能彌補(bǔ)了根據(jù)關(guān)鍵詞采集的不足,只需要設(shè)置監(jiān)控頁和文章URL規(guī)則織夢(mèng)批量采集,便能夠定向采集某個(gè)站點(diǎn),某個(gè)欄目里面的內(nèi)容,正文部分再由織夢(mèng)采集俠正文識(shí)別系統(tǒng)來識(shí)別提取,無需進(jìn)行過多的設(shè)置便能輕松采集到需要的內(nèi)容。
編寫采集規(guī)則進(jìn)行采集的時(shí)代織夢(mèng)批量上傳內(nèi)容,也會(huì)即將成為過去,雖然現(xiàn)在織夢(mèng)采集俠的定向采集功能還有很多不足,未能很好的采集到出處、作者和發(fā)布時(shí)間等文章相關(guān)信息。但對(duì)于文章標(biāo)題、正文部分,算法基本能夠正確識(shí)別提取,正確率極高。
我們目前著手研究的新算法,將會(huì)對(duì)多個(gè)頁面進(jìn)行對(duì)比精確查找出標(biāo)題、正文部分織夢(mèng)文章批量自動(dòng)上傳助手,以及加入微調(diào)功能,手工輔助精確定位獲取標(biāo)題與正文。開發(fā)完成后,將會(huì)在下一版本中加入。
采集的用途很廣泛,比如行業(yè)網(wǎng)站,需要采集一些行業(yè)相關(guān)的新聞;設(shè)計(jì)師制作網(wǎng)站,需要采集些內(nèi)容進(jìn)行填充,提高效率,可以方便直觀的看到頁面效果以及進(jìn)行調(diào)試;個(gè)人站長所做的網(wǎng)站欄目較多,或許也會(huì)用上采集進(jìn)行內(nèi)容填充等等。
織夢(mèng)采集俠提供多種采集方式,打造全能采集插件。
(1)根據(jù)關(guān)鍵詞采集
根據(jù)關(guān)鍵詞采集很夠很方便的采集到關(guān)鍵詞相關(guān)的內(nèi)容,插件有多套采集引擎規(guī)則可以跟換,能夠采集不同搜索引擎里面的搜索結(jié)果。
優(yōu)點(diǎn):簡(jiǎn)單方便,輸入關(guān)鍵詞即可采集
缺點(diǎn):受搜索結(jié)果影響,或許會(huì)采集到一些多余或者不太相關(guān)的內(nèi)容
(2)RSS采集
通過網(wǎng)站提供的RSS地址,采集RSS提供的文章URL頁面內(nèi)容
優(yōu)點(diǎn):簡(jiǎn)單方便,定向采集,輸入RSS地址即可采集
缺點(diǎn):無明顯缺點(diǎn),所采內(nèi)容均是RSS所提供的URL地址
(3)頁面監(jiān)控采集
通過設(shè)置監(jiān)控頁面,以及文章URL規(guī)則,即可采集相關(guān)內(nèi)容
優(yōu)點(diǎn):簡(jiǎn)單方便,定向采集,設(shè)置監(jiān)控頁面,文章URL即可采集
缺點(diǎn):收監(jiān)控頁面所限,只采集監(jiān)控頁面包含的文章URL
文章地址:http://m.meyanliao.com/article/dede/zmcjxdzzmqncjcj.html

- 1從共享思想的角度 看國內(nèi)的三大主流CMS
- 2誰是CMS中的戰(zhàn)斗機(jī)?N個(gè)CMS內(nèi)容模型評(píng)測(cè)
- 3IT柏拉圖:讓全世界都看到中國開源CMS
- 4織夢(mèng)CMS站點(diǎn)文檔存放路徑url優(yōu)化設(shè)置
- 5DEDECMS(織夢(mèng))防黑客入侵DDOS攻擊的一般方法
- 6Dede織夢(mèng)SEO優(yōu)化及設(shè)置教程
- 7淺談:織夢(mèng)CMS仿站的一些小結(jié)
- 8新站上線一個(gè)月關(guān)鍵詞百度谷歌排名首頁經(jīng)驗(yàn)分享
- 9如把各CMS比喻成手機(jī),會(huì)是怎樣
- 10適合做網(wǎng)站優(yōu)化的CMS系統(tǒng)推薦