久久无码视频高清_亚洲中文字幕%20久久久_九九九热在线视频_国产色A∨在线看免费
我們的專業(yè)品牌服務商:網(wǎng)站建設、品牌策劃設計、網(wǎng)站優(yōu)化、網(wǎng)站推廣等業(yè)務
龍誠微博
站點導航
免費建站
專業(yè)的互聯(lián)網(wǎng)絡解決方案、完善的售后服務體系 —— 龍誠互聯(lián)(溫州網(wǎng)絡公司 溫州網(wǎng)站建設),當前IP:
龍誠簡介
|
企業(yè)文化
|
我們的優(yōu)勢
|
龍誠人
|
招兵募馬
龍誠動態(tài)
|
行業(yè)新聞
|
我們的觀點
|
公司公告
標準企業(yè)站
|
外貿(mào)商務站
|
商城門戶站
|
品牌動畫站
|
在線訂制
網(wǎng)站制作流程
|
建站知識
|
網(wǎng)站SEO優(yōu)化
|
域名&空間
|
網(wǎng)站備案
|
下載中心
聯(lián)系方式
|
留言反饋
龍誠動態(tài)
行業(yè)新聞
我們的觀點
公司公告
建站技術
網(wǎng)站SEO優(yōu)化
網(wǎng)站制作流程
產(chǎn)品報價
聯(lián)系電話:0577-55882408
傳真號碼:0577-55882411
聯(lián)系手機:15224122065
聯(lián)系地址:溫州市甌海站南商貿(mào)城C幢306
首頁-新聞中心-
我們的觀點
百度蜘蛛如何爬行和判斷文章是否原創(chuàng)
發(fā)布時間:2012-4-8 13:49:12 ‖
一、首先要明確一個概念:原創(chuàng) 偽原創(chuàng)
原創(chuàng):簡單地理解就是第一次在網(wǎng)絡上發(fā)表的內(nèi)容,以前沒有出現(xiàn)過的內(nèi)容。
偽原創(chuàng):就是從網(wǎng)站找來資料進行二次加工,二次修改之后的內(nèi)容,如修改標題,修改內(nèi)容,增加些文字或者減少一些文字等。
那么搜索引擎對于原創(chuàng)的判斷是如何進行的呢?
一般來講有以下幾個方面的因素決定:
1、快照日期。
2、蜘蛛抓取日期。
3、頁面外鏈的多少。
4、文章修改的程度。
二、舉個例子如果你在
www.yoyo520.com
這個網(wǎng)站上發(fā)布了一片文章內(nèi)容。搜索引擎來到這個網(wǎng)站并且抓取到了這篇文章,放到數(shù)據(jù)庫,并且在收錄數(shù)據(jù)庫中沒有發(fā)現(xiàn)類似內(nèi)容,那么就會被認為是原創(chuàng)。
在這點上有個細節(jié)需要注意:
1:文章必須被收錄,如果沒有被收錄,肯定是在搜索數(shù)據(jù)庫中石找不到的,搜索引擎根本就找不到這篇文章,更談不上什么原創(chuàng)了。
2:文章被轉(zhuǎn)載
如果剛發(fā)表的一篇文章被其它轉(zhuǎn)載了,那么誰是原創(chuàng)呢?那要看誰更先被搜索引擎抓取到,也就是更新周期的問題了。如果a站發(fā)表,b站轉(zhuǎn)載,如果先抓取到a站,那么歸a,如果先抓取b站,那么原創(chuàng)就歸b站了,所以不是說你先發(fā)表了,原創(chuàng)就是你的,這個得看搜索引擎什么時間收錄了你的內(nèi)容。
3、訪問時間
如果蜘蛛先訪問了B站呢?
1、當然權重給B站,一般的情況下都會這樣!
2、如果B站轉(zhuǎn)載的文章帶了A站的原文章頁面鏈接呢?
3、這就很明白了,剛收錄的時候,如果排名,兩條結(jié)果一起出現(xiàn),有可能還是B站的排名好一點。
當然,文章轉(zhuǎn)載次數(shù)多了以后,A站的鏈接越多,對A站的文章越有好處,排名會慢慢變成A站在前面。
如果另外轉(zhuǎn)載的文章帶的是B站頁面的鏈接呢?
它們?nèi)绻袛嗖缓?,就變成了一個鏈接流行度的比賽了。
不過,如果都有很多外部鏈接,并且相差不大,那么判斷的規(guī)則應該回到原點,誰先被收錄誰就是原創(chuàng)。
4、快照日期
快照日期顯示時間最早的,一般就是原創(chuàng)了吧!
不一定,這個說法要在一個更新周期之內(nèi),比如說文章發(fā)表后一周內(nèi),快照時間越早的地址將越有被認可為原創(chuàng)的可能。
但如果文章都發(fā)表了幾個月了,說不定搜索引擎已經(jīng)重新獲取過快照了,快照的日期就變了!
還有其它的可能嗎?
有,一般比如百度收錄,他可能會有一個收錄的數(shù)據(jù)庫,經(jīng)過過濾后,收錄的內(nèi)容才會到搜索結(jié)果里來。在這個期間就有一些問題了,比如A站首次發(fā)表,B站轉(zhuǎn)載。蜘蛛先訪問A站再訪問B站。而后可能先把B站的結(jié)果放出來了,而A站還在數(shù)據(jù)庫里。
所以說搜索引擎沒有收錄并不表示搜索引擎蜘蛛沒有訪問過這些內(nèi)容,也許在搜索引擎的庫存里已經(jīng)有記錄了,只是你查的時間沒有放出來而已,就像25號才放出來的內(nèi)容,但是快照是20號的,這就是搜索引擎的庫存內(nèi)容,同時這也是檢驗原創(chuàng)的核心時間點。
這種情況一般出現(xiàn)在新站與老站之間,A站發(fā)表,B站轉(zhuǎn)載,但A站在搜索引擎的信任度并不高的時候。不過只要是A站先被訪問到的,原創(chuàng)權還是A站的,這是最難分出來的情況,因為我們不知道蜘蛛先訪問哪個站,除非你知道兩個站的網(wǎng)站空間日志內(nèi)容,能看到搜索引擎對兩個頁面的訪問時間。
5、偽原創(chuàng)
偽原創(chuàng)也會被認為是原創(chuàng)?
大多時候是這樣的,搜索引擎蜘蛛不能明確分別這些東西,因為它的思維太程式化了。如果你的標題改過,文章的段落改過,那么蜘蛛將很難確定這篇文章是否有過收錄,也許它可以確定有部分內(nèi)容是重復的,但它也不能因為這些而將這篇文章確認為是轉(zhuǎn)載!當然,隨著搜索引擎程式設計的提高,應該會有一個相似度的東西出來,比如文字內(nèi)容相似度超過百分之幾就會被認為是轉(zhuǎn)載。
這樣分析下來,相信大家應該了解了吧。只是核桃自己的看法,希望大家吸收自己想要的東西,不認同的了也來提下自己的意見!
另外提幾個建議:
1、如果你的站是新站,權重不高,如何讓蜘蛛首頁找到你的頁面并放入數(shù)據(jù)庫?其實很簡單:用網(wǎng)摘、百度收藏這些工具讓蜘蛛更快的找到你的頁面!
2、大家都有過建議,就是加上自己的版權及內(nèi)容頁面的地址,別人采集的時候你就爽了,收錄雖然不會快,但最后鏈接多了,你依然是原創(chuàng)內(nèi)容。
3、發(fā)表文章等到自己收錄以后再去其它的站點進行發(fā)表,同時加上自己的原文地址,這種辦法很有保障!
轉(zhuǎn)載請注明:
原文出自 http://www.yoyo520.com/news_show/lcnt_details_3_823.html
上一篇:
關于那些google不喜歡的SEO黑帽技術
下一篇:
三個月做一個網(wǎng)站的優(yōu)化的經(jīng)驗分享
【置頂】
【關閉本頁】
【打印本頁】
分享到:
QQ空間
新浪微博
人人網(wǎng)
開心網(wǎng)
更多
地址:溫州市甌海區(qū)站南商貿(mào)城C幢306室
總機:0577-55882408;傳真:0577-55882411
E-mail:115047027@qq.com
業(yè)務咨詢:0577-55882401
售后熱線:0577-55882408
技術咨詢:0577-55882411
copyright ?
溫州龍誠互聯(lián) 版權所有
浙ICP備11044124號-1
您是第
位訪客