問(wèn):使用虛擬主機的網(wǎng)站會(huì )不會(huì )因為同一個(gè)
IP 或同一臺服務(wù)器上有其他網(wǎng)站作弊被處罰而受連累,也被懲罰?
答:連坐,血統論等,是在極權社會(huì )里才出現的反人類(lèi)政策。一個(gè)成熟的搜索引擎,這么蠻干的可能性很小。
問(wèn):將一個(gè)舊的 URL 進(jìn)行 301 重定向處理,百度反應很慢?而且舊的 URL 會(huì )在相當一段時(shí)間內還存在于百度搜索結果中,但是網(wǎng)頁(yè)標題是新的,缺少描述。
答:對于內容遷移,我們推薦的做法就是將舊 URL 301 永久重定向到內容對應的新 URL,這樣我們會(huì )把舊 URL 積累的權值轉移到新 URL 上。
為了避免種種不穩定的因素,目前我們的處理策略比較保守,新、舊 URL 會(huì )同時(shí)并存相當長(cháng)的時(shí)間。最近我們意識到這樣處理其實(shí)并不妥當,正在調研更迅速的處理方式,相信很快就可以完美的處理好這個(gè)問(wèn)題。
問(wèn):百度對使用海外空間的中文網(wǎng)站有歧視嗎?百度是否會(huì )抓取域名注冊人的相關(guān)
whois 信息?
答:1、百度對海外站點(diǎn)沒(méi)有歧視。但百度從國內爬出去的蜘蛛,會(huì )嚴格遵守國家的政策和法令,所以國內普通用戶(hù)訪(fǎng)問(wèn)受限的內容,百度蜘蛛一樣會(huì )搞不定。
2、任何對站點(diǎn)價(jià)值分析有貢獻的要素,都有可能被搜索引擎使用。并且這些要素的使用方式,也不是一成不變的。至于具體有哪些要素已經(jīng)被使用以及如何使用,這個(gè)無(wú)法詳述。
問(wèn):百度如何看待偽原創(chuàng )?
答:“偽原創(chuàng )”就是“非原創(chuàng )”。對非原創(chuàng )的策略,同樣適用于偽原創(chuàng )。歸根結底,這是一個(gè)技術(shù)實(shí)現程度問(wèn)題,而不是策略思路問(wèn)題。
ZAC:好多人認為他們做的所謂“偽原創(chuàng )”挺好,應該能騙過(guò)搜索引擎,這大概低估了搜索引擎算法。還是得回到根本,內容為王。說(shuō)起來(lái)容易,做起來(lái)難,很少人會(huì )認真去做。
問(wèn):百度如何對待過(guò)期域名?谷歌對過(guò)期的域名很長(cháng)一段時(shí)間還有收錄, 而百度卻很快就會(huì )將其清空。
答:過(guò)期域名也是域名,所以,適用于新域名的策略,也一樣適用于過(guò)期域名。只是過(guò)期域名在歷史上累積的與現有網(wǎng)站無(wú)關(guān)的權重,會(huì )被剝離掉,這也是很容易理解的。
關(guān)于收錄問(wèn):大概在 4 月 1 日前后,很多站長(cháng)用 site 查看自己在百度的收錄數量,發(fā)現狂降,現在好像又恢復了,那是怎么回事?
答:我們也注意到了這種說(shuō)法,其實(shí)收錄方面沒(méi)什么變動(dòng),只是我們在上線(xiàn)新策略的過(guò)程中短暫影響了結果數估算算法,大家只要關(guān)注一下流量即可知道,那段時(shí)間從百度獲得的流量并沒(méi)有變化,如果收錄數真的發(fā)生了大的變動(dòng),肯定會(huì )影響流量。
另外,相信大家在用 site 語(yǔ)法查詢(xún)結果數時(shí),也看到了搜索結果最上方的“找到的相關(guān)網(wǎng)頁(yè)數是估算值,不代表真實(shí)結果數,僅供參考的提示”的提示,我們的搜索結果數估算算法是針對正常用戶(hù)的關(guān)鍵詞檢索而設計,沒(méi)有針對site語(yǔ)法檢索做過(guò)優(yōu)化,它得出的搜索結果數只能做為一個(gè)參考,建議關(guān)注網(wǎng)站從百度獲得的流量有沒(méi)有變動(dòng)更直接。
問(wèn):網(wǎng)站用 site: 查詢(xún),只有首頁(yè)收錄,請問(wèn)是什么機制造成的?
答:兩種情況:
1、新站點(diǎn),具體內容還沒(méi)來(lái)得及抓取和索引。
2、老站點(diǎn),因為種種原因被嚴厲懲罰了,站長(cháng)圈俗稱(chēng)“拔毛”。
后者的嚴厲懲罰機制,我們期望逐漸演化為更合理的甄別和處理。實(shí)際上現在的狀況,比之四、五年前,已經(jīng)人性化多了。呵呵。
問(wèn):一般來(lái)說(shuō),網(wǎng)站所有者不是太希望 https 的網(wǎng)頁(yè)被收錄。如果收錄了,如果處理?把 https 的網(wǎng)頁(yè) URL 更換成 http 形式的?還有一種情況,就是
ip 地址形式的URL被收錄。
答:如果不希望被收錄,常規的做法是設置 robots 文件。
https 主要的出發(fā)點(diǎn)是安全,并沒(méi)有太多考慮搜索引擎。從用戶(hù)角度,很多采用了 https 的站點(diǎn)(尤其是首頁(yè)),也是需要被搜索到的,比如支付寶,貝寶等。通常情況下,搜索引擎對這類(lèi)網(wǎng)頁(yè)并不做內容解析,而只是將 URL 進(jìn)行索引。
IP 地址的 URL 被收錄,除了 spider 在機制上的不完善之外,通常站點(diǎn)設計上也有一些缺陷。一般情況下,這類(lèi)問(wèn)題是可以被規避的。
問(wèn):百度數據更新的周期大概是多長(cháng)?
答:如果是一個(gè)變化頻繁的入口索引頁(yè)面,相信這個(gè)變化周期會(huì )很短;而是相對穩固的內容型頁(yè)面,周期則會(huì )相對較長(cháng)。站長(cháng)們觀(guān)察一下蜘蛛的爬取日志,發(fā)現的規律會(huì )比這邊的說(shuō)明更有價(jià)值。
此外,搜索結果頁(yè)上的那個(gè)時(shí)間,一直很讓人confusing,我們正在考慮修改。
關(guān)于權重問(wèn):百度是否跟蹤 JS 鏈接并傳遞權重?因為有的時(shí)候某些頁(yè)面得到太多權重沒(méi)什么意義,比如用戶(hù)登錄、注冊頁(yè)面之類(lèi)的。是否可以用簡(jiǎn)單的 JS 阻擋鏈接傳遞權重?
答:javascript 的解析,是很多搜索引擎正在做的事情;同理,對 flash 的解析。畢竟有那么多應用 javascript 或者 flash 的網(wǎng)站,其實(shí)并沒(méi)有意識到,他們的做法給搜索引擎的收錄和索引帶來(lái)的麻煩。所以,如果期望不被搜索引擎收錄的話(huà),最直接的手段,還是寫(xiě) robots 文件。
問(wèn):百度目前支持鏈接的 nofollow 屬性嗎?
答:百度現在支持 nofollow 標簽。帶 nofollow 標簽的鏈接,我們會(huì )忽略掉它絕大部分的作用。
nofollow主要用在用戶(hù)留言等不受站長(cháng)控制的地方,這些地方的投票不是站長(cháng)的意志,告訴搜索引擎不要給他投票是合適的。
問(wèn):百度對子域名如 news.domain.com 和主域名
www.domain.com 權重怎么處理?是當作兩個(gè)不同的網(wǎng)站還是子域名會(huì )繼承主域名的權重?
答:怎樣處理是合乎邏輯的,策略上就會(huì )采用那個(gè)合乎常理的處理手段?;蛘哌@樣講,如果你是負責這個(gè)權重處理的,你覺(jué)得怎樣做是最合理的?那么很可能百度就是如你所想的。呵呵。
搜索引擎理解起來(lái)并不復雜,站在用戶(hù)角度考量,很容易揣摩搜索引擎的策略思路。
關(guān)于鏈接問(wèn):當前做SEO的同學(xué)們,都在瘋狂的購買(mǎi)鏈接。表現最為突出的即是各大 SF 類(lèi)網(wǎng)站,他們全是通過(guò)購買(mǎi)大量的友情鏈接來(lái) 強J搜索引擎而上來(lái)的。(像傳世 SF,前幾名的站每個(gè)月的鏈接費用就至少超過(guò)五萬(wàn)。)
那么,對于這種明顯的,通過(guò)大量購買(mǎi)鏈接來(lái)作 SEO,強行登頂的作法今后是否會(huì )受到百度的懲罰?
因為就目前來(lái)看,百度對購買(mǎi)鏈接還沒(méi)有一點(diǎn)懲罰的跡象,一般的詞,網(wǎng)站收錄后,只要稍加更新然后狂買(mǎi)兩個(gè)月鏈接,絕對進(jìn)前三名。
而谷歌老早就說(shuō)明確了。通過(guò)購買(mǎi)鏈接來(lái)增加
PR 會(huì )受到懲罰,百度在這方面的算法是否也應該更新一下了?
答:這種手段奏效,說(shuō)明百度在識別和處理超鏈作弊方面,仍存在很多問(wèn)題。這類(lèi)問(wèn)題理應得到妥善的解決,以使互聯(lián)網(wǎng)環(huán)境得到凈化。我們回頭會(huì )和相關(guān)的同事就此問(wèn)題了解一下。
ZAC:提問(wèn)的網(wǎng)友和其他人相信都感謝 Lee 的回答,也希望百度能在這方面改進(jìn),打擊垃圾鏈接和網(wǎng)站。
下面是提問(wèn)網(wǎng)友的回復:
這種狂買(mǎi)鏈接頂排名的做法已經(jīng)有一年多了,到現在為止“做百度就是要靠買(mǎi)鏈接”已經(jīng)在站長(cháng)圈子里成為眾人皆知道的事情,而且各大站長(cháng)類(lèi)網(wǎng)站還都開(kāi)設了鏈接買(mǎi)賣(mài)的版塊,以 A5 為例每天站長(cháng)買(mǎi)賣(mài)鏈接的費用就有好幾萬(wàn),現在可以直接的說(shuō)對于百度指數在一萬(wàn)左右的詞,多買(mǎi)一些鏈接,排名在 20 天左右絕對可進(jìn)前三名。希望百度的相關(guān)技術(shù)組對這一問(wèn)題好好處理一下。
問(wèn):最近黑進(jìn) gov 或學(xué)校網(wǎng)站加上自己網(wǎng)站鏈接盛行。百度內部評估對這種黑鏈的鑒別準確性有多高?如果搜索引擎不能鑒別,普通企業(yè)和站長(cháng)面對黑鏈很難競爭。
答:這個(gè)問(wèn)題早已留意到,并一直在應對策略的完善中。
大批毫無(wú)道德和法律底線(xiàn)的人,使得中國互聯(lián)網(wǎng)的生態(tài)環(huán)境變得非常惡劣。但按我們的理解,除了搜索引擎強化技術(shù)應對方案之外,中國法治的完善,才是對這類(lèi)違法犯罪行為進(jìn)行遏制的根本手段。目前互聯(lián)網(wǎng)相關(guān)的立法,遠落后于互聯(lián)網(wǎng)的發(fā)展。
問(wèn):目前刷百度相關(guān)搜索和搜索下拉框的方法很多,怎樣才能限制或者根除這種現象。有沒(méi)有像投訴平臺這樣的地方,可以讓大家投訴,給大家一個(gè)更好的相關(guān)搜索?
答:這個(gè)問(wèn)題的確很惱人。目前我們正在全力處理中,可預期將有大幅改觀(guān)。
投訴可以發(fā)送到
webmaster@baidu.com,肯定可以送達相關(guān)工程師,但不會(huì )有具體的回復。此外,處理多半是策略級的升級,個(gè)案的針對性處理會(huì )比較少。
關(guān)于算法問(wèn):百度是否有會(huì )估算某網(wǎng)頁(yè)的某個(gè)反向鏈接被點(diǎn)擊次數(例如:從工具條、流量統計等工具得到的部分數據)?比如是否把鏈接的點(diǎn)擊率計入算法之中?是否會(huì )利用這點(diǎn)來(lái)判斷哪些是隱藏鏈接?或者判斷外鏈的相關(guān)性等因素。
答:我只能說(shuō),一切有利于排序改進(jìn)的因素,都有可能被搜索引擎嘗試應用。
任何能改善排序效果的要素,搜索引擎都可能會(huì )嘗試應用,不管是toolbar,analytics,rss訂閱等等。
問(wèn):目前谷歌已經(jīng)把網(wǎng)頁(yè)加載速度納入頁(yè)面排名影響因素,百度是否也考慮此因素決定網(wǎng)站搜索排名?
答:這是很容易想到的一個(gè)網(wǎng)站價(jià)值評價(jià)要素。但如何有效應用,并不是一件很容易的事情,需要非常謹慎。中國尤其復雜,不同網(wǎng)段差異甚大。但顯著(zhù)影響到用戶(hù)體驗的廣泛要素,最終都會(huì )被搜索引擎謹慎的嘗試和使用吧。
問(wèn):Google 有 PR 指數,搜狗有指數,百度有什么?或許百度已經(jīng)有對網(wǎng)頁(yè)進(jìn)行質(zhì)量評分了,暫時(shí)沒(méi)有對外開(kāi)放?以后會(huì )有這樣的網(wǎng)頁(yè)評級指數么?
答:多公布一個(gè)評級指數,只是為站長(cháng)們多帶來(lái)一分煩惱。事實(shí)上,很少有成熟的搜索引擎會(huì )發(fā)布用于最終質(zhì)量評級的指數。按照 Google 的官方說(shuō)法,PR 也只是諸多排序因子中的一個(gè)而已。
問(wèn):百度如何對站外作弊的手法判斷是不是競爭對手所做,比如買(mǎi)黑鏈,建群站,群發(fā)垃圾垃圾等,這些競爭對手都能幫你做??煞裢嘎断掳俣葘@個(gè)判斷的原理,站長(cháng)如何防范,發(fā)現被人陷害的話(huà),如何舉報或采取其他措施?
答:如果想維護一個(gè)策略的生命周期的話(huà),最好的方式是保守策略細節的秘密。但有一點(diǎn)可以確定,一個(gè)成熟的搜索引擎,不會(huì )輕易的通過(guò)一兩個(gè)要素來(lái)判斷一個(gè)網(wǎng)站的生死。
在回答問(wèn)題的同時(shí),百度俱樂(lè )部的發(fā)言人也透露了百度近期會(huì )發(fā)布一個(gè)搜索引擎優(yōu)化指南,里面有百度推薦的網(wǎng)站建設方法,以及一些會(huì )危害到權重的做法。