Google開始支持在HTTP頭中指定rel="canonical"
2011/6/22
Google 的網(wǎng)頁索引服務(wù)現(xiàn)在開始支持 HTTP 頭中指定的 link rel=“canonical” 關(guān)系聲明,該語法在 IETF RFC 5988 第 5 段有敘述。站長(zhǎng)可以通過 rel=“canonical” HTTP 頭通告 HTML 文檔以及其他格式內(nèi)容(如 PDF 文件)的 canonical URL。
假設(shè)一家網(wǎng)站同時(shí)提供了白皮書的 HTML 頁面與可下載的 PDF 版本,URL 分別為:
http://www.example.com/white-paper.html
http://www.example.com/white-paper.pdf
這時(shí),站長(zhǎng)可以在 PDF 文件被請(qǐng)求時(shí)通過 rel=“canonical” HTTP 頭通告 Google 該 PDF 下載版的 canonical URL 就是相應(yīng)的 HTML 文檔;例如:
GET /white-paper.pdf HTTP/1.1 Host: www.example.com (...HTTP 請(qǐng)求頭的其余部分...) |
HTTP/1.1 200 OK Content-Type: application/pdf Link: <http://www.example.com/white-paper.html>; rel="canonical" Content-Length: 785710 (... HTTP 響應(yīng)頭的其余部分...) |
另一種 rel=“canonical” HTTP 頭有用的常見情形是:網(wǎng)站通過多個(gè) URL 提供同樣的文件(例如使用內(nèi)容分發(fā)網(wǎng)絡(luò)/CDN 時(shí))而站長(zhǎng)希望通告 Google 首選 URL。
當(dāng)前 link 頭元素只支持網(wǎng)頁搜索。將來會(huì)根據(jù)站長(zhǎng)的使用情況再進(jìn)行調(diào)整。詳情可查閱幫助中心的 canonicalization(“規(guī)范化”) 與 rel=“canonical” 元素兩篇文章。
什么是規(guī)范網(wǎng)頁?為什么要指定規(guī)范網(wǎng)頁?
規(guī)范網(wǎng)頁是一組內(nèi)容高度相似的網(wǎng)頁的首選版本。
對(duì)于網(wǎng)站來說,包含多個(gè)列有同組產(chǎn)品的網(wǎng)頁很正常。例如,一個(gè)網(wǎng)頁可能按字母表順序顯示產(chǎn)品,而其他網(wǎng)頁則按照價(jià)格或評(píng)分顯示相同產(chǎn)品。例如:
http://www.example.com/product.php?item=swedish-fish&trackingid=1234567&sort=alpha&sessionid=5678asfasdfasfd
http://www.example.com/product.php?item=swedish-fish&trackingid=1234567&sort=price&sessionid=5678asfasdfasfd
如果 Google 知道這些網(wǎng)頁的內(nèi)容相同,我們可能只會(huì)將搜索結(jié)果的一個(gè)版本編入索引。我們的算法會(huì)選擇我們認(rèn)為可以最好地回答用戶查詢的網(wǎng)頁。不過,現(xiàn)在用戶可以通過將<link>元素和 rel=“canonical” 屬性添加到該網(wǎng)頁非規(guī)范版本的 <head>部分,為搜索引擎指定規(guī)范網(wǎng)頁。添加此鏈接和屬性可以讓網(wǎng)站擁有者識(shí)別出哪些網(wǎng)頁具有相同的內(nèi)容,從而向 Google 提出建議:“在內(nèi)容相同的所有網(wǎng)頁中,此網(wǎng)頁最有用。請(qǐng)將該網(wǎng)頁排在搜索結(jié)果中靠前的位置!
如何指定規(guī)范網(wǎng)頁?
要指定指向網(wǎng)頁 http://www.example.com/product.php?item=swedish-fish 的規(guī)范鏈接,請(qǐng)按以下形式創(chuàng)建 <link>元素:
<link rel=“canonical” href=“http://www.example.com/product.php?item=swedish-fish”/>
將上述鏈接復(fù)制到該網(wǎng)頁所有非規(guī)范版本的<head>部分,如 http://www.example.com/product.php?item=swedish-fish&sort=price。
如果您在 http://www.example.com/product.php?item=swedish-fish 和 https://www.example.com/product.php?item=swedish-fish 上都發(fā)布了內(nèi)容,則可以指定該網(wǎng)頁的規(guī)范版本。創(chuàng)建<link>元素:
<link rel=“canonical” href=“http://www.example.com/product.php?item=swedish-fish”/>
將上述鏈接添加到 https://www.example.comproduct.php?item=swedish-fish 的<head>部分。