目錄

SEO 必知的「響應代碼」定義
在訪問網站時,我們透過 Chrome、Safari 等瀏覽器連到網站的伺服器,以抓取網頁。當網頁被瀏覽器載入時,會附上一組響應代碼 (Response Code) ,用來告知瀏覽器這個網頁有沒有問題。這組代碼,我們在網頁上可能看不到。
響應代碼有很多種,分別代表不同的網頁載入狀況。其中一個最廣為人知的代碼是「404」。
基本上,介於 400 到 499 的任一組代碼,都代表網頁舞法載入。而本篇要提的 404 唯一具有特定含義的代碼:該頁面實際上已經消失了,很可能很快就不復存在。「轉址式 404 (Soft 404,又稱『軟性 404』)」不是發送到瀏覽器的正式響應代碼。這只是 Google 在其索引內添加到頁面的標籤。
當 Google 爬蟲在抓取頁面時,會仔細分配資源,以確保不會有時間浪費在抓取不需要被索引的不存在頁面。
然而,有些伺服器配置欠佳。他們有些不存在的頁面,本應顯示代碼 404 的,HTTP header 卻載入了其他的代碼如「200」等。這樣會使這個不存在的頁面被 Google 索引,對 Google 來說是浪費資源。
為了要解決這樣的問題,Google 開始注意 404 頁面的特徵,並試圖要辨別此 404 頁面是否真的符合 404 頁面的種種條件。 換句話說,Google 了解到,如果它「看起來、聞起來、表現起來」像是 404 頁面的話,那它可能是正宗的 404 頁面。
可能被誤解為 404 的狀況
在某些情況下,該頁面實際上是存在的,但是某些特徵觸發了 Google 將其歸類為「不存在」的頁面。這些特徵包含:頁面的內容過少、頁面沒有內容、同一網站上有太多相似頁面等。
頁面上少量或缺乏內容以及站點上具有太多相似頁面。
這些特徵與 Google 「熊貓演算法」欲解決的因素相似:「熊貓演算法」將短少或重複的內容,視為負面排名因素。
因此,解決這些問題,將有助於避免出現「轉址式 404」,並且避開熊貓演算法的負面排名因素。
以下為導致「404 錯誤」的兩個主要原因:
- 錯誤的網頁連結:將用戶導到不存網頁的超連結
- 連結到曾經存在但卻突然消失的網頁超連結
錯誤的網頁連結
如果造成 404 錯誤的原因是「錯誤的網頁連結」,則只需修復該連結即可。
比較費時的是,SEO 需要是查找網站上所有錯誤的鏈接──尤其擁有超過數百頁的大型網站。此時可善用 SEO 輔助爬蟲工具如 Xenu、DeepCrawl、Screaming Frog 或是 Botify。
不復存在的頁面
當一個頁面不復存在時,你有兩種選擇:
- 如果頁面是不小心被刪除的話,請還原它。
- 如果是有意將其刪除的話,就使用 301 重新導向到最接近的相關頁面。
首先,SEO 必須在網站上找到所有錯誤的網頁連結,可用上述的 SEO 爬蟲工具輔助。但是,爬蟲工具可能找不到「孤立的頁面」。所謂「孤立的頁面」是只從未被任何頁面導航、或是從未在其他頁面有連結 URL 的頁面。
若孤立的頁面存在的話,則可能過去它曾經是網站的一部分,然而在網站重新設計後,該頁面的連結消失了,但是其他網站的外部連結可能還連得道該頁面。曾經是網站的一部分,則它們可能存在,然後在網站重新設計後,指向該舊頁面的鏈接消失了,但是其他網站的外部鏈接可能仍在鏈接到它們。要仔細檢查您的網站上是否存在此類頁面,可以使用多種工具:
Google 網站管理員 (Google Search Console,GSC)
Google 爬蟲能爬取所有可找到的網站,並讓 GSC 回報 404 的頁面。這包含了來自其他網站連到你網站上那些曾經存在頁面的連結。
GA 分析工具 (Google Analytics)
預設狀況下,GA 分析不會產出針對不存在頁面所做的報告。但是你可以透過多種方式來追蹤:
- 創建自訂報表,專門篩選出「404 錯誤」的頁面
- 創建自訂內容群組,並將所有 404 頁面分配到其中一個內容群組
除了上述工具外,尚有其他第三方的反向連結 SEO 工具如 Majestic、Ahrefs、Moz Open Site Explorer 等。這些工具會產生一張清單,列出擁有你網頁連結的網站。你可從這張表檢查這些頁面連結是否正常、找出 404 錯誤。
SEO 如何修復「轉址式 404」錯誤 – 使用 Google Search Console
要查找網站內是否存在「轉址式 404」錯誤,最直接的方式就是使用 Google 網站管理員 (Google Search Console, GSC) ,檢查「轉址式 404」中列出的內容並逐一解決。以下列出常見的「轉址式 404」錯誤:
-
網頁內容過少或無內容
因為 Google 搜尋引擎內導入了負責機器學習的 AI 「Rank Brain」 ,能夠準確辨識出品質不佳或過於短少的網頁內容,並標示為「轉址式 404」錯誤。
假如你檢查網頁後,發現可能原因為內容過少或無內容,就補上一些相關內容吧!然後在網站內其他相關的頁面,增加導流至該頁面的內部連結。
-
重複的內容
假如網站內有重複的網頁內容,被判斷成「轉址式 404」錯誤,就將這網頁予以合併:
保留權重較高的頁面 (如排名較高、外部連結較多、PA 頁面權重分數較高等);其他的頁面內容就合併到該頁,並且設定 301 轉址到該頁。
有時,電池商務網頁如販售鞋子的頁面,可能同款鞋子有多種不同的顏色,而一個顏色的鞋子就佔了一個商品頁,導致產生許多看起來相同的網頁。此時的做法就是依照上段所述的方式,將這些顏色鞋子的頁面合併成一頁。
-
301/302 重新導向至內容不相關的頁面
301 重新導向為永久轉址,例如從於舊網站遷到新網站,因為內容幾乎一致,只是新舊的問題罷了,所以頁面權重不會改變太多;而 302 重新導向則為暫時性轉址。
301/302 重新導向適用於內容相關的網頁。但是有些過於靈活的操作,將兩個天差地遠的網頁使用 301/302 轉址 (如將熱門的新聞網頁重新導向販售奶粉的商品頁面等),並希望帶來高量的訂單。這樣會被 Google 視為「轉址式 404」的錯誤狀態,同時流失「連結的價值」及「網頁本身參考價值」。
-
沒有正確 404 響應代碼的錯誤頁面:
請工程師設定網頁伺服器,能夠在網頁錯誤時,顯示 404 響應代碼即可。
SEO 如何修復「轉址式 404」錯誤 – 使用其他 SEO 爬蟲工具
大部分爬蟲工具無法直接偵測到轉址式 404 碩誤,因為「轉址式 404」並非真正的 404 錯誤。但是 SEO 可從爬蟲工具找到其他線索,如下:
-
網頁內容過少或無內容
有些爬蟲工具不只會回報內容過少的頁面。甚至還能顯示總字數。在此,你可以根據內容的字數對網址進行排序。首先從字數最少的頁面開始,然後評估該頁面內容是否有內容過少或無內容。
對於內容過少或無內容的頁面,就補上一些相關內容,並在其他相關內容的頁面中,增加導流至該頁面的內部連節。
-
重複的內容
有些爬蟲工具精細到足以辨別一個頁面中,網頁模板以及網頁內容的部分,各佔了多少比例。若網頁內容與許多其它頁面幾乎相同的話,就應深入調查這些頁面、找出這些內容會重複的原因。若是可以,就將這網頁予以合併。
如要合併這些重複頁面,請保留權重較高的頁面 (如排名較高、外部連結較多、PA 頁面權重分數較高等);其他的頁面內容就合併到該頁,並且設定 301 轉址到該頁。
Google 以相同方式處理 404 錯誤和轉址式 404 錯誤
轉址式 404 錯誤雖然不是真正的 404 錯誤,但是如果這些頁面無法快速修復,則 Google 會將這些頁面脫離搜尋索引 (de-index)。對於 SEO 來說,最好的解決方式就是定期使用 Google Search Console 爬取網站,以查看是否發生 404 錯誤或轉址式 404 錯誤。