星期六, 28 11 月, 2020
23.4 C
Taiwan
更多
    更多
      Home 數位行銷 SEO SEO殺手-404與轉址式404錯誤(軟性404)解決方法

      SEO殺手-404與轉址式404錯誤(軟性404)解決方法

      SEO 必知的「響應代碼」定義

      在訪問網站時,我們透過 Chrome、Safari 等瀏覽器連到網站的伺服器,以抓取網頁。當網頁被瀏覽器載入時,會附上一組響應代碼 (Response Code) ,用來告知瀏覽器這個網頁有沒有問題。這組代碼,我們在網頁上可能看不到。

      響應代碼有很多種,分別代表不同的網頁載入狀況。其中一個最廣為人知的代碼是「404」。

      基本上,介於 400 到 499 的任一組代碼,都代表網頁舞法載入。而本篇要提的 404 唯一具有特定含義的代碼:該頁面實際上已經消失了,很可能很快就不復存在。

      「轉址式 404」、「軟性 404」 (Soft 404) 代表的意義

      「轉址式 404 (Soft 404,又稱『軟性 404』)」不是發送到瀏覽器的正式響應代碼。這只是 Google 在其索引內添加到頁面的標籤。

      當 Google 爬蟲在抓取頁面時,會仔細分配資源,以確保不會有時間浪費在抓取不需要被索引的不存在頁面。

      然而,有些伺服器配置欠佳。他們有些不存在的頁面,本應顯示代碼 404 的,HTTP header 卻載入了其他的代碼如「200」等。這樣會使這個不存在的頁面被 Google 索引,對 Google 來說是浪費資源。

      為了要解決這樣的問題,Google 開始注意 404 頁面的特徵,並試圖要辨別此 404 頁面是否真的符合 404 頁面的種種條件。 換句話說,Google 了解到,如果它「看起來、聞起來、表現起來」像是 404 頁面的話,那它可能是正宗的 404 頁面。

      可能被誤解為 404 的狀況

      在某些情況下,該頁面實際上是存在的,但是某些特徵觸發了 Google 將其歸類為「不存在」的頁面。這些特徵包含:頁面的內容過少、頁面沒有內容、同一網站上有太多相似頁面等。

      頁面上少量或缺乏內容以及站點上具有太多相似頁面。

      這些特徵與 Google 「熊貓演算法」欲解決的因素相似:「熊貓演算法」將短少或重複的內容,視為負面排名因素。

      因此,解決這些問題,將有助於避免出現「轉址式 404」,並且避開熊貓演算法的負面排名因素。

      以下為導致「404 錯誤」的兩個主要原因:

      • 錯誤的網頁連結:將用戶導到不存網頁的超連結
      • 連結到曾經存在但卻突然消失的網頁超連結

      錯誤的網頁連結

      如果造成 404 錯誤的原因是「錯誤的網頁連結」,則只需修復該連結即可。

      比較費時的是,SEO 需要是查找網站上所有錯誤的鏈接──尤其擁有超過數百頁的大型網站。此時可善用 SEO 輔助爬蟲工具如 Xenu、DeepCrawl、Screaming Frog 或是 Botify。

      不復存在的頁面

      當一個頁面不復存在時,你有兩種選擇:

      • 如果頁面是不小心被刪除的話,請還原它。
      • 如果是有意將其刪除的話,就使用 301 重新導向到最接近的相關頁面。

      首先,SEO 必須在網站上找到所有錯誤的網頁連結,可用上述的 SEO 爬蟲工具輔助。但是,爬蟲工具可能找不到「孤立的頁面」。所謂「孤立的頁面」是只從未被任何頁面導航、或是從未在其他頁面有連結 URL 的頁面。

      若孤立的頁面存在的話,則可能過去它曾經是網站的一部分,然而在網站重新設計後,該頁面的連結消失了,但是其他網站的外部連結可能還連得道該頁面。曾經是網站的一部分,則它們可能存在,然後在網站重新設計後,指向該舊頁面的鏈接消失了,但是其他網站的外部鏈接可能仍在鏈接到它們。要仔細檢查您的網站上是否存在此類頁面,可以使用多種工具:

      Google 網站管理員 (Google Search Console,GSC)

      Google 爬蟲能爬取所有可找到的網站,並讓 GSC 回報 404 的頁面。這包含了來自其他網站連到你網站上那些曾經存在頁面的連結。

      GA 分析工具 (Google Analytics)

      預設狀況下,GA 分析不會產出針對不存在頁面所做的報告。但是你可以透過多種方式來追蹤:

      • 創建自訂報表,專門篩選出「404 錯誤」的頁面
      • 創建自訂內容群組,並將所有 404 頁面分配到其中一個內容群組

      除了上述工具外,尚有其他第三方的反向連結 SEO 工具如 Majestic、Ahrefs、Moz Open Site Explorer 等。這些工具會產生一張清單,列出擁有你網頁連結的網站。你可從這張表檢查這些頁面連結是否正常、找出 404 錯誤。

      SEO 如何修復「轉址式 404」錯誤 – 使用 Google Search Console

      要查找網站內是否存在「轉址式 404」錯誤,最直接的方式就是使用 Google 網站管理員 (Google Search Console, GSC) ,檢查「轉址式 404」中列出的內容並逐一解決。以下列出常見的「轉址式 404」錯誤:

      1. 網頁內容過少或無內容

        因為 Google 搜尋引擎內導入了負責機器學習的 AI 「Rank Brain」 ,能夠準確辨識出品質不佳或過於短少的網頁內容,並標示為「轉址式 404」錯誤。

        假如你檢查網頁後,發現可能原因為內容過少或無內容,就補上一些相關內容吧!然後在網站內其他相關的頁面,增加導流至該頁面的內部連結。

      2. 重複的內容

        假如網站內有重複的網頁內容,被判斷成「轉址式 404」錯誤,就將這網頁予以合併:

        保留權重較高的頁面 (如排名較高、外部連結較多、PA 頁面權重分數較高等);其他的頁面內容就合併到該頁,並且設定 301 轉址到該頁。

        有時,電池商務網頁如販售鞋子的頁面,可能同款鞋子有多種不同的顏色,而一個顏色的鞋子就佔了一個商品頁,導致產生許多看起來相同的網頁。此時的做法就是依照上段所述的方式,將這些顏色鞋子的頁面合併成一頁。

      3. 301/302 重新導向至內容不相關的頁面

        301 重新導向為永久轉址,例如從於舊網站遷到新網站,因為內容幾乎一致,只是新舊的問題罷了,所以頁面權重不會改變太多;而 302 重新導向則為暫時性轉址。

        301/302 重新導向適用於內容相關的網頁。但是有些過於靈活的操作,將兩個天差地遠的網頁使用 301/302 轉址 (如將熱門的新聞網頁重新導向販售奶粉的商品頁面等),並希望帶來高量的訂單。這樣會被 Google 視為「轉址式 404」的錯誤狀態,同時流失「連結的價值」及「網頁本身參考價值」。

      4. 沒有正確 404 響應代碼的錯誤頁面:

        請工程師設定網頁伺服器,能夠在網頁錯誤時,顯示 404 響應代碼即可。

      SEO 如何修復「轉址式 404」錯誤 – 使用其他 SEO 爬蟲工具

      大部分爬蟲工具無法直接偵測到轉址式 404 碩誤,因為「轉址式 404」並非真正的 404 錯誤。但是 SEO 可從爬蟲工具找到其他線索,如下:

      1. 網頁內容過少或無內容

        有些爬蟲工具不只會回報內容過少的頁面。甚至還能顯示總字數。在此,你可以根據內容的字數對網址進行排序。首先從字數最少的頁面開始,然後評估該頁面內容是否有內容過少或無內容。

        對於內容過少或無內容的頁面,就補上一些相關內容,並在其他相關內容的頁面中,增加導流至該頁面的內部連節。

      2. 重複的內容

        有些爬蟲工具精細到足以辨別一個頁面中,網頁模板以及網頁內容的部分,各佔了多少比例。若網頁內容與許多其它頁面幾乎相同的話,就應深入調查這些頁面、找出這些內容會重複的原因。若是可以,就將這網頁予以合併。

        如要合併這些重複頁面,請保留權重較高的頁面 (如排名較高、外部連結較多、PA 頁面權重分數較高等);其他的頁面內容就合併到該頁,並且設定 301 轉址到該頁。

      Google 以相同方式處理 404 錯誤和轉址式 404 錯誤

      轉址式 404 錯誤雖然不是真正的 404 錯誤,但是如果這些頁面無法快速修復,則 Google 會將這些頁面脫離搜尋索引 (de-index)。對於 SEO 來說,最好的解決方式就是定期使用 Google Search Console 爬取網站,以查看是否發生 404 錯誤或轉址式 404 錯誤。

      最新文章

      人工智慧能「聽咳嗽聲認出新冠患者」!成功率達 98.5%

      人工智慧現在可從人的咳嗽聲中,認出對方是否為新冠肺炎患者──就算是無症狀患者,也能被辨識出。在目前全球疫情尚未趨緩之際,AI 可說是為新冠病毒的檢測帶來新希望! 美國麻省理工學院(MIT)實驗室日前發表一篇論文,表示他們開發出的最新 AI 演算法,只要聽到人的「咳嗽聲」,就能知道這個人有沒有感染新型冠狀病毒。重要的是──這個方法對檢測出無症狀患者特別有用。 ▲ MIT 新開發的人工智慧演算法,光聽咳嗽聲就能辨識新冠患者──包含無症狀患者。(示意圖,與本事件無關/Photo by UN Response to COVID-19 on Unsplash)   新冠疫情依然在全球多國延燒,有越來越多證據顯示,在新冠病毒感染者中「無症感染者」佔了相當大的比例。這些沒有發燒、咳嗽、四肢無力等明顯特徵的無症狀感染者,因接受檢測的機會遠遠小於有症狀的感染者、難以及早接受治療,故可能持續傳染給他人,成為疫情防堵的最大威脅。 而近日,麻省理工學院(MIT)實驗室公開表示,他們利用 AI 成功開發出一種冠狀病毒檢測的新方法。 該方法的關鍵是分析人的「咳嗽聲」。MIT 研究人員在電氣電子工程學會(IEEE)的《醫療生物工程》(Engineering in Medicine and Biology)期刊上發表一篇論文,文中表示他們發現無症狀感染者發出的咳嗽聲、與身體健康的一般人有所不同,或可幫助協助辨識出感染病毒的患者,使預篩變得更加容易。雖然人耳無法辨認這種細微的差異,但人工智慧 AI 可以。 在此篇論文中,研究人員明確表示,他們已經開發出一種能辨識新冠肺炎患者咳嗽聲的 AI。 「聽聲」看診 人工智慧靠聲音辨識多種疾病 其實在疫情開始流行之前,研究團隊已著手開發能分析咳嗽異聲的...

      擺脫血汗設備工程,零基礎的我轉職 Python 工程師成功

      ▲ 掌握了自己的職涯,林同學也有了更多時間陪伴家人朋友  只有決心還不夠,更要用對的方法、找對的嚮導 「並不是只要想就可以改變低薪的職涯,你更需要有破釜沈舟的決心!」 林◯棠同學一開口談的不是轉職成功的美好生活,卻是當時下定決心的心情以及隨之而來的刻苦努力:「讓自己沒有退路,才能脫離不想要的工作!」。真理大學畢業的林同學,本來是位設備測試工程師,但受不了每天 12~15 小時的超長工時,讓他的生活除了工作只剩睡覺,看不到職涯希望,才毅然決然決定轉換人生跑道,將未來掌握在自己手中。 程式初學者的夢魘,在這裡都不會成真 談及對達內教育 Python 課程的評價,林同學馬上就提起那位專業又耐心的輔導老師。面對毫無程式基礎的林同學,輔導老師主動關心並追蹤他的學習狀況,讓他在程式學習的道路上多了一位專業人士的陪伴。輔導老師耐心的與他解釋所有 Python 課程中的疑難雜症,更手把手的教導林同學無法解決的難題。本來以為零經驗轉職的旅程會受到很多勸退與學習上的障礙,但在與輔導老師一步步解決每一個難題的同時,他對於未來職涯的迷茫也緩解了許多,也是林同學給達內教育最高評價的主因。 讓林同學放心的除了貼身指導的輔導老師,還有達內與業界銜接的實戰訓練。不管是AI語音識別系統的撰寫,或是程式交易的數據分析專題,都讓每一位接受 Python 教學課程的學員們都能在就業後具備程式語言「即戰力」。畢竟對於想轉職工程師的學員來說,沒辦法立即就業的 Python 教學課程又有什麼價值呢? 程式線上課程?那很容易半途而廢吧? 面對達內教育線上課程容易紀律鬆懈的評價與疑惑,林同學卻抱持著不一樣的意見:「身為初學者,能以自己的步調理解 Python 教學中的每個基礎概念,是不可或缺的!」以學長的姿態,林同學向所有對線上課程卻步的學員們喊話。林同學更補充,若不是線上課程,他就沒辦法接觸到北京業界一流的 Python 教學師資。「既然都要學了,當然要跟最好的老師,學最先進的技術!」我想,就是這樣追求卓越的決心以及面對學習挑戰的屹立不搖,讓他在達內教育的 Python 教學課程中成為程式語言的佼佼者吧!

      AI 一眼抓超速!中研院開發世界最快物件偵測技術: YOLOv4

      (Source:pixabay)   YOLOv4 創生故事 「只要讓我看一眼,我就知道這是什麼!(You Only Look Once, YOLO)」YOLO,是目前當紅的 AI 物件偵測演算法。中研院資訊科學研究所所長廖弘源及博士後研究員王建堯,與俄羅斯學者博科夫斯基(Alexey Bochkovskiy)共同研發最新的 YOLO 第四版(簡稱為 YOLO v4),一舉成為當前全世界最快、最高精準度的物件偵測系統,引爆全球 AI 技術社群,已然改寫物件偵測演算法的發展。究竟,他們在演算法裡動了哪些手腳?又是什麼樣的契機,開啟了這項研究? 產業出難題,學界來解題 故事,是從一項產學合作開始。前幾年,科技部提出了「產學共創」機制:產業出題、學界解題,中研院合作對象義隆電子,出了一個考題給資訊所:如何增進十字路口的交通分析?也就是即時偵測車流量、車速等等。當時義隆電子已經在十字路口架設了監視器,包括全景攝影機及單一方向的槍型攝影機,接下來最需要的,就是辨識車輛的物件偵測技術。 「但我們需要的不只是辨識車輛而已。」王建堯說。在馬路上運行中的車速度很快,物件辨識必須非常即時,在短時間內就能辨識出車輛,並能持續追蹤,計算車速。換句話說,這個技術對物件的偵測必須「快、狠、準」。此外,因為影像資料不斷產生,如果把資料都上傳雲端運算,不但比較耗時,也會給雲端電腦帶來太大的負擔,因此這個偵測技術還得做到一件事──計算量必須夠小,小到可裝在十字路口監視器上的小型計算器, 即可完成物件偵測的任務。 要做到交通路況的即時分析,必須有一種速度快、仍能精準辨識,但又可應用在生活中小型計算器的物件偵測技術。 YOLOv4 演算法達到這個不可能的任務!它是目前世界最快、最精準的物件偵測演算法,卻又能小到放在十字路口的監視器內,已實際應用於如「智慧城市交通車流解決方案計畫」,即時偵測車輛、停等車列、車速等等 。 物件辨識的阿基里斯腱:梯度消失問題 怎麼辦到的?首先,王建堯著手研究著名物件偵測系統 YOLOv3 ,「我們想找出在建立一個物件偵測系統時,哪一個步驟是最關鍵的?如果改善了,效率和精確度會提升最多?」廖弘源強調:「雖然是工程問題,但我們要把科學思考帶進來。」 先來認識物件偵測技術!它是個卷積神經網路(Convolutional Neural Network, 簡稱CNN),具有許多網路層,每一層負責抽取某些圖像特徵。一個輸入的影像通過層層層層層層……分析,最後找出最可能的答案。理論上,層數越多、判斷結果應該越精確。 ▲ 先教電腦定義每個影像的值,再透過神經網路的層層非線性函數運算,判斷影像最可能為哪個數字,信心水準比值最高者為答案。(圖:研之有物、Source:李宏毅)   訓練這個卷積神經網路的方法是:先倒入大量已標記正確答案的學習材料...

      SEO殺手-404與轉址式404錯誤(軟性404)解決方法

      SEO 必知的「響應代碼」定義 在訪問網站時,我們透過 Chrome、Safari 等瀏覽器連到網站的伺服器,以抓取網頁。當網頁被瀏覽器載入時,會附上一組響應代碼 (Response Code) ,用來告知瀏覽器這個網頁有沒有問題。這組代碼,我們在網頁上可能看不到。 響應代碼有很多種,分別代表不同的網頁載入狀況。其中一個最廣為人知的代碼是「404」。 基本上,介於 400 到 499 的任一組代碼,都代表網頁舞法載入。而本篇要提的 404 唯一具有特定含義的代碼:該頁面實際上已經消失了,很可能很快就不復存在。 目錄: 「響應代碼」定義 「轉址式 404(軟性 404、Soft 404)代表意義 可能被誤解為 404 的狀況 SEO 如何修復「轉址式 404」錯誤 使用...