使用 URL 參數引起 SEO 的問題
URL 參數可能很重要,但它們也可能對 SEO 性能會有負面影響。不同於 URL 網域和子目錄,URL 參數不提供指向不同頁面位置,只能提供頁面內容的訊息。
然而,對於搜尋引擎爬蟲 - 搜尋引擎索引網頁的機器人 - 不會知道這一點。如果沒有額外的內容資訊,爬蟲程式帶回帶有參數的頁面 URL (像是 "https://mucknbrass.com/collections/best-sellers?sort_by=best-selling"),機器人程式會視為一般頁面抓取,和其他頁面視為不同 "https://mucknbrass.com/collections/best-sellers"。
URL 參數可能產生幾項 SEO 的問題:
內容重覆的風險。如果搜尋引擎抓到兩個頁面 "/collections/featured/" 和 "collections/featured?sort_by=price=ascending",而且發現它們的內容基本上是相同但順序不同,Google 會不知道要使用哪個頁面在結果排名,這可能會造成整體網站排名較低。
過度使用爬蟲預算。搜尋引擎有設置每個網站要抓取多少 URL 的規則。高流量網站比低流量網站可以獲得更多預算,但每個網站都有一個限制。帶有數百數千的不同頁面可能很快耗盡它的預算。因此,爬蟲程式可能因此漏抓了一些更重要的頁面。
被稀釋的反向連結。反向連結 - 從其他網站到你的網站的連結,這對於 SEO 非常重要。如果你網站的一些反向連結到 "/collections/featured/",而一些是到 "collections/featured?sort_by=price=ascending" ,那麼你的網站權威信賴度訊號會被這兩個頁面分走,這意味著搜尋引擎不知要將哪個頁面放到搜尋結果裡。
參數所引起 SEO 問題的解決方案
像是 Google 這樣的搜尋引擎已經可以更好的推斷參數的含意,像是 "sort_by" 或是 "utm_campaign",了解並知道如何處理。這就是 Google 為何取消他們的 URL 參數工具,這個工具原本是讓網站管理員向 Google 說明他們參數的用途。然而,參數問題可能還是會持續存在,如果不解決,可能會影響你的 SEO 效能。
SEO 參數問題所有解決方案,都圍繞在相同原則:讓搜尋引擎清楚哪些是你的 URL 首選版本以及那些是要忽略的。可以把每天網站抓取預算積分視為 100 來說明。網站裡面所有頁面都會消耗一個積分,帶有參數和不同值的 URL 都會消耗額外的積分。如果帶有不同參數的同一個 URL 被發現 10 次,那麼將會花費 10 個積分而不是 1 個。
有三項工具可以解決參數所帶來 SEO 的問題:
規範標籤。規範標籤是一種 HTML 標籤,它會告訴搜尋引擎 "這是索引和排名網頁的首選版本"。指定規範頁面有助於避免重覆內容問題發生,確保搜尋引擎了解內容的主要來源。正確的使用規範標籤,通常可以處理大部分來至參數的 SEO 問題。
Sitemap (網站地圖文件)。把網站地圖文件上傳到你的網站上,Google Search Console 會告訴 Google 和其他搜尋引擎,那些是你網站上的重要頁面。通常可以在網域名之後加入 "/sitemap.xml" 來查看網站的網站地圖文件。
Robots.txt 就像 Sitemap 一樣,robots.txt 檔案告訴搜尋引擎要抓網站那些部分。差別於,網站地圖文件被視為指南,而 robots.txt 文件被視為規則。因此,只有在規範標籤和網站地圖也無法阻止有參數的頁面被抓取時,才需要編輯這個檔案。可以透過訪問 "example.com/robots.txt" 來取得這個文件。
URL 參數常見問題和解答
如何找到 URL 參數?
URL 參數一直位於 URL 的尾端。總是以 ? 符號開始,每個參數以 & 符號分隔。要找尋 URL 參數,請先找到 ? 符號;右邊所有內容都是參數,左邊所有內容都是根 URL。
URL 參數應該避免那些事情?
URL 參數是設計來變更網頁或是提供額外的內容。然而,並不是設計來顯示不同的網頁。應該避免使用參數來顯示網站的不同部分。
為何 URL 結構很重要?
網站 URLs 結構 - 由 URLs 網域,子目錄,以及參數組成 - 使你的網站讓用戶和搜尋引擎更容易閱讀。關於 URL 網站和子目錄。可以想像一個使用編號的 URL 網站:"example.com/12","example.com/13","example.com/14" 之類網址。這會比帶有描述用途的子目錄網站更難理解:"example.com/products/","example.com/products/bath-mat","example.com/about/","example.com/about/team"。
URL 裡面的 # 符號有何作用?
在 URL 裡面,# 符號代表頁面定位識別 - 也被稱為散列或是散列符號。當 URL 裡面包含 # 符號以及其後跟隨的一些文字,代表瀏覽器要把頁面滾動到特定位置。
原文 : https://www.shopify.com/blog/url-parameters