SEO

GSC 出現「已建立索引但未包含內容」怎麼辦?Google 官方揭露真正兇手

GSC 出現「已建立索引但未包含內容」怎麼辦?Google 官方揭露真正兇手

你是否遇過這種情況?網站流量突然斷崖式下跌,關鍵字排名從首頁直接消失。當你驚慌失措地打開 Google Search Console(GSC),赫然發現一個令人費解的錯誤訊息:「已建立索引但未包含內容」(Page Indexed without content)

這不僅僅是一個技術警告,這是一場 SEO 災難的開始。

最近在 Reddit 上,一位網站管理者就經歷了這場噩夢——他的網站首頁關鍵字排名在一夜之間從第 1 名掉到了第 15 名。許多人第一時間會懷疑是網站程式碼寫壞了,或是 JavaScript 渲染出了問題。但 Google 的資深搜尋倡導者 John Mueller 給出了一個完全不同的答案,揭露了問題的真正核心。

流量暴跌的噩夢:這行紅字代表什麼?

首先,我們得搞清楚這個錯誤訊息的嚴重性。「已建立索引但未包含內容」這句話聽起來很矛盾——既然索引了,怎麼會沒有內容?

想像一下,Google 的爬蟲(Googlebot)就像一位米其林評審員,他已經把你的餐廳(網頁)列在名單上了,但他走到門口時,卻被警衛擋在門外,或者進去後發現整間店空無一物。

這意味著 Google 知道這個頁面存在,但完全無法讀取任何資訊。對於搜尋引擎來說,一個讀不到內容的網頁就等於沒有價值。這不是小感冒,這是急重症。如果不立即處理,受影響的頁面將會被 Google 從索引資料庫中剔除,你的自然流量將會直接歸零。

別再怪 JavaScript 了:John Mueller 點出真正盲點

當遇到這個錯誤時,絕大多數的工程師或 SEO 專家直覺反應都是:「一定是前端 JavaScript 渲染失敗,導致 Google 抓到空白頁面。」

於是大家開始瘋狂檢查 React、Vue 的渲染邏輯,或是伺服器端渲染的設定。但 John Mueller 最近在回應這起案例時,明確指出了這個常見的誤區

Mueller 表示:

「這通常意味著你的伺服器或 CDN(內容傳遞網路)正在封鎖 Google,使其無法接收任何內容。這與 JavaScript 無關。這通常是一個相當底層的封鎖,有時是基於 Googlebot 的 IP 位址進行攔截。」

換句話說,問題不在於你的網頁「內容」顯示不出來,而是 Googlebot 根本連門都進不了。這是基礎設施層級的問題,而不是應用程式層級的問題。

為什麼一般工具測不出來?

這類問題最棘手的地方在於它的「隱蔽性」。

在上述案例中,受害者嘗試了所有標準檢測流程:

  1. 用瀏覽器打開網頁:正常
  2. 用手機瀏覽:正常
  3. 使用 curl 指令模擬 Googlebot 抓取:正常
  4. 第三方 SEO 工具爬取:正常

為什麼所有工具都說沒問題,只有 Google Search Console 報錯?

關鍵在於「IP 辨識」。現代的防火牆(WAF)和 CDN 服務(如 Cloudflare)非常聰明,它們會根據來源 IP 位址來判斷是否放行。

這就像是你的大樓警衛認得特定的臉孔。一般訪客(使用者)可以進入,假扮成訪客的測試工具(第三方爬蟲)也可以進入,但當真正的 Googlebot(帶著特定的 Google IP)出現時,防火牆可能因為誤判,認定這是惡意攻擊或機器人掃描,直接觸發了「拒絕訪問」的規則。

這就是為什麼你在本地端怎麼測都測不出來——因為你不是用 Google 的 IP 去訪問網站的。

排查指南:鎖定並解決 Server/CDN 封鎖

既然知道了兇手通常是伺服器配置或 CDN,我們該如何具體解決?以下是針對網站環境優化的排查三步驟:

第一步:使用 GSC URL 檢查工具(唯一真理)

既然外部工具不準,就必須使用 Google 官方的工具。

  1. 打開 Google Search Console。
  2. 使用上方的「網址檢查」輸入受影響的網址。
  3. 點擊「測試公開網址」。

如果這裡顯示失敗或錯誤,這就是確鑿的證據。這代表 Google 的基礎設施在當下確實被你的網站擋住了。Mueller 強調,這是目前唯一能準確重現該問題的測試環境。

第二步:檢查 CDN 設定(Cloudflare 使用者必看)

在台灣,非常多網站使用 Cloudflare 作為 CDN。原文案例中的受害者正是使用了 Webflow 搭配 Cloudflare。

請檢查以下設定:

  • 機器人戰鬥模式:Cloudflare 的自動防禦機制有時會過於激進,誤殺 Googlebot。
  • WAF 防火牆規則:檢查是否有設定阻擋特定流量的規則。
  • IP 存取控制:確認沒有誤將 Google 的 IP 範圍列入黑名單。

如果你近期沒有動過設定,也不要掉以輕心。CDN 服務商有時會進行自動更新或推播新的預設規則,導致原本正常的網站突然開始封鎖 Googlebot。

第三步:伺服器日誌(Server Logs)分析

如果你有權限存取伺服器的 Access Log,請搜尋來自 Googlebot 的請求。

  • 正常的請求狀態碼應該是 200。
  • 如果你看到大量的 403 Forbidden 或 5xx Server Error 對應到 Googlebot 的 User-Agent,那就確認是被伺服器端擋下了。

延伸討論:雲端時代的 SEO 新挑戰

這個案例反映了一個現代 SEO 的重要趨勢:SEO 不再只是內容與關鍵字,技術基礎建設(Tech SEO)的重要性日益增加。

隨著越來越多網站使用「共享基礎設施」(如 Cloudflare、AWS CloudFront),我們享受了防禦 DDoS 攻擊的安全與速度,但也承擔了共用規則誤判的風險。John Mueller 曾指出,有時候這甚至不是你個人的設定問題,而是 CDN 服務商針對整個共享架構進行了調整,導致多個網站同時受害。

預防勝於治療

  • 定期監控:不要等到排名掉光才發現。養成每週查看 GSC「網頁索引建立」報告的習慣。
  • 白名單機制:如果你的防火牆支援,建議將 Google 官方公佈的 Googlebot IP 範圍 加入白名單,確保 VIP 通道暢通。

結論

當你下次看到「已建立索引但未包含內容」時,請先放下手中的 JavaScript 偵錯工具。這不是程式碼的問題,這是一場通行證的糾紛。

你的行動清單:

  1. 立即使用 GSC 的「測試公開網址」確認現況。
  2. 登入你的 CDN(如 Cloudflare)檢查防火牆與機器人攔截紀錄。
  3. 聯絡你的主機商或開發團隊,確認是否有針對 IP 的封鎖規則。

作者

Sliven 褚崇名

Sliven Chu 褚崇名,Whoops SEO 創辦人。專注於透過正確地的白帽 SEO 優化策略,協助網站提升 Google 排名,並實現業務增長的數位行銷顧問。Whoops SEO 致力於將複雜的 SEO 概念化繁為簡,提供清晰、可執行的教學與洞察,幫助你在競爭激烈的市場中脫穎而出。我們對 Google SEO 的最新動態與 AI 行銷趨勢保持高度關注,並樂於分享第一手觀察。

Leave a comment

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *


文章目錄