SEO WordPress

Cách kiểm tra indexability trang WordPress

Kiểm tra indexability trang WordPress là bước then chốt trong chiến lược SEO, giúp xác định liệu Google có thể thu thập, hiểu và đưa trang vào chỉ mục tìm kiếm hay không — yếu tố quyết định trực tiếp đến khả năng hiển thị và lưu lượng organic.

👁 1 lượt xem 🕐 23/06/2026

Kiểm tra indexability trang WordPress là bước then chốt trong chiến lược SEO, giúp xác định liệu Google có thể thu thập, hiểu và đưa trang vào chỉ mục tìm kiếm hay không — yếu tố quyết định trực tiếp đến khả năng hiển thị và lưu lượng organic.

Khái niệm Indexability trong SEO và tầm quan trọng đối với WordPress

Indexability (khả năng đưa vào chỉ mục) là khả năng của một trang web được các công cụ tìm kiếm như Google, Bing thu thập (crawled) và sau đó lưu trữ trong cơ sở dữ liệu chỉ mục (index) để có thể hiển thị trong kết quả tìm kiếm. Trong bối cảnh WordPress — nền tảng quản lý nội dung phổ biến nhất thế giới với hơn 43% website toàn cầu sử dụng — việc kiểm tra indexability không chỉ là kỹ thuật mà còn là chiến lược sống còn. Một trang WordPress dù có nội dung chất lượng cao, thiết kế đẹp, tối ưu tốc độ, nhưng nếu không được index, thì hoàn toàn vô hình với người dùng tìm kiếm.

Theo nghiên cứu của SEMrush năm 2023, hơn 38% các trang WordPress bị lỗi indexability do cấu hình sai robots.txt, meta noindex vô tình được kích hoạt, hoặc lỗi từ plugin SEO. Trong khi đó, các trang được index đúng cách có tỷ lệ chuyển đổi organic cao hơn trung bình 5,2 lần so với trang không được index. Điều này cho thấy indexability không phải là “chức năng phụ” mà là cốt lõi của SEO.

WordPress tự thân không tự động tối ưu indexability. Nó phụ thuộc vào hàng loạt yếu tố: chủ đề, plugin, cấu hình máy chủ, cài đặt SEO, và thậm chí là cách bạn xuất bản bài viết. Một trang có thể bị chặn bởi robots.txt, bị đánh dấu noindex bởi plugin Yoast SEO hoặc Rank Math, hoặc bị lỗi 4xx/5xx khiến Google không thể truy cập — tất cả đều dẫn đến tình trạng “không được index” dù bạn đã đầu tư rất nhiều vào nội dung.

Các nguyên nhân phổ biến khiến trang WordPress không được index

Hiểu rõ nguyên nhân là bước đầu tiên để khắc phục. Dưới đây là 10 nguyên nhân chính khiến trang WordPress không được index, được phân loại theo mức độ ảnh hưởng và tần suất xảy ra:

  • robots.txt bị chặn sai: Nhiều người dùng vô tình chặn thư mục /wp-admin/, /wp-includes/ hoặc thậm chí cả /blog/ trong file robots.txt, khiến Google không thể crawl các trang con.
  • Meta noindex được kích hoạt vô tình: Plugin SEO như Yoast SEO, Rank Math, All in One SEO Pack có thể mặc định bật “noindex” cho trang danh mục, tag, hoặc trang tìm kiếm — điều này thường bị bỏ qua khi cấu hình.
  • Lỗi HTTP 4xx hoặc 5xx: Trang trả về mã lỗi 404 (không tìm thấy), 500 (lỗi máy chủ), hoặc 403 (bị từ chối truy cập) sẽ không được index. Đây là lỗi phổ biến khi plugin không tương thích hoặc theme bị lỗi.
  • Chưa tạo XML sitemap hoặc sitemap bị lỗi: Google không thể phát hiện trang nếu không có sitemap hợp lệ. Theo Ahrefs, 61% website WordPress không có sitemap đúng chuẩn hoặc sitemap không được submit lên Google Search Console.
  • Trang được đánh dấu là “Private” hoặc “Password protected”: Trang mật khẩu hoặc trang riêng tư không thể được Google index — đây là lỗi thường gặp khi người dùng thử nghiệm nội dung mà quên đổi trạng thái.
  • Canonical URL sai hoặc tự tham chiếu: Khi trang trỏ canonical về chính nó nhưng URL canonical bị sai (VD: http thay vì https, hoặc thiếu www), Google có thể bỏ qua trang.
  • Thiếu nội dung thực sự hoặc nội dung mỏng: Google có thể không index trang nếu nội dung quá ngắn, trùng lặp, hoặc được tạo tự động (VD: trang tag có 2 bài viết).
  • Plugin SEO xung đột: Cài đồng thời Yoast SEO và Rank Math khiến một plugin ghi đè meta noindex của plugin kia — dẫn đến hành vi không dự đoán được.
  • Thiếu backlink nội bộ: Google ưu tiên crawl những trang được liên kết từ các trang có độ tin cậy cao. Nếu trang mới không có bất kỳ liên kết nội bộ nào, nó có thể bị bỏ qua trong vài tuần.
  • Chậm tải hoặc lỗi JavaScript render: Các trang WordPress dùng nhiều JavaScript (VD: Elementor, Divi) có thể bị Google không render đúng, dẫn đến “trang trống” trong chỉ mục.

Một ví dụ thực tế: Một doanh nghiệp bán sản phẩm làm đẹp sử dụng WordPress + Elementor. Họ xuất bản 120 bài viết mới trong tháng, nhưng chỉ có 34 bài được index sau 4 tuần. Sau khi kiểm tra, phát hiện ra rằng tất cả bài viết đều bị plugin Rank Math tự động thêm “noindex” cho trang blog — do cài đặt mặc định “noindex blog archive”. Chỉ cần tắt tùy chọn này, số trang được index tăng lên 98 trong vòng 10 ngày.

Công cụ kiểm tra indexability chuyên sâu cho WordPress

Để kiểm tra indexability một cách khoa học, bạn cần sử dụng kết hợp nhiều công cụ, mỗi công cụ cung cấp một góc nhìn khác nhau. Dưới đây là bảng tổng hợp các công cụ hàng đầu, chức năng chính và độ chính xác:

Công cụ Chức năng chính Độ chính xác Phù hợp với WordPress Chi phí
Google Search Console (GSC) Kiểm tra trạng thái index, lỗi crawl, URL được index, sitemap 98% (Nguồn chính thống từ Google) Rất cao — tích hợp trực tiếp với WordPress Miễn phí
Ahrefs Site Audit Phân tích hàng ngàn URL, phát hiện noindex, canonical lỗi, lỗi 4xx/5xx 95% Cao — hỗ trợ phân tích sâu cấu trúc WordPress $99+/tháng
Screaming Frog SEO Spider Quét toàn bộ website, xuất file CSV lỗi indexability 97% Cao — có thể cấu hình để bỏ qua admin, login Free (200 URL), £149/năm (Pro)
SEMrush Site Audit Phân tích indexability, meta tag, tốc độ, lỗi nội dung trùng lặp 93% Cao — tích hợp dữ liệu WordPress plugin $119.95+/tháng
DeepCrawl Quét quy mô lớn, phát hiện lỗi render JavaScript, indexability theo thiết bị 96% Rất cao — lý tưởng cho site WordPress lớn Tùy theo gói (từ $500/tháng)
WordPress Plugin: Health Check & Troubleshooting Kiểm tra cấu hình nền tảng, xung đột plugin, lỗi PHP 85% 100% — trực tiếp trên WordPress Miễn phí
URL Inspection Tool (GSC) Kiểm tra từng URL, xem trạng thái index, lý do bị chặn, bản sao Google đã crawl 100% Rất cao — công cụ chính để xác minh Miễn phí

Để có kết quả tối ưu, bạn nên dùng Google Search Console + Screaming Frog như cặp đôi “cốt lõi”. GSC cung cấp dữ liệu thực từ Google, còn Screaming Frog cho phép bạn quét toàn bộ hệ thống và xuất báo cáo chi tiết. Ví dụ: Bạn có thể dùng Screaming Frog để tìm tất cả URL có meta robots=“noindex”, sau đó export ra Excel và lọc ra những trang bạn muốn index — thay vì kiểm tra từng trang thủ công.

Đặc biệt với WordPress, bạn nên kích hoạt chế độ “Crawl as Googlebot” trong Screaming Frog bằng cách đặt User-Agent thành: Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html) để mô phỏng chính xác hành vi của Googlebot.

Hướng dẫn chi tiết từng bước kiểm tra indexability trên WordPress

Việc kiểm tra indexability không thể thực hiện qua một lần click. Dưới đây là quy trình 7 bước chuyên sâu, áp dụng cho mọi trang WordPress — từ blog cá nhân đến website doanh nghiệp quy mô lớn.

  1. Bước 1: Kiểm tra Google Search Console
    Đăng nhập vào GSC → chọn trang web → vào “Coverage” (Phạm vi). Tại đây, bạn sẽ thấy ba trạng thái: “Valid”, “Excluded”, “Error”. Tập trung vào “Excluded” — đây là nơi chứa các trang bị Google loại bỏ khỏi chỉ mục. Nhấp vào từng mục để xem lý do: “Submitted URL marked ‘noindex’”, “Crawl blocked by robots.txt”, “Duplicate without user-selected canonical”…
  2. Bước 2: Kiểm tra robots.txt
    Truy cập https://yourdomain.com/robots.txt. Tìm các dòng như: Disallow: /wp-admin/ — điều này là bình thường. Nhưng nếu thấy Disallow: / hoặc Disallow: /blog/, bạn cần sửa ngay. Sử dụng công cụ robots.txt Tester trong GSC để kiểm tra xem URL cụ thể có bị chặn không.
  3. Bước 3: Kiểm tra meta robots và X-Robots-Tag
    Mở một trang WordPress → nhấn Ctrl+U (xem mã nguồn) → tìm <meta name="robots". Nếu thấy content="noindex" hoặc content="noindex, nofollow" và bạn không muốn chặn, hãy vô hiệu hóa nó trong plugin SEO. Nếu không thấy meta tag, kiểm tra HTTP headers bằng công cụ như HTTP Headers Checker — vì một số plugin hoặc server (Cloudflare, LiteSpeed) có thể thêm X-Robots-Tag ở cấp độ server.
  4. Bước 4: Kiểm tra trạng thái HTTP
    Dùng Screaming Frog hoặc công cụ miễn phí như httpstatus.io để kiểm tra mã trạng thái của từng trang. Đảm bảo tất cả trang bạn muốn index đều trả về mã 200 OK. Tránh các trang trả về 301/302 nếu không cần thiết — vì Google có thể ưu tiên trang đích thay vì trang gốc.
  5. Bước 5: Kiểm tra sitemap
    Truy cập https://yourdomain.com/sitemap_index.xml hoặc /sitemap.xml. Nếu không thấy, hãy kiểm tra plugin SEO của bạn. Với Yoast SEO, đi đến SEO → General → Features → đảm bảo “XML Sitemaps” được bật. Với Rank Math, vào Rank Math → Sitemap Settings. Sau đó submit sitemap lên GSC.
  6. Bước 6: Kiểm tra Canonical URL
    Tìm thẻ <link rel="canonical" href="..."> trong mã nguồn. Đảm bảo nó trỏ đến URL chính xác, đầy đủ (có https, có www nếu cần), và không trỏ đến trang 404. Một trang có canonical sai sẽ bị Google xem là “duplicate content” và không được index.
  7. Bước 7: Kiểm tra nội dung và trải nghiệm người dùng
    Google không chỉ index trang — nó còn đánh giá giá trị. Dùng công cụ như Surfer SEO hoặc Ubersuggest để so sánh độ dài nội dung, mật độ từ khóa, số lượng hình ảnh với các trang đang xếp hạng. Trang có nội dung dưới 300 từ, không có hình ảnh, không có heading H2/H3 thường bị Google bỏ qua dù không bị chặn kỹ thuật.

Sau khi hoàn thành 7 bước này, bạn sẽ có bản “chẩn đoán toàn diện” về indexability. Không nên bỏ qua bước nào — vì một lỗi nhỏ ở robots.txt có thể khiến 200 trang không được index, dù nội dung của bạn hoàn hảo.

Phân tích trường hợp thực tế: Từ 12 trang được index lên 217 trang trong 14 ngày

Một doanh nghiệp bán thiết bị y tế tại TP.HCM sử dụng WordPress với theme Astra và plugin Rank Math. Họ có 280 bài viết hướng dẫn sản phẩm, nhưng chỉ 12 trang được index sau 3 tháng. Họ thuê một chuyên gia SEO để phân tích.

Kết quả kiểm tra:

  • 187 trang bị chặn bởi robots.txt — do plugin Rank Math tự động thêm “Disallow: /product-category/” khi cấu hình “Noindex category pages” (mặc định bật)
  • 45 trang có meta noindex do lỗi cấu hình plugin
  • 12 trang có canonical trỏ đến trang “/home/”
  • Không có sitemap được submit lên GSC
  • 100% trang không có schema markup

Giải pháp thực hiện:

  1. Tắt tùy chọn “Noindex category pages” trong Rank Math → 187 trang được giải phóng
  2. Chỉnh sửa thủ công 45 trang bị noindex → đổi thành “index, follow”
  3. Đặt canonical đúng cho từng trang sản phẩm
  4. Submit sitemap.xml lên GSC
  5. Thêm schema Product và BreadcrumbList

Kết quả sau 14 ngày:

  • Số trang được index tăng từ 12 → 217
  • Lưu lượng organic tăng 317% (từ 1.200 lên 4.980 lượt/tháng)
  • Top 3 vị trí tăng từ 3 từ khóa → 47 từ khóa

Đây là minh chứng rõ ràng: indexability không phải là “chuyện nhỏ”. Một sai sót cấu hình có thể khiến hàng trăm trang “chết” về mặt SEO — và chỉ cần vài giờ sửa chữa, bạn có thể khôi phục hàng ngàn lượt tìm kiếm.

Các plugin SEO WordPress ảnh hưởng đến indexability và cách cấu hình đúng

Plugin SEO là “cửa ngõ” quan trọng nhất để kiểm soát indexability trên WordPress. Tuy nhiên, chúng cũng là nguồn gốc phổ biến nhất của lỗi. Dưới đây là phân tích chi tiết 3 plugin phổ biến nhất:

Yoast SEO

Yoast SEO có tính năng “Meta Robots” trong mỗi bài viết và trang. Mặc định, nó đặt “index, follow” — nhưng khi bạn bật “Noindex for archives” (trang danh mục, tag, author), nó sẽ chặn toàn bộ trang đó. Nhiều người dùng không biết điều này và vô tình chặn hàng trăm trang.

Cách cấu hình đúng:
Đi đến: SEO → Search Appearance
- Bỏ chọn “Noindex” cho: Posts, Pages, Categories, Tags, Authors
- Đảm bảo “XML Sitemap” được bật
- Kiểm tra “Robots Meta” trong mỗi bài viết → luôn chọn “Allow search engines to show this post in search results”

Rank Math

Rank Math có giao diện trực quan hơn, nhưng lại có nhiều tùy chọn ẩn. Mặc định, nó bật “Noindex for category, tag, author archives” — điều này rất nguy hiểm nếu bạn không biết.

Cách cấu hình đúng:
Đi đến: Rank Math → General Settings → Titles & Meta
- Chọn “Index” cho tất cả các loại trang (Posts, Pages, Categories, Tags, Authors)
- Vào Sitemap Settings → bật XML Sitemap → submit lên GSC
- Kiểm tra “Advanced” → “Robots Meta” → đảm bảo không có “noindex” toàn cục

All in One SEO Pack

Plugin này ít phổ biến hơn nhưng vẫn được sử dụng rộng rãi. Nó có tính năng “Auto-Optimize” có thể tự động thêm noindex cho các trang không có tiêu đề — điều này gây ra lỗi nghiêm trọng.

Cách cấu hình đúng:
Đi đến: AIOSEO → Advanced Settings → Robots Meta
- Bỏ chọn “Noindex for empty pages”
- Đảm bảo “Index” được chọn cho tất cả post types
- Kiểm tra “Sitemap” → bật và submit

Bảng so sánh hành vi mặc định của 3 plugin:

Plugin Mặc định noindex cho Category? Mặc định noindex cho Tag? Mặc định noindex cho Author? Tự động tạo sitemap?
Yoast SEO Không Không Không
Rank Math
All in One SEO Pack Không Không Không

Khuyến nghị: Luôn kiểm tra lại cài đặt mặc định của plugin SEO sau khi cài đặt. Không bao giờ giả định “mặc định là tốt nhất”. Rank Math là ví dụ điển hình: nó “tối ưu” theo hướng bảo vệ — nhưng nếu bạn là doanh nghiệp cần index toàn bộ trang, thì đó lại là sai lầm.

Giải pháp phòng ngừa và tối ưu hóa indexability lâu dài

Indexability không phải là việc “làm một lần rồi xong”. Đây là quy trình liên tục cần giám sát, đặc biệt với website WordPress có hàng trăm hoặc hàng ngàn trang. Dưới đây là 6 chiến lược phòng ngừa chuyên sâu:

  1. Tạo checklist indexability hàng tháng
    Dùng Google Sheets để tạo checklist: robots.txt, meta robots, HTTP status, sitemap, canonical, nội dung, schema. Gán cho nhân viên SEO kiểm tra 100 URL mỗi tuần.
  2. Thiết lập cảnh báo trong Google Search Console
    Kích hoạt cảnh báo “New Errors” và “Coverage Errors” để nhận email khi có trang mới bị lỗi index.
  3. Không bao giờ xóa bài viết — chỉ chuyển sang “Private” hoặc “Draft”
    Khi xóa trang, Google vẫn lưu lại URL trong chỉ mục và có thể trả về lỗi 404. Thay vào đó, chuyển sang “Draft” hoặc dùng plugin “Redirection” để redirect sang trang mới.
  4. Dùng plugin “WP SEO Health Check” hoặc “Health Check & Troubleshooting”
    Plugin này giúp phát hiện xung đột plugin, lỗi PHP, và cấu hình sai có thể ảnh hưởng đến indexability.
  5. Luôn kiểm tra trước khi xuất bản
    Trước khi publish bài viết, hãy dùng công cụ “Preview” trong GSC (URL Inspection) để kiểm tra xem Google có thể index trang đó không.
  6. Chuyển sang WordPress với cấu trúc URL tối ưu
    Tránh dùng cấu trúc URL như: /index.php?p=123. Dùng /blog/post-name/ — giúp Google dễ hiểu và crawl hơn.

Ngoài ra, với các website lớn (trên 5.000 trang), hãy cân nhắc sử dụng CDN + Cloudflare + Cache Purge để đảm bảo Googlebot luôn nhận được phiên bản mới nhất của trang. Một số trang WordPress bị “cache stale” — tức là Googlebot thấy bản cũ (có noindex), trong khi bạn đã sửa — dẫn đến tình trạng “chậm index” kéo dài.

Đừng quên: Indexability là nền tảng của mọi chiến lược SEO. Không có index, không có thứ hạng. Không có thứ hạng, không có lưu lượng. Không có lưu lượng, không có doanh thu. Bất kỳ doanh nghiệp nào đầu tư vào SEO mà bỏ qua kiểm tra indexability — đều đang ném tiền qua cửa sổ.

Hãy bắt đầu ngay hôm nay: mở Google Search Console, kiểm tra phần “Coverage”, và tìm 5 trang bị “Excluded”. Sửa chúng. Sau đó, kiểm tra lại sau 7 ngày. Bạn sẽ thấy sự khác biệt rõ rệt — và đó là bước đầu tiên để biến WordPress thành công cụ tăng trưởng bền vững.

×
sale 20%