Cách chặn Google index phân trang /page/2 /page/3

Bạn không muốn Google index các phân trang (/page/2 /page/3), điều này có thể khiến trùng lặp nội dung, tiêu đề hoặc đoạn mô tả mặc dù nó đã được khắc phục hỗ trợ bởi một số plugin như Yoast SEO (số trang), nhưng vẫn được index và đánh giá kém chất lượng, ảnh hưởng đến website và SEO.

Một số mẹo có thể giúp bạn khắc phục điều này, hãy tìm hiểu nội dung bên dưới.

Lưu ý: Hướng dẫn này chỉ áp dụng đối với những trang web sử dụng nền tảng WordPress.

Chặn Google index bằng file robots.txt

Bạn có thể sử dụng file robots.txt để chặn google index, những nếu vẫn có các liên kết được trỏ đến thì URL đó có thể vẫn được lập chỉ mục. Vì vậy việc chặn Google index các subpage bằng robots.txt không phải là tối ưu.

Bạn có thể tham khảo tài liệu tại đây: Giới thiệu và hướng dẫn về tệp robots.txt

Bạn có thể tham khảo file robots.txt chặn Google index các subpage

User-agent: *
Disallow: /page/

Khai báo bằng thẻ Canonical

Thẻ canonical là thẻ khai báo cho Google biết một bản sao của URL gốc, nhưng các subpage vẫn được index và hợp nhất với URL gốc. Với cách này bạn kết hợp chỉnh sửa các tiêu đề, một tả để tối ưu website nhé.

Code chỉnh sửa canonical sử dụng cho Yoast SEO chia sẻ bởi satollo.

add_filter('wpseo_canonical', 'my_wpseo_canonical');
function my_wpseo_canonical($canonical) {
    if (is_paged()) {
        if (is_home()) {
            return home_url();
        }

        if (is_archive()) {
            $url = get_category_link(get_queried_object_id());
            return $url;
        }
    }

    return $canonical;
}

Code chỉnh sửa canonical sử dụng cho The SEO Framework

function filter_wpseo_canonical( $canonical ) {
  if (is_paged()) {
   if (is_home()) {
    return home_url();
  }
  if (is_archive()) {
   $url = get_category_link(get_queried_object_id());
   return $url;
  }
 }
 return $canonical;
}; 
add_filter( 'the_seo_framework_rel_canonical_output', 'filter_wpseo_canonical', 10, 1 );

Chèn code trực tiếp vào sau thẻ <head>

Với cách này bạn nên kiểm tra các plugin như Yoast SEO, hoặc Rank Math SEO trước khi sử dụng. Nếu không các thẻ có thể xuất hiện xung đột theme với plugin. Thường thì thẻ <head> sẽ xuất hiện ở trong file header.php, bạn có thể chèn code bên dưới để chặn Google index các /page/.

<?php 
if($paged > 1 || is_author() || is_tag() || is_date() || is_attachment()){
echo '<meta name="robots" content="noindex, follow" />'; } 
?>

Hoặc

<meta name="robots" content="follow, <?php echo (get_query_var('paged')==1)?'index':'noindex'?>" />

Code chỉnh sửa noindex cho subpage (Ưu tiên sử dụng)

Nếu bạn sử dụng Yoast SEO bạn có thể chèn code này vào phần functions.php của theme. Những subpage hoặc /page/ sẽ bị chặn bởi noindex. Mình có cài Yoast SEO và hay sử dụng code này để tối ưu web.

add_filter("wpseo_robots", function($robots) {
   if (is_paged()) {
    return 'noindex, follow';
   } else {
     return $robots;
   }
});

Hoặc bạn có thể sử dụng đoạn code sau nhưng cần lưu ý các plugin như Yoast SEO hoặc Rank Math SEO hay một số plugin đã có thẻ noindex. Nếu như bạn chèn đoạn code này có thể sẽ bị trùng lặp hoặc gây xung đụt với nhau. Hãy kiểm tra trước khi dán đoạn code này vào functions.php.

function dvp_subpage_fix() {
  if(is_paged())
   echo '<meta name="robots" content="noindex, follow"/>';
  }
add_action('wp_head', 'dvp_subpage_fix');