vnfaster@gmail.com

Cách chặn Bot Ahrefs quét dữ liệu website thành công 100%

Cách chặn Bot Ahrefs quét dữ liệu website thành công 100% đơn giản cho SEO.

Chào các bạn,
Gần đây mình nhận được câu hỏi làm thế nào để chặn Bot Ahrefs quét dữ liệu trên website. Vấn đề khá hay, chắc cũng có nhiều bạn quan tâm, nên mình xin phép viết bài hướng dẫn về phần này.

Trước tiên ta cần hiểu Ahrefs là gì?
– Ahrefs là một công cụ trả phí dùng để phân tích các thông số của website.
– Ahrefs tạo ra các Bot đi vào website và thu thập dữ liệu các website đó như Backlinks, Referring domains, Organic keywords, Top pages…

Chặn Ahrefs để làm gì?
– Nếu bạn có một website với các từ khóa hot đang nằm trên top Google và rất nhiều đối thủ đang muốn cạnh tranh từ khóa đó, họ có thể sẽ dùng tới Ahrefs để phân tích website của bạn. Vậy nên khi chặn Ahrefs Bot thì công cụ này sẽ không còn chính xác khi phân tích website của bạn nữa.

Qua tìm hiểu thì bên phía Ahrefs có cung cấp một đoạn mã chèn vào file Robots.txt để Bot của trang này không vào quét dữ liệu nữa, mình đã thử nhưng khi check file log (lịch sử truy cập) thì Ahrefs Bot vẫn vào quét dữ liệu đều (Ahrefs là một công cụ trả phí, nó mà cung cấp cách chặn chính xác thì không khác gì tự bẻ cần câu cơm của mình).

Ngoài ra có nhiều bạn cũng từ viết chia sẻ chặn Ahrefs qua file .htaccess
– Chặn Ahrefs Bot trên file .htaccess qua IP và UserAgent: Tuy nhiên Ahrefs cập nhật và thay đổi IP Bot liên tục, về phần UserAgent đã đặt theo nhiều hướng dẫn trên mạng mà Bot vẫn vào đều.

Cuối cùng mình đã nghĩ ra một cách khá đơn giản:
Cách Làm
– Bạn thêm đoạn này vào đầu của file header.php trong thư mục Theme đang sử dụng:

<?php $useragent = $_SERVER ['HTTP_USER_AGENT'];
if (preg_match('/AhrefsBot/',$useragent)){
wp_redirect('http://google.com');
exit();
}
?>

Giải thích:
$useragent = $_SERVER ['HTTP_USER_AGENT'];: giúp ta kiểm tra UserAgent truy cập là gì.
if (preg_match('/AhrefsBot/',$useragent)){}: Phát hiện đây có phải AhrefsBot hay không.
wp_redirect('http://google.com');: Nếu là AhrefsBot thì chuyển con bot này nhảy sang trang Google.
– Mình vẫn sử dụng cách nhận biết User Agent để chặn Bot, tuy nhiên mình đã sử lý trong file header.php
– Đã thử giả lập UserAgent thành AhrefsBot và đã Redirect thành công sang Google, trong thống kê truy cập cũng không còn AhrefsBot nữa.

Chúc các bạn thành công!

Bài liên quan

    • Chào bạn, nếu đã đặt code mà ra view-source không thấy thì có thể bạn đang sử dụng plugin cache, hoặc trình duyệt đang bị cache, bạn thử xóa cache đi xem nhé.
      Việc Check index từ Ahref thì bạn phải chờ khi Ahref cập nhật chứ không phải đặt code lên là Ahref mất index luôn bạn ạ.

Bình luận bài viết

Bạn cần đăng nhập để bình luận.

Audio truyện full

phàm nhân tu tiên audio

vũ thần chúa tể audio

thế giới hoàn mỹ audio

vô thượng thần đế audio

vạn cổ thần de audio

tiên nghịch audio

Truyện ebook dịch full

truyện audio

phàm nhân tu tiên audio

tiên nghịch audio

vũ thần chúa tể audio

thế giới hoàn mỹ audio

vô thượng thần đế audio

van co than de

bảo hộ tộc trưởng phe ta audio

sư huynh ta quá ổn trọng audio

quỷ bí chi chủ audio

thiên cơ lâu: bắt đầu chế tạo âm hiểm bảng audio

tối cường trang bức đả kiểm hệ thống audio

tu chân tứ vạn niên audio

thê vi thượng

truyện teen

yêu thần ký

con đường bá chủ

thần mộ

đế bá

tinh thần biến

thần ấn vương tọa

đấu la đại lục 5