Cách chặn Bot Ahrefs quét dữ liệu website thành công 100%
Cách chặn Bot Ahrefs quét dữ liệu website thành công 100% đơn giản cho SEO.
Chào các bạn,
Gần đây mình nhận được câu hỏi làm thế nào để chặn Bot Ahrefs quét dữ liệu trên website. Vấn đề khá hay, chắc cũng có nhiều bạn quan tâm, nên mình xin phép viết bài hướng dẫn về phần này.
Trước tiên ta cần hiểu Ahrefs là gì?
– Ahrefs là một công cụ trả phí dùng để phân tích các thông số của website.
– Ahrefs tạo ra các Bot đi vào website và thu thập dữ liệu các website đó như Backlinks, Referring domains, Organic keywords, Top pages…
Chặn Ahrefs để làm gì?
– Nếu bạn có một website với các từ khóa hot đang nằm trên top Google và rất nhiều đối thủ đang muốn cạnh tranh từ khóa đó, họ có thể sẽ dùng tới Ahrefs để phân tích website của bạn. Vậy nên khi chặn Ahrefs Bot thì công cụ này sẽ không còn chính xác khi phân tích website của bạn nữa.
Qua tìm hiểu thì bên phía Ahrefs có cung cấp một đoạn mã chèn vào file Robots.txt để Bot của trang này không vào quét dữ liệu nữa, mình đã thử nhưng khi check file log (lịch sử truy cập) thì Ahrefs Bot vẫn vào quét dữ liệu đều (Ahrefs là một công cụ trả phí, nó mà cung cấp cách chặn chính xác thì không khác gì tự bẻ cần câu cơm của mình).
Ngoài ra có nhiều bạn cũng từ viết chia sẻ chặn Ahrefs qua file .htaccess
– Chặn Ahrefs Bot trên file .htaccess qua IP và UserAgent: Tuy nhiên Ahrefs cập nhật và thay đổi IP Bot liên tục, về phần UserAgent đã đặt theo nhiều hướng dẫn trên mạng mà Bot vẫn vào đều.
Cuối cùng mình đã nghĩ ra một cách khá đơn giản:
Cách Làm
– Bạn thêm đoạn này vào đầu của file header.php trong thư mục Theme đang sử dụng:
<?php $useragent = $_SERVER ['HTTP_USER_AGENT']; if (preg_match('/AhrefsBot/',$useragent)){ wp_redirect('http://google.com'); exit(); } ?>
Giải thích:
– $useragent = $_SERVER ['HTTP_USER_AGENT'];
: giúp ta kiểm tra UserAgent truy cập là gì.
– if (preg_match('/AhrefsBot/',$useragent)){}
: Phát hiện đây có phải AhrefsBot hay không.
– wp_redirect('http://google.com');
: Nếu là AhrefsBot thì chuyển con bot này nhảy sang trang Google.
– Mình vẫn sử dụng cách nhận biết User Agent để chặn Bot, tuy nhiên mình đã sử lý trong file header.php
– Đã thử giả lập UserAgent thành AhrefsBot và đã Redirect thành công sang Google, trong thống kê truy cập cũng không còn AhrefsBot nữa.
Chúc các bạn thành công!
Bài liên quan
- Kết nối comment fanpage facebook và bài viết trên website
- Thêm công cụ tìm kiếm của Website vào các trình duyệt
- Thêm nút like, share, google + vào WordPress
- Thêm thẻ Meta Description cho WordPress không cần Plugin
- Tự động thêm link từ khóa vào nội dung và trích dẫn wordpress
- Thêm đuôi .html cho Post và Page WordPress không dùng plugin
Thủ thuật khá hay để không bị đối thủ phân tích
Sao viewsource ra không thấy code ấy đâu nhỉ. Check ahrefs vẫn thấy còn index
Chào bạn, nếu đã đặt code mà ra view-source không thấy thì có thể bạn đang sử dụng plugin cache, hoặc trình duyệt đang bị cache, bạn thử xóa cache đi xem nhé.
Việc Check index từ Ahref thì bạn phải chờ khi Ahref cập nhật chứ không phải đặt code lên là Ahref mất index luôn bạn ạ.
Thủ thuật này còn sử dụng được không mọi người? Hoặc mong mọi người có thể cho e 1 website đã chặn ahrefs thành công được không?
Anh vẫn dùng bình thường, em thử vào file log tìm xem còn Ahref bot nữa không là được.
Em đã thêm vào theme của website, nhưng em check lại bằng bot ahref sau đó thì tool vẫn ghi nhận key tiếp tục tăng và thêm traffic.
Không biết anh có thể cho em một website anh đã chặn để em dùng ahrefs check thử được không ạ ?
Có cách nào chặn link về trên Ahref ko vậy Ad, để đối thủ không xem được.
có cách nào chặn ko cho đối thủ phân tích đc link web của mình ko ah?
chứ chặn bot ahrefs mà khi check lại vẫn thấy -_-