Nhìn chung Định nghĩa về Spider Google – Google Bot cũng đủ hiểu cách công cụ này của Google làm việc.
Tuy nhiên HOC11.VN vẫn tách hẳn ra một bài, một là để nói rõ hơn, hai là để … SEO :D. Ngắn thôi, bạn hãy đọc hết.
Seongon chia hoạt động của Spider Google thành 2 loại:
-
Spider Google hoạt động chủ động.
-
Spider Google hoạt động thụ động.
2 câu trên cũng là để SEO :p
1. Spider hoạt động chủ động:
– Thông thường, một cách không ồn ào, Spider Google di chuyển trong môi trường internet, bản chất Spider Google là phần mềm của Google nhưng hầu như tất cả chúng ta nghĩ về nó như một con robot. Việc di chuyển của Spider Google tuân theo một quy luật chung là link to link, tức là nó “bò” qua tất cả các link mà nó “thấy”.
– Trừ khi bạn biết sử dụng file robot.txt để “điều khiển” nó hoặc dùng thẻ nofollow để không cho nó lập chỉ mục một link nào đó. Kể cả trong trường hợp này, bạn vẫn không thể ngăn nó “bò lên” cái link đó mà chỉ có thể ngắn nó “ghi nhớ” link. Trong trường hợp bạn thực sự muốn google không index link đó, thì bạn phải sử dụng thẻ rel=”noindex”
Tóm tắt: Spider Google bò lên tất cả link nó thấy và ghi nhớ nội dung trang web để chuyển về trung tâm dữ liệu trừ khi bạn sử dụng thẻ nofollow hoặc noindex.
2. Spider hoạt động thụ động:
Bạn có thể “ra lệnh” cho Spider Google không?
Câu trả lời là: có, nhưng ở một mức độ hạn chế.
Hạn chế là bởi có cách để ra lệnh, nhưng spider có tuân theo 100% không thì không chắc, nhưng 90% thì có đấy.
– Mức độ ra lệnh nhẹ nhất là hãy có nhiều backlink. Spider đi theo link mà, phải có link của bạn “ở đâu đó” để nó trèo lên và mò về website của bạn chứ.
– Mức độ thứ 2 là thông báo cho Google biết về việc bạn có link mới ( nội dung mới ) bằng cách Ping tới Google
Ping, viết tắt của Packet Internet Grouper (Groper), là một công cụ cho mạng máy tính sử dụng trên các mạng TCP/IP (chẳng hạn như Internet) để kiểm tra xem có thể kết nối tới một máy chủ cụ thể nào đó hay không, và ước lượng khoảng thời gian trễ trọn vòng để gửi gói dữ liệu cũng như tỉ lệ các gói dữ liệu có thể bị mất giữa hai máy. Công cụ này thực hiện nhiệm vụ trên bằng cách gửi một số gói tin ICMP đến máy kia và lắng nghe trả lời.
Hiểu nôm na Ping tức là anh A đứng ở đâu này và hét lên “anh có nghe thấy tôi nói gì không”, anh B nghe thấy thì sẽ hét lại “có, tôi nghe thấy”. A chính là link mới của bạn, B chính là anh Google. Khi Ping, Google sẽ biết sự tồn tại của A, và sẽ lệnh cho 1 spider đến thu thập.
– Mức độ thứ 3: Google Webmaster Tools. Bạn cứ trở thành 1 con nhện và đi theo cái link trong 3 chữ Google Webmaster Tools là sẽ thấy nội dung :d.
– Mức độ cao nhất: Gõ cửa Google. Yêu cầu là bạn đã có tài khoản Goolge Webmaster Tools, sau đó … liên hệ với HOC11.VN để được biết. Đây là tuyệt chiêu nên HOC11.VN chỉ share với ai thực sự quan tâm. Đôi khi chỉ là 1 comment vu vơ cũng làm HOC11.VN thấy mình đang viết bài có ý nghĩa :p
Trong khi SEO, bạn cứ nghĩ tới Spider như một thực thể và hãy cố gắng tạo ra link một cách thông minh để “điều hướng Google Bot”. Nếu bạn điều hướng tốt thì chỉ mỗi việc này thôi đã giúp website của bạn có khối từ khóa page 1 google rồi.
Tips: Người ta khuyên trên 1 page chỉ nên có dưới 100 link để con spider này dễ leo trèo. Cái này HOC11.VN cũng không để ý lắm nhưng nếu bạn là người cẩn thận thì có thể chú ý vấn đề này.
Muốn biết rõ hơn cách “điều khiển” Spider thụ động, mời bạn xem thêm:
Thủ thuật giúp Index Google nhanh hơn
Giúp website mới index Google nhanh
*** Tìm hiểu thêm về dịch vụ SEO Topic tổng thể của HOC11.VN tại đây:
Cách thức hoạt động bằng tìm nạp của Spider Google – Kiến thức Seo cơ bản
Nguồn: https://seongon.com/seo/kien-thuc-seo/cach-thuc-hoat-dong-cua-spider.html