Có thể bạn đã biết, dù cho nội dung của bạn có tốt và hữu ích đến đâu nếu không được Google index thì cơ hội xếp hạng của bạn là 0%. Yếu tố này thường được gọi là Accessibility – Khả năng thu thập dữ liệu; một trong những yếu tố quan trọng hàng đầu mà nhiều người mới làm SEO không để ý.
Tiếp nối chuỗi bài viết về Technical SEO; bài viết này sẽ mang đến cho bạn khái niệm cũng như một số cách kiểm tra khả năng thu thập dữ liệu từ Google trên website của bạn. Cùng tìm hiểu nhé.
Accessibility là mức độ khả dụng cho phép Google nói riêng và các công cụ tìm kiếm khác nói chung thu thập dữ liệu từ website của bạn. Nói đơn giản hơn, đây là yếu tố giúp xác định xem liệu những nội dung chất lượng của website của bạn có được Google tìm thấy hay không.
Trước khi bắt đầu một dự án SEO đây là yếu tố nên được kiểm tra đầu tiên vì để được xếp hạng hoặc được người dùng tìm thấy thì trước tiên website cần được xác nhận đang tồn tại trên internet.
3 nguyên nhân khiến website không được thu thập (index)
1. Website đã chặn việc lấy dữ liệu từ file Robots.txt
Một số website trong quá trình xây dựng thường cố tình chặn Google lấy dữ liệu. Điều này là cần thiết vì một khi nội dung được xếp hạng và đánh giá sẽ cần rất nhiều thời gian để Google đánh giá lại khi nội dung đã được cập nhật.
Tuy nhiên một số nhà quản trị website sau khi chỉnh sửa hoàn tất thì lại vô tình quên đi việc gỡ bỏ chặn việc thu thập dữ liệu khiến website bị Google bot bỏ qua trong quá trình thu thập dữ liệu.
2. Lỗi xảy ra trong quá trình thu thập
Lỗi này thường xảy ra khi đường dẫn đã bị thay đổi và chưa được điều hướng (404 Error) hoặc tình trạng server không ổn định (500 Error), có lỗi xảy ra trong quá trình vận hành khiến website không thể truy cập (Offline) từ đó không được Google thu thập nội dung.
Lỗi này còn xảy ra khi những bài viết nội dung trên trang không có sự liên hệ qua (Internal link) với những nội dung khác khiến việc tìm kiếm những bài viết này trở nên vô cùng khó khăn.
Đây là lỗi xảy ra khá thường xuyên và cần kiểm tra mỗi ngày trong Google Search Console hoặc bạn có thể sử dụng công cụ Screaming Frog để kiểm tra và điều chỉnh
Để hiểu hơn về vấn đề này bạn có thể tham khảo bài viết về Uptime Robot
3. Nội dung bị chặn thu thập trong trình quản lý (CMS)
Điều này xảy ra chủ yếu do sự chủ động từ phía người quản trị website. Lý do là để tránh việc những nội dung chỉ mang mục đích phục vụ người dùng và không cần thiết xếp hạng tìm kiếm như:
- Nội dung tìm kiếm trong Search bar
- Nội dung tìm lọc sản phẩm
- Thẻ tag (đôi khi)
- Những bài viết về sản phẩm giống nhau (chỉ khác nhau về màu sắc, kích thước,..)
- Trang đăng nhập, thông tin khách hàng
Người quản trị website có thể gắn thẻ noindex để ngăn chặn Google lấy những nội dung này
Tuy nhiên khi cài đặt chặn cho những trang này, người quản trị website có thể vô tình chặn luôn những nội dung liên quan khác. Điều này xảy ra thường xuyên hơn bạn nghĩ đấy.
2 cách kiểm tra nội dung đã được Google thu thập hay chưa
1. Sử dụng lệnh tìm kiếm site: “URL cần kiểm tra”
Nếu bạn chưa biết thì cú pháp Site: dùng để kiểm tra nội dung đã được Google thu thập. Thông thường chúng ta chỉ cần đặt tên domain sau Site: là đã có thể kiểm tra liệu rằng website của mình đã được index chưa.
Ví dụ:
site:https://www.toponseek.com/
Thế nhưng lệnh này còn giúp bạn có thể kiểm tra được một URL xác định bằng cách đặt URL cần kiểm tra giữa dấu ngoặc kép
Ví dụ
site:”https://www.toponseek.com/accessibility-guide”
2. Kiểm tra với chức năng URL Inspection trong Google Search Console
Nếu như cách số 1 thường dùng để kiểm tra tổng quan website khi cách này giúp bạn kiểm tra và khai báo những nội dung mới trực tiếp với Google. Bạn có thể làm theo những bước sau:
Bước 1: Truy cập vào màn hình chính của Google Search Console
Bước 2: Chọn URL Inspection
Bước 3: Dán URL cần kiểm tra vào thanh tìm kiếm
Bước 4: Khi kết quả trả về là “URL is on Google” > đã được thu thập
Nếu kết quả là “URL is not on Google: Indexing Error” > chọn Request Indexing để khai báo với Google
Tổng kết
Trên đây là một số thông tin cơ bản về yếu tố Accessibility trong khi tối ưu website. Mong rằng bạn đã có thể tự kiểm tra và khắc phục tình trạng website không được Google index.
Nếu tình trạng này vẫn xảy ra khi đã thực hiện toàn bộ những bước trên; hãy liên lạc trực tiếp với Hoc11.vn để nhận được sự tư vấn tận tình nhất.
Đừng quên chúng tôi vẫn liên tục cập nhật nội dung giúp bạn có thể tự tối ưu website của mình mỗi tuần; bookmark để không lỡ bất kỳ bài viết nào nhé.
Ngoài ra dịch vụ SEO của TOS đang có khuyến mãi tư vấn chiến lược hoàn toàn miễn phí đối với những khách hàng quan tâm.