Trên đường đua khốc liệt cho vị trí top đầu của các công cụ tìm kiếm, tối ưu hóa SEO là việc không thể bỏ qua. Và đi theo nó sẽ là các công cụ bổ trợ và những giải pháp đặc thù, một mảng rất rộng những thuật ngữ mà mọi Marketer buộc phải nằm lòng. Htaccess hay file .htaccess là một trong số đó. Bài viết này sẽ đề cập đến mọi khía cạnh của .htaccess để bạn có thể tùy chỉnh và đạt được những kết quả tốt nhất trong việc tối ưu hóa công cụ tìm kiếm. Không mất thời gian thêm nữa, bắt đầu nào.
Những điều cần biết về .htaccess trong SEO
Htaccess là gì?
Về mặt kỹ thuật, htaccess là một tập tin được sử dụng để cấu hình thư mục trong các website apache. Bạn có thể dễ dàng tạo một tệp mới và ghi đè các tham số từ tệp htaccess của mình nếu các web hosting không cho phép bạn chỉnh sửa. Ngoài ra, nếu bạn tạo một file htaccess trên thư mục gốc của web server, nó sẽ được áp dụng cho toàn bộ trang web của bạn.
Kiểm soát htaccess tốt hơn với Directives
Directives cho phép bạn kiểm soát htaccess chặt chẽ hơn trong việc định cấu hình bằng cách sử dụng các dẫn xuất ngắn. Với các dẫn xuất này, bạn có thể bảo vệ tệp bằng mật khẩu, kiểm soát thu thập thông tin, cho phép hoặc cấm các địa chỉ IP,…
Tại sao cần tối ưu hóa SEO trong các tệp .htaccess?
Dưới đây là những lợi ích mà htaccess đem lại cho SEO:
Trình thu thập thông tin của công cụ tìm kiếm sẽ tiếp cận cách .htaccess xử lý chức năng trang web. Nếu htaccess được vận hành đúng, điều này sẽ giúp cải thiện xếp hạng website.
Với .htaccess, bạn có thể tạo ra URL mà công cụ tìm kiếm yêu thích.
Htaccess cũng có thể giải quyết lỗi 404 HTTPS và xử lý điều hướng 301.
Nó cũng được dùng để chặn người dùng sử dụng địa chỉ IP hoặc domain khỏi các spy solution của công cụ tìm kiếm.
Backup trước khi chỉnh sửa .htaccess
Chỉnh sửa .htaccess là một đề xuất rất phức tạp. Mặc dù nó có thể giúp cải thiện website, tuy nhiên cũng sẽ dẫn đến việc gặp lỗi máy chủ nội bộ 500 và khiến trang web không hoạt động nếu làm sai.
Để tránh điều này, sao lưu hay Backup file .htaccess là giải pháp tốt nhất trước khi thực hiện bất kỳ thay đổi nào
Tìm file .htaccess ở đâu?
Vị trí của tệp .htaccess tùy thuộc vào nền tảng bạn đang sử dụng. Thường thì nó sẽ ở thư mục gốc. Ví dụ: nếu bạn đang sử dụng WordPress, bạn sẽ tìm thấy nó trong WordPress installation directory. Đối với các nền tảng sử dụng cPanel, bạn có thể truy cập File Manager và đi đến thư mục gốc. Sau đó bật “Show Hidden Files” để truy cập tệp .htaccess.
Friendly URLs trong SEO
URL đóng một vai trò rất quan trọng trong SEO. Theo Matt Cutts, các từ khóa xuất hiện trong URL cũng sẽ giúp tăng khả năng xếp hạng cao hơn. Đối với các chủ Blog, ông cũng đề xuất lưu ý về độ dài URL, nó phải ngắn gọn và clean, điều này sẽ giúp gợi ý cho các công cụ tìm kiếm rằng bạn đang quan tâm đến người đọc của mình.
Tối ưu hóa URL cho trang web
Bạn có thể tối ưu hóa tệp .htaccess để giải quyết vấn đề này bằng cách ghi đè các URL hiện tại bằng file extension và đảm bảo chúng được xử lý đúng cách. Để làm được điều đó, hãy sử dụng đoạn code sau trong tệp .htaccess của mình.
RewriteEngine On
Rewrite Rule ^topicname/ (a[a-zA-Z0-9]+)$ index.php?topic=$1
Nó sẽ chuyển đổi tất cả URL trang web của bạn thành như sau
www.yoursite.com/therulesyouchoosed/article.
Tối ưu CMS URLs
Nếu bạn đang sử dụng WordPress, Joomla hoặc bất kỳ CMS nào, việc tùy chỉnh các URL sẽ theo nhiều cách khác nhau. Bạn có thể thực hiện bằng cách thêm đoạn code sau vào tệp .htaccess.
RewriteEngine On
Rewrite Rule (.*)/$load_page.php?&page_id=$1
Sau khi file được cập nhật, các URL của bạn đã sẵn sàng để tối ưu hóa SEO một cách hiệu quả hơn.
Xóa .php và .html
Trên thực tế, các extension như .html và .php không có giá trị gì đối với người đọc, và nó cũng khiến họ khó ghi nhớ, do vậy bạn có thể cân nhắc việc xóa chúng đi.
Để xóa các extension, tất cả những gì bạn cần làm là sao chép đoạn mã dưới đây và đưa vào tệp .htaccess.
RewriteCond% {REQUEST_FILENAME}! -D
RewriteCond% {REQUEST_FILENAME} .php -f
RewriteCond% {REQUEST_FILENAME} .html -f
Viết lại Quy tắc ^ (. *) $ $ 1.html
Canonical robots.txt
Các file robot.txt nằm ở thư mục gốc, tuy nhiên các robot xấu hay những đoạn mã độc hại có thể quét toàn bộ trang web để tìm một tệp robot.txt và ăn hết tài nguyên trên website của bạn. Chắc chắn bạn sẽ không muốn nó xảy ra và điều này có thể được cải thiện với sự trợ giúp của canonical.
Giải pháp canonical
Bạn có thể hướng dẫn người dùng tìm tệp robot.txt. bằng cách sử dụng .htaccess để giải quyết vấn đề liên tục yêu cầu truy cập. Bằng cách này, bạn cũng đang cải thiện SEO website của mình bằng cách cung cấp cho người dùng những gì họ muốn, đồng thời giảm tải lên server. Đoạn mã bạn cần dùng như sau:
RewriteBase /
RewriteCond %{REQUEST_URI} !^/robots.txt$ [NC]
RewriteCond %{REQUEST_URI} robots.txt [NC]
RewriteRule .* http://yourmotocmswebsite.com/robots.txt [R=301,L]
Trong đoạn mã trên, tất cả những gì bạn cần làm là thay đổi “yourwebsite.com” thành URL trang web của bạn. URL phải là thư mục gốc website và bất kỳ ai cũng có thể truy cập được. Đoạn mã trên đã sử dụng rewrite module của Apache. Tuy nhiên, nếu bạn đang tìm kiếm một giải pháp thay thế gọn gàng hơn, có thể sử dụng mod_alias.
RedirectMatch 301 ^/(.*)/robots.txt http://yourmotocmswebsite.com/robots.txt
Non-www redirect
Một trong những vấn đề cơ bản nhất mà hầu hết trang web gặp phải là chuyển hướng không có www. Nếu bạn đang kiểm tra trang web của mình, bạn cũng nên quan tâm đến vấn đề non-www redirect. Tin tốt là Canonical tag có thể sửa chữa điều này và bên cạnh đó, nó cũng giúp khắc phục sự cố trùng lặp URL trên trang web của bạn và cải thiện cấu trúc URL tổng thể của website
sử dụng .htaccess redirect non-www sang www bằng một trong hai đoạn mã sau
RewriteEngine onRewriteCond %{HTTP_HOST}!^www.yourwebsite.comRewriteRule(.*) http://www.yourmotocmswebsite.com/$1 [R=301,L] |
RewriteEngine onRewriteCond %{HTTP_HOST} ^yourwebsite.com [NC]RewriteRule(.*) http://www.yourmotocmswebsite.com/$1 [R=301,L] |
Thay thế thuật ngữ “yourmotocmswebsite” bằng tên miền của mình.
Rel = ”canonical” cũng có thể được sử dụng để báo hiệu các canonical URLs và các tệp trong header tags cũng như PDFs hiệu quả hơn. Ví dụ: bạn có thể sử dụng canonical tags để trỏ các liên kết PDF sang HTML một cách đơn giản. Bằng cách này, người dùng không phải tải tệp xuống để kiểm tra. Tuy nhiên, để điều này xảy ra, bạn cần phải bật cả hai tùy chọn. Để kích hoạt, hãy sử dụng đoạn code bên dưới.
Header and Link “; rel=”canonical””
Redirect bằng cách sử dụng .htaccess cho SEO
Trong phần này, chúng ta sẽ xem xét các chuyển hướng bằng cách chỉnh sửa file .htaccess để tránh lỗi 301 và 404. Điều này sẽ giúp đảm bảo người dùng không truy cập vào một liên kết hỏng và tạo điều kiện để trang web có thể đáp ứng các tiêu chuẩn do thuật toán Google đặt ra.
Với tư cách là chủ website, bạn có thể tùy chỉnh 404 bad request hoặc chuyển hướng đến trang chủ. Điều này cho phép người dùng có thể tìm lại trang chứa nội dung mà họ cần. Nếu thao tác chính xác, htaccess sẽ giúp giảm tỷ lệ thoát và cải thiện hiệu suất SEO cho website của bạn.
Thực hiện chuyển hướng cho tất cả các lỗi bao gồm:
400: yêu cầu không hợp lệ | 403: nội dung bị cấm |
401: yêu cầu ủy quyền | 500: lỗi máy chủ |
Tất cả những gì bạn cần làm chỉ đơn giản là thay đổi mã lỗi và thay đổi trang chuyển hướng được liên kết với nó thông qua đoạn code sau
ErrorDocument 402 /temp/page-unavailable-temporarily402
Chặn bots xấu
Không phải tất cả các bot đều tốt. Chúng có thể muốn thu thập dữ liệu từ trang web của bạn mà không cung cấp bất kỳ giá trị nào. Đó là lý do tại sao bạn cần chặn những bots xấu này. Htaccess cho phép bạn viết các dẫn xuất có thể ngăn chặn bot bằng cách sử dụng đoạn mã sau.
RewriteCond%{HTTP_USER_AGENT} ^BOTNAME [OR]
RewriteCond%{HTTP_USER_AGENT} ^BOTNAME1 [OR]
RewriteCond%{HTTP_USER_AGENT} ^BOTNAME3
RewriteRule ^.*-[F,L]
Sửa lỗi 301 redirects and 404 errors
“404 not found” sẽ xảy ra ngay cả khi bạn bảo trì trang web của mình hàng ngày. Trong khi đó redirect 301 sẽ giúp loại bỏ lỗi 404 bằng cách chuyển hướng trang cũ sang trang mới. Điều này vô hình chung sẽ giải quyết hai vấn đề:
1. Chuyển hướng thành công các trang web liên kết với trang cũ của bạn.
2. Chuyển hướng 301 hoạt động cho tất cả các công cụ tìm kiếm bao gồm cả Google.
Để làm được điều này, bạn cần viết mã code sau vào htaccess của mình
Redirect 301/information/old-article
http://www.yourmotocmssite.com/articles/new-article
Chuyển hướng sang trang web mới nhất
Các công cụ tìm kiếm sẽ thu thập dữ liệu ở rất nhiều địa chỉ khác nhau trên trang chủ của bạn, việc index này được thực hiện hầu như mọi lúc. Tất nhiên bạn sẽ không bao giờ muốn khách hàng truy cập vào phiên bản cũ của trang web. Đó là lý do tại sao bạn cần đảm bảo thực hiện chuyển hướng đến trang web mới nhất. Và tất cả những gì bạn cần làm là sử dụng mã sau trong tệp .htaccess của mình.
RewriteCond %{HTTP_Host} ^yoursite.com$ [NC]
RewriteCond ^(.*)$ http://www.yourmotocmssite.com/$1[R+301,L]
RewriteCond %{THE_REQUEST} ^.*/index
Rewriter ^(.*)index$ http://www.site.com/$1 [R=301, L]
Lưu ý: Đừng quên thay thế “yourmotocmssite” thành tên miền của bạn.
Chuyển hướng Sitemaps
Sitemaps cũng sẽ không thể tránh khỏi các bot xấu và bạn cần phải đảm bảo rằng máy chủ của bạn có thể giúp crawler tìm thấy chúng. Điều này sẽ giúp bạn giải phóng tài nguyên hệ thống và cũng đảm bảo tiết kiệm băng thông. Để giải quyết vấn đề này, hãy thêm mã sau vào tệp .htaccess của mình.
RedirectMatch 301 /sitemap.xml$ http://yourmotocmssite.com/sitemap.xml
RedirectMatch 301 /sitemap.xml.gz$ http://yourmotocmssite.com/sitemap.xml.gz
Để sử dụng đoạn mã trên, bạn cần chỉnh sửa nó theo tên miền trang web và file paths bạn đang sử dụng. Dòng đầu tiên của mã được dùng để chuyển hướng yêu cầu đến một sitemaps thông thường không được nén. Và dòng mã thứ 2 sẽ chuyển hướng đến phiên bản nén của sitemaps.
Cải thiện .htaccess cho SEO với Site Speed Caching
Ai cũng yêu tốc độ, kể cả người dùng hay các công cụ tìm kiếm. Do đó, nếu như bạn muốn được xếp hạng cao hơn, website của bạn phải có tốc độ tải nhanh. Và sử dụng caching sẽ giúp cải thiện điều đó.
Caching là một phương pháp mà tài nguyên trang web được lưu trữ trong trình duyệt và nó sẽ không cần phải tải xuống khi người dùng yêu cầu. Bằng cách kích hoạt bộ nhớ đệm, bạn không chỉ có thể tăng tốc cho trang web của mình mà còn tiết kiệm thời gian xử lý của máy chủ.
Để kích hoạt bộ nhớ đệm, chúng ta sẽ sử dụng mod_headers và mod_expires.
ExpiresActive In
ExpiresDefault A259200
Đoạn mã trên sẽ giúp bạn đặt thời gian hết hạn cho nội dung và nó tính bằng giây.
Robot Directives
Trang web của bạn có thể chứa các trang hoặc bài đăng mà bạn không muốn chia sẻ với người dùng hay thậm chí với công cụ tìm kiếm. Trong trường hợp này, bạn có thể muốn hạn chế quyền truy cập vào các tệp đó. Bạn có thể làm điều đó thông qua chỉnh sửa .htaccess.
Header (“X-Robots-Tag: no index”, true);
Đoạn mã trên chỉ đơn giản là ẩn các tệp PHP do bạn tạo. Bạn cũng có thể định cấu hình máy chủ web bằng cách sử dụng mã sau:
Header set X-Robots-Tag “no index”
Bạn cũng có thể đặt các trang thành “no follow” nếu bạn muốn các trang đó không bị các công cụ tìm kiếm theo dõi.
Header (“X-Robots-Tag: no index, no follow”, true);
Chuyển hướng nguồn cấp dữ liệu sang FeedBurner
Chuyển hướng nguồn cấp dữ liệu đến Feedburner có thể giúp bạn tăng cường SEO trang web của mình. Bạn có thể tự động hóa toàn bộ quá trình nhờ vào .htaccess.
# Feedburner redirection
RewriteCond %{REQUEST_URI} ^/feed/ [NC]
RewriteCond %{HTTP_USER_AGENT} !(FeedBurner|FeedValidator) [NC]
RewriteRule .* http://feeds.feedburner.com/mainContentFeed [L,R=302]
RewriteCond %{REQUEST_URI} ^/comments/feed/ [NC]
RewriteCond %{HTTP_USER_AGENT} !(FeedBurner|FeedValidator) [NC]
RewriteRule .* http://feeds.feedburner.com/allCommentsFeed [L,R=302]
Đối với các mã trên, bạn cần phải thay thế allCommentsFeed và mainContentFeed với giá trị FeedBurner của mình
Mobile serving có thể được cải thiện bằng cách sử dụng Vary Header. Nó chỉ đơn giản là nói với Google rằng bạn có một trang khác để phục vụ người dùng di động. Từ đó, Google sẽ xác định các trang một cách chính xác và thu thập dữ liệu phù hợp hơn. Điều này sẽ cải thiện trải nghiệm người dùng, tác động đến thứ hạng SEO của trang web.
Để kích hoạt tính năng này, tất cả những gì bạn cần làm là sao chép đoạn mã sau vào trong file .htaccess của mình.
Header append Vary User-Agent
Ngăn việc ăn cấp hình ảnh
Bạn cũng có thể định cấu hình .htaccess để ngăn các trang lấy hình ảnh từ website của bạn. Điều này sẽ giúp bạn cải thiện việc sử dụng băng thông máy chủ và nâng cao hiệu suất của nó. Để làm được như vậy, bạn cần sử dụng mã được đề cập bên dưới.
OnRewriteCond% {HTTP_REFERER}! ^ Http: //www.yourmotocmssite.com [NC]
RewriteCond% {HTTP_REFERER}! ^ Http: //yourmotocmssite.com [NC]
RewriteRule [^ /] +. (Gifljpg) – [F]
Htaccess có thể giúp bạn cải thiện SEO trang web của bạn theo nhiều cách. Trong bài viết hôm nay, chúng ta đã xem xét rất nhiều phương pháp như chuyển hướng, bộ nhớ đệm, canonical và SEO-friendly URLs. Htaccess có thể giải quyết lỗi hình ảnh, redirection, lỗi HTTP,…tất cả những vấn đề này đều ảnh hưởng đến trải nghiệm người dùng và liên quan trực tiếp đến SEO. Do đó, bạn nên thiết lập .htaccess của mình càng sớm càng tốt.
Kết luận
Chúng ta đã đi qua rất nhiều nội dung về Htaccess từ khái niệm, công dụng và quan trọng hơn hết là những giải pháp nó mang lại để hỗ trợ cho các ý định SEO. Rất hy vọng những thông tin này đem đến cho bạn những bài học bổ ích. Bạn có thể ghé thăm trang web chính thức của Hoc11.vn để đón đọc thêm nhiều bài viết hay về Digital Marketing hoặc đăng ký tư vấn và trải nghiệm dịch vụ SEO chuyên nghiệp từ chúng tôi để có những giải pháp tối ưu trong việc phát triển website và thu về lượng truy cập vượt trội.
Nguồn: https://www.motocms.com/blog/en/htacess-for-seo/