Google RankBrain: Mọi thứ bạn cần biết về thuật toán này

Google RankBrain là gì? Làm thế nào nó hoạt động? Bạn có thể tối ưu hóa cho nó không? Đây là tất tần tật mọi thứ bạn cần biết về thuật toán RankBrain của Google.

thuật toán Google RankBrain
Thuật toán Google RankBrain

Không quá khi nói rằng Google RankBrain là một cuộc cách mạng về cách xác định Google search result.

Năm 1996, ý tưởng về các liên kết như ranking signal đã cách mạng hóa tìm kiếm để trở thành Google PageRank.

Đó là lý do tại sao thị phần tìm kiếm trong thập kỷ qua trông như thế này:

thuật toán Google RankBrain

Rất nhiều sự thay đổi lớn và các thuật toán đã được giới thiệu kể từ đó. Tuy nhiên, tất cả được cho là không quan trọng bằng RankBrain.

Điều này không chỉ do tác động của nó đến kết quả (dù nó được cho là cũng thành công) mà nằm ý nghĩa của nó. Machine learning lần đầu tiên được đưa vào tìm kiếm.

Machine learning đã được sử dụng trong Google News trước đó. Tuy nhiên, RankBrain là hoàn toàn khác biệt so với những gì chúng tôi từng thấy.

Vì vậy, RankBrain rất quan trọng. Đó là một cuộc cách mạng. Đó là sự ra đời của machine learning trong tìm kiếm.

Nhưng …

RankBrain là gì?

RankBrain là hệ thống mà Google hiểu rõ hơn về mục đích người dùng của một query tìm kiếm. RankBrain được giới thiệu vào mùa xuân 2015, nhưng mãi đến 26/10/2015 mới được công bố.

Khi mới thành lập, RankBrain đã được áp dụng cho queries mà trước đây Google chưa từng gặp phải. Khi đó và bây giờ vẫn thế, chiếm khoảng 15% tổng số tìm kiếm. RankBrain được mở rộng từ đó để tác động đến tất cả các kết quả tìm kiếm.

Cơ bản, RankBrain là một hệ thống machine learning dựa trên Hummingbird. RankBrain đã đưa Google từ môi trường “strings” sang môi trường “things”.

Có nghĩa là, nó đã lấy từ “đọc” các ký tự nghĩa đen. Và thay vào đó “nhìn thấy” entities mà chúng đại diện.

Sơ lược về entities & things thông qua strings

Để minh họa cho sự tiến bộ quan trọng này và vai trò của nó trong RankBrain, chúng ta chỉ cần xem xét các ký tự tạo nên tên tuổi của một người đồng cấp và bạn bè của tôi:

“jason barnard”

Đến khi Hummingbird, Google thấy những ký tự đó và bộ sưu tập gồm 2 từ và 13 ký tự. Tất cả được sắp xếp theo thứ tự đó và được sử dụng trên một trang đủ thường xuyên, thì sẽ làm cho nó có liên quan đến chuỗi tìm kiếm “jason barnard”.

Nó có thể là bất kỳ Jason nào, điều đó không quan trọng.

Họ dựa vào các liên kết và một vài tín hiệu khác, để làm nổi bật cái “có liên quan” nhất. Mà không hiểu Jason là ai hay cái gì.

Với Hummingbird, “Jason Barnard” không còn là một tập hợp các ký tự đơn thuần nữa. Mà đã trở thành một entity:

/ g / 11cm_q3wqr

Machine ID của anh chàng này là gì:

thuật toán Google RankBrain

ID Machine trong trường hợp này là một chuỗi chữ và số mà Google gán cho một entity.

Nói tóm lại, những gì đã xảy ra với Hummingbird là cần thiết để RankBrain hoạt động. Nó đã khiến Google hiểu rằng:

“Jason Barnard là bạn của Dave Davies. Ông là người thích áo sơ mi đỏ và là một nhà tiếp thị kỹ thuật số.”

Chỉ đơn giản là giải thích nó như một chuỗi các ký tự được sắp xếp và cân nhắc dựa trên queries.

Mặc dù rất nâng cao, nhưng về cơ bản vẫn không thể trả lời câu hỏi:

Bao nhiêu lần “jason barnard” xuất hiện trong văn bản và trong các liên kết đến văn bản đó?

Giả sử queries lại là “jason barnard”, với Hummingbird, câu đó sẽ giống với Google hơn. VD như:

thuật toán Google RankBrain

Mỗi entity chính được đại diện bởi một ID Machine.

Mỗi ID này là duy nhất – và không có hai entities nào có cùng một ID.

Tôi cố tình thêm tên mình vào câu dưới để minh họa rằng nó không phải lúc nào cũng hoàn hảo.

Tên của tôi rất phổ biến, và có nhiều tên “dave davies” nổi bật hơn tôi.

Do Jason có lai lịch về âm nhạc, Google có thể giả định rằng không cần thêm bối cảnh:

_ Dave Davies mà Jason kết bạn là Dave Davies (/ m / 01pwfk) từ The Kinks (/ m / 08w4pm).

Google sẽ làm rõ thông qua các entities khác trên trang và các kết nối khác trên web. Nhưng đó lại là một câu chuyện khác.

Điều quan trọng cần biết trong bối cảnh của RankBrain, đó là với Hummingbird, Google (/ m / 045c7b) giờ đã hiểu thế giới là một tập hợp things chứ không phải strings.

Trở lại RankBrain

Với chút kinh nghiệm về các entities, chúng tôi có thể trở lại RankBrain.

Về cơ bản, RankBrain có thể được coi là một hệ thống sàng lọc trước.

Khi một query được nhập vào Google, thuật toán tìm kiếm sẽ đối sánh query theo mục đích của bạn nhằm hiển thị nội dung tốt nhất, ở (các) định dạng tốt nhất.

Nhưng nếu Google không biết mục đích của bạn thì sao?

Tại sao Google lại giới thiệu thuật toán RankBrain?

RankBrain ban đầu được triển khai để đáp ứng một vấn đề tuy đơn giản nhưng khá lớn.

Google đã không thấy 15% query được sử dụng và do đó không gắn ngữ cảnh cho chúng hay là phân tích quá khứ, nhằm xác định liệu kết quả có tốt hay không để đáp ứng mục đích người dùng.

Nhập RankBrain.

Hệ thống này sẽ xem xét things thay vì strings.

RankBrain cũng sẽ xem xét các bối cảnh môi trường (ví dụ: vị trí của người tìm kiếm). Ngoài ra, có thể dự đoán ý nghĩa nơi đã được thực hiện.

Đây có lẽ là một quá trình đơn giản để hiểu rằng thứ tự từ có thể là một chức năng của quá trình tìm kiếm, chứ không phải mục đích.

Ai trong số chúng ta đã không tinh chỉnh một query bằng cách chỉ chọn một hoặc hai từ.

Trước khi tôi nhập nó, Google chắc chắn đã thấy:

“pizza victoria bc”

Nhưng khi tôi không nhận lại được kết quả mà tôi muốn, tôi bắt đầu thêm vào các cụm từ. Kết quả cho ra dẫn đến một query giống như:

“Pizza victoria bc rau củ mỏng”

Có thể Google không nhìn thấy query đó, nhưng vì họ xem xét things chứ không phải strings. Họ biết rằng query sẽ tương tự. Nếu không giống nhau:

“pizza chay victoria bc vỏ mỏng”

“pizza vỏ mỏng gần tôi”

Hoặc dùng giọng nói:

“OK Google, tôi có thể mua bánh pizza chay vỏ mỏng ở đâu?”

Thuật toán Google RankBrain hoạt động như thế nào?

Không có gì ngạc nhiên khi Google chưa bao giờ chỉ ra cách hoạt động cụ thể của RankBrain.

Tuy nhiên, chúng ta có thể đưa ra một số phỏng đoán về những gì đang diễn ra ở đằng sau.

Chức năng tìm kiếm mới

Ngừng suy nghĩ theo những điều chúng ta hiểu, và bắt đầu suy nghĩ như một cái máy.

Thứ mà tôi có thể thấy:

“pizza victoria bc”

Google thấy:

/ m / 0663v / m / 07ypt

Điều này thay đổi đáng kể mọi thứ. “victoria bc” không phải là hai thứ, mà là một.

Khi so sánh các vị trí khác cho:

“pizza” “vị trí”

Họ có thể dự đoán rằng:

/ m / 0663v / m / 07ypt (pizza victoria bc)

có thể giống như:

/ m / 07ypt / m / 0663v (pizza victoria bc)

Bởi vì họ biết bản chất cách mà các entities hoạt động, họ có thể hiểu kỹ queries và đi sâu vào ý nghĩa của nó.

Các entities chung

Một trong những cơ chế chính mà họ sẽ sử dụng là nhận dạng entity.

Nếu họ hiểu rằng một query chứa các entities giống như một entity khác mà họ đã thấy trước đây, với rất ít các từ hạn định (chẳng hạn như thay đổi từ “ở đâu” thành “khi nào” trong queries về một buổi hòa nhạc). Đó là dấu hiệu các tập hợp kết quả giống nhau, rất giống nhau hoặc được lấy từ cùng một danh sách các URL.

Top 10

Trong bằng sáng chế 2013 “Trả lời câu hỏi bằng cách sử dụng tham chiếu entity trong unstructured data”, Google mô tả một phương pháp mà họ sẽ:

  • Gửi các entities vào index của riêng chúng.
  • Xem xét các entities trong top 10.
  • Các entities khác nhau được mong đợi, có liên quan với nhau và là câu trả lời hàng đầu cho các queries.

Ví dụ: nếu Google thấy ID của Jason và ID của tôi thường đồng thời xảy ra. Họ sẽ có thể kết nối cả hai.

Nếu đó là Jason và anh chàng khó chịu của Kink tiếp tục xếp hạng cho tên tôi … thì họ sẽ kết luận rằng đó là Dave Davies.

Tương tự, nếu họ thấy các trang xếp hạng cho tên của Jason cũng có một nhóm entities chung. Họ cho rằng dữ liệu đầy đủ về Jason bao gồm thông tin đó và bỏ qua những trang không có thông tin cho query đó.

Giám sát

Hãy nhớ rằng đây là một hệ thống máy học.

Vốn có trong đó là chức năng xác định, kiểm tra, theo dõi và điều chỉnh.

Về cơ bản, hệ thống sẽ xem xét các queries có lưu ý đến (các) chỉ số thành công.

Sau đó, nó sẽ điều chỉnh cách trọng số của các tín hiệu khác nhau và những tín hiệu mà nó ưa thích. Theo dõi xem có thành công hay không.

Điều này sẽ không được thực hiện trên cơ sở từng query.

Hệ thống này ra mắt để giải quyết vấn đề về các queries mà Google chưa từng gặp phải trước đây. Thường sẽ có những từ không hoặc khối lượng thấp các từ mà không thể tự theo dõi được.

Thay vào đó, hệ thống sẽ tìm kiếm các mẫu như:

[mặt hàng thực phẩm] [địa điểm] [từ hạn định]

và sau đó tạo các bộ quy tắc chi phối tất cả các queries như vậy.

Vì vậy, nếu nó phát hiện ra rằng trọng số của các tín hiệu hoạt động cho một query như:

pizza victoria bc chay

Nó sử dụng điều đó để hỗ trợ hoặc tăng cường những gì nó làm với một query như:

tacos Seattle wa gà

Đáng chú ý, hệ thống sẽ không chỉ xem xét các entities trong query, mà còn xem xét các entities liên quan đến việc tạo ra nó. Điều đó bao gồm bạn, vị trí của bạn, thiết bị của bạn, v.v.

Đây là tất cả các biến mà RankBrain sẽ xem xét như cách bạn xem xét phân tích của mình. So sánh máy tính để bàn với lưu lượng truy cập trên thiết bị di động. Xem xét giờ trong ngày hoặc các loại thiết bị để hiểu cách những người dùng khác nhau tương tác với doanh nghiệp của bạn trong các tình huống. khác nhau

Có thể là về các thứ khác…

Những người ở Google rất thông minh.

Nếu một trong những kỹ sư chịu trách nhiệm duy trì RankBrain đọc bài báo này, họ sẽ chỉ mỉm cười và nghĩ, “Ồ… điều đó thật dễ thương làm sao? Một SEO nhỏ bé nghĩ rằng họ biết những gì đang diễn ra sau bức màn… một lần nữa. ”

Họ có hàng tá cơ chế đi vào thuật toán Google RankBrain và các cỗ máy có thể đã tạo ra nhiều cơ chế hơn của riêng chúng.

Điều chúng tôi muốn ghi nhớ là mục đích.

Mục đích là để hiểu các queries.

Các biến số mà chúng ta cần phải đối mặt là các queries, tín hiệu và những gì máy móc tạo nên chúng.

Triển khai RankBrain Giống Như Pizza Dough ở Victoria…

Vì vậy, RankBrain được phát triển để giải quyết các queries mà Google chưa từng thấy trước đây.

Nhưng điều đó đã thay đổi ở đâu đó giữa mùa xuân 2015 và 2016.

Có vẻ như những người ở Google một lần nữa không cho chúng tôi biết, vì nó đã được đưa vào một bài báo với Wired ở hiện tại.

“Thuật toán Google Rankbrain tham gia vào mọi queries.”

Một lần nữa, có vẻ như Google đã triển khai nó mà không nói với ai.

Vào thời điểm đó, nó được coi là hiệu quả cao và được gắn nhãn là tín hiệu xếp hạng quan trọng thứ ba.

Đó có thể là cách chúng ta nghĩ sai về RankBrain, nhưng đừng lo lắng về ngữ nghĩa.

Thay vào đó, biết tầm quan trọng của nó, hãy tập trung vào…

Làm thế nào tối ưu hóa thuật toán Google RankBrain?

Về cơ bản, bạn không tối ưu hóa cho RankBrain.

Nhưng đó là một câu trả lời hơi khó.

Hãy cố gắng làm tốt hơn nữa.

Gary Illyes của Google đã tuyên bố tại SMX rằng bạn không thể tối ưu hóa nó vào năm 2016:

Và sau này, về cơ bản nói rằng nó chỉ tối ưu hóa cho người dùng:

Nhưng với tôi, đó là một tuyên bố của Googley.

Lời khuyên của tôi dành cho những người muốn tối ưu hóa cho RankBrain hoặc chọn từ tốt hơn. Hãy tối ưu hóa trang web của họ và xem xét RankBrain và các hệ thống tương tự?

Đừng tìm kiếm thủ thuật.

Tìm kiếm chức năng.

Một công cụ miễn phí thú vị để sử dụng trong tác vụ này là Natural Language API Demo của Google .

Giả sử chúng tôi muốn hiểu cách Google xem bài viết mà tôi đã liên kết ở trên về các entities.

Còn cách nào tốt hơn là vào nguồn – Google.

Chúng tôi có thể sao chép văn bản của bài báo, dán nó vào bản demo NLP của họ.

Chúng tôi được cung cấp phân tích của họ về những entities nào xuất hiện trên trang cùng với phân tích cảm xúc và cú pháp.

Bạn sẽ nhận thấy rằng các mũi tên cú pháp di chuyển cả về phía trước và phía sau.

Bạn có thể cảm ơn BERT vì điều đó có liên quan, không phải RankBrain.

Đây là những gì nó trông như:

Nếu bạn cuộn xuống danh sách Entities, Google trình bày cho bạn bảng phân tích đầy đủ về các loại entites trên trang.

Những thứ này không hoàn hảo và hoạt động như một entity mặc định để đào tạo – không phải là danh sách đầy đủ về cách Google nhìn nhận thế giới.

Nhưng nó cung cấp một sự hiểu biết trực quan, tốt đẹp về content của bạn.

Một công cụ miễn phí khác mà tôi thích cho việc này là Google Knowledge Graph API , nhưng kết quả cho ra không đẹp lắm.

May mắn thay, chính người bạn mà tôi đã đề cập trong ví dụ trên đã tận dụng Knowledge Graph Explorer miễn phí của anh ấy.

Với Knowledge Graph Explorer, bạn có thể kiểm tra theo cách thủ công và xem những gì Google đang thấy về một entity trong thời gian thực.

Nó không cân nhắc mối quan hệ giữa các entities khác trên trang. Google thực sự sẽ tự tin rằng họ có đúng entity, nhưng điều đó khá sáng tỏ.

Với hai công cụ này, bạn có thể khám phá cách Google nhìn nhận các trang web xếp hạng hàng đầu cho các queries khác nhau, entites nào trên các trang, cho dù họ là người, địa điểm hay sự vật, v.v. Hiểu thực sự về cách Google hiểu được một trang từ góc nhìn của Hummingbird.

Từ đó, chúng tôi chỉ cần họ xem xét các biến mà chúng tôi không thể kiểm soát hoặc nhìn thấy, chẳng hạn như vị trí người dùng, thiết bị, v.v.

Vì vậy, có, hãy xem xét người dùng – Google ở ​​ngay đó.

Vì vậy, để “tối ưu hóa cho thuật toán Google RankBrain”:

  • Xem lại các entites với API NLP.
  • Đi sâu hơn vào thực thể của Knowledge Graph Explorer.
  • Lấy tất cả những điều này và đặt vào ngữ cảnh của bạn (thiết bị và vị trí bạn có).
  • Chạy một số bài kiểm tra từ các vị trí và thiết bị khác bằng cách sử dụng một công cụ như Mobile Moxie để so sánh kết quả và hiểu mọi thứ lệch như thế nào.
  • Bắt đầu tối ưu hóa cho RankBrain.

Google sẽ cho bạn biết rằng tối ưu hóa cho RankBrain là tối ưu hóa cho người dùng.

Khá dễ dàng để biết đó là gợi ý của họ và nó không phải là một gợi ý tồi.

Nhưng chúng tôi biết nó được xây dựng trên các entites.

Vậy tại sao không bổ sung kiến ​​thức đó vào nỗ lực của bạn?

Biết được cách Google hiểu mục đích người dùng thì bạn sẽ có thể tự làm điều đó.

Tại sao thuật toán RankBrain lại quan trọng?

RankBrain quan trọng không chỉ vì nó là gì, mà nó có ý nghĩa gì.

Đây là lần đầu tiên việc đẩy mạnh machine learning được áp dụng cho các kết quả tìm kiếm Google. Nó vẫn chưa là cái cuối cùng.

Trên thực tế, kể từ năm 2018, John Mueller đã lưu ý:

thuật toán Google RankBrain

Thuật toán Google RankBrain có còn là tín hiệu quan trọng thứ ba không?

Không có khả năng. Nhưng tôi chưa bao giờ thực sự nghĩ về nó như một tín hiệu để bắt đầu.

Tôi luôn nghĩ về nó như một hệ thống điều hòa trước – một hệ thống không tạo ra kết quả, mà là đánh giá loại và ý nghĩa của một query và trọng số của các tín hiệu được áp dụng cho loại và ý nghĩa đó.

Về cơ bản, giống như một bộ lọc hơn là một tín hiệu.

Nhưng một lần nữa, đó là ngữ nghĩa.

Tuy nhiên, hãy nghĩ về nó để tìm cách làm việc hiệu quả nhất đối với bạn.

Thuật toán Google RankBrain có thể đã 5 năm tuổi, nhưng ý nghĩa và tác động của nó chỉ mới phát triển.

Chắc chắn, trong Google, họ sẽ gọi các yếu tố và phần nhánh của nó là những thứ khác nhau. Nhưng những gì RankBrain đã làm lúc ban đầu cho tới ngày nay là rất nhiều.

Nếu tôi có thể dự đoán tương lai, tôi nghĩ rằng một số biến thể trong tương lai của nó sẽ thay thế PageRank.

Tất nhiên, các entites có thể kết nối thông qua các liên kết.

Vì vậy, đó là sự tiếp nối của PageRank hơn là sự thay thế.

Nhưng một lần nữa, không cần phải lo lắng về ngữ nghĩa.

Nguồn: https://www.searchenginejournal.com/google-algorithm-history/rankbrain/#close

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *