BabyWolf - Nguyễn Vũ Tuấn Anh

Blog cá nhân chia sẻ về thiết kế web, SEO, Online Marketing, giải pháp web, cuộc sống và nhật ký của tôi.

10 cập nhật của Google trong trong tháng 11/2011

Trong tháng 11 vừa rồi, cụ thể là vào ngày 14/11/2011, Google thông báo trên blog của họ về việc 10 cập nhật thuật toán của mình cho bộ máy tìm kiếm. Đây có lẽ là những cập nhật quan trọng mà các webmasters cần quan tâm.

Sau đây là 10 vấn đề mà Google đã cập nhật trong tháng 11 qua:

  1. Cross-language information retrieval updates

  2. Snippets with more page content and less header/menu content

  3. Better page titles in search results by de-duplicating boilerplate anchors

  4. Length-based autocomplete predictions in Russian

  5. Extending application rich snippets

  6. Retiring a signal in Image search

  7. Fresher, more recent results

  8. Refining official page detection

  9. Improvements to date-restricted queries

  10. Prediction fix for IME queries



1. Cross-language information retrieval updates


For queries in languages where limited web content is available (Afrikaans, Malay, Slovak, Swahili, Hindi, Norwegian, Serbian, Catalan, Maltese, Macedonian, Albanian, Slovenian, Welsh, Icelandic), we will now translate relevant English web pages and display the translated titles directly below the English titles in the search results. This feature was available previously in Korean, but only at the bottom of the page. Clicking on the translated titles will take you to pages translated from English into the query language.

Đối với những truy vấn tìm kiếm ở các ngôn ngữ mà kết quả bị hạn chế, Google sẽ trả thêm những kết quả từ các website tiếng Anh nhưng sẽ được dịch sang ngôn ngữ của người dùng tìm kiếm. Cụ thể hơn là Google sẽ dịch tiêu đề và đặt bên dưới tiêu đề tiếng Anh gốc trên trang kết quả tìm kiếm. Cái này thì mình chưa thấy ở Việt Nam, nhưng theo thông tin trên thì với ngôn ngữ của Hàn Quốc có thể thấy được điều này. Các kết quả dạng này hiện nay chỉ xuất hiện ở dưới cùng của trang. Và khi bạn click vào tiêu đề được Google dịch thì Google sẽ dẫn bạn đến trang nội dung được dịch qua ngôn ngữ của bạn. Đại khái giống như hình thức bạn dùng Google Translate để dịch một trang web nào đó.

Qua việc cập nhật này, tôi nhận thấy rằng nếu nội dung website được viết bằng tiếng Anh thì sẽ có khả năng có impression cao hơn trong thời gian tới.

2. Snippets with more page content and less header/menu content


This change helps us choose more relevant text to use in snippets. As we improve our understanding of web page structure, we are now more likely to pick text from the actual page content, and less likely to use text that is part of a header or menu.

Đây cũng là một cải tiến đáng kể có thể giúp các website tăng được CTR hơn. Cụ thể là trước đây có một số website nếu như không có thẻ meta description thì Google sẽ lấy chữ trong website để đưa lên snippet của mình. Do đó bạn thường sẽ thấy website mình xuất hiện thông thường là các chữ nằm phía trên đầu website như header hay dãy menu... Với thuật toán cập nhật này thì Google sẽ bóc tách vào chính xác nội dung chính của website một khi Google bot hiểu được cấu trúc website của bạn.

Nếu bạn chú ý chút thì chắc có lẽ thời gian qua cũng thấy điều này. Tôi lấy một ví dụ khi tôi lấy bài thơ TRĂNG QUAN ẢI trên blog Thiên Sứ Lạc Việt. Nếu như bạn view source của trang này sẽ không thấy có thẻ Meta Description nhưng hình dưới đây khi tôi share trên Google+ cho thấy Google tự động lấy nội dung bắt đầu từ tiêu đề của bài thơ.

[caption id="attachment_2261" align="alignnone" width="550" caption="Hình minh họa Google lấy nội dung bắt đầu từ tiêu đề bài viết"]Google fetch actual content for snippets[/caption]

3. Better page titles in search results by de-duplicating boilerplate anchors


We look at a number of signals when generating a page’s title. One signal is the anchor text in links pointing to the page. We found that boilerplate links with duplicated anchor text are not as relevant, so we are putting less emphasis on these. The result is more relevant titles that are specific to the page’s content.

Google dựa vào một số tín hiệu để tạo ra tiêu đề cho trang web khi người dùng tìm kiếm trên Google. Một trong những tín hiệu đó chính là anchor text trỏ đến trang web đó. Và Google nhận thấy rằng có nhiều anchor text dạng này bị duplicate và không tương thích với trang web, vì vậy Google sẽ không xem đây là tiêu chí quan trọng nữa trong lần cập nhật này. Ở lần cập nhật này, Google sẽ quyết định tiêu đề xuất hiện trên trang kết quả tìm kiếm dựa vào yếu tố nội dung của trang đó nhiều hơn.

Cá nhân tôi thì điều này hợp lý hơn là việc xác định thông qua các anchor text. Bởi vì giả sử như đối thủ có một lượng backlinks khá mạnh và trỏ đến website của bạn bằng một anchor text không như bạn mong muốn thì cũng sẽ làm ảnh hưởng tới bạn trên kết quả tìm kiếm.

4. Length-based autocomplete predictions in Russian


This improvement reduces the number of long, sometimes arbitrary query predictions in Russian. We will not make predictions that are very long in comparison either to the partial query or to the other predictions for that partial query. This is already our practice in English.

Cái này là cập nhật cho tiếng Nga, chắc có lẽ các bạn cũng không cần phải quan tâm lắm. Đại ý là Google cập nhật lại việc xuất hiện nhiều kết quả dự đoán của Google trong truy vấn tìm kiếm, tức Google Suggestion.

5. Extending application rich snippets


We recently announced rich snippets for applications. This enables people who are searching for software applications to see details, like cost and user reviews, within their search results. This change extends the coverage of application rich snippets, so they will be available more often.

Cập nhật này có lẽ không quá quan trọng đối với những người làm SEO. Tóm lại Google cập nhật thêm một loại markup dành riêng cho các application. Trước đây Google đã có các loại markup khác và giờ thêm một phần nữa cho Application.
Rich snippets help users determine more quickly if a particular web page has the information they're interested in. We've previously introduced rich snippets for shopping, recipes, reviews,video, and events, and most recently music.


As the web evolves, we often revisit signals that we launched in the past that no longer appear to have a significant impact. In this case, we decided to retire a signal in Image Search related to images that had references from multiple documents on the web.

Thỉnh thoảng đối với những cập nhật mới, Google cũng xem lại những cập nhật thuật toán cũ để loại bỏ những cái đã lỗi thời. Trong trường hợp này Google loại bỏ tín hiệu liên quan đến việc tìm kiếm hình ảnh (Image Search) được sử dụng từ nhiều nguồn trên các website.

7. Fresher, more recent results


 
Fresher, more recent results: As we announced just over a week ago, we’ve made a significant improvement to how we rank fresh content. This change impacts roughly 35 percent of total searches (around 6-10% of search results to a noticeable degree) and better determines the appropriate level of freshness for a given query.

Cái này thì Google cũng đã có thông báo trước đó so với thông báo về 10 cập nhật của họ lần này. Đại loại là Google có những cập nhật để xếp hạng cho những nội dung mới và gần nhất. Thay đổi này tác động khoảng 35% cho tất cả tìm kiếm (và tác động khoảng 6-10% các kết quả tìm kiếm) để quyết định độ tương quan cho những nội dung mới đối với một truy vấn.

Cập nhật này có lẽ khiến cho các webmasters cần phải quan tâm hơn cho việc cập nhật nội dung website của mình một cách thường xuyên. Bạn vẫn có thể dễ dàng đạt được mục đích trên kết quả tìm kiếm bằng những nội dung mới mẻ và chất lượng so với các đối thủ lâu năm. Tất nhiên là nếu các đối thủ lâu năm của bạn mà họ vẫn thường xuyên cập nhật nội dung thì không phải là điều dễ dàng đối với bạn.

8. Refining official page detection


We try hard to give our users the most relevant and authoritative results. With this change, we adjusted how we attempt to determine which pages are official. This will tend to rank official websites even higher in our ranking.

Với việc cập nhật này Google sẽ xác định đâu là các offical website và ưu tiên thứ hạng hơn cho các website này. Tức là các nội dung từ website chính thống. Ví dụ như bạn có nhiều website lớn nhỏ cho tập đoàn và các chi nhánh thì website tổng sẽ được ưu tiên hơn.

9. Improvements to date-restricted queries


We changed how we handle result freshness for queries where a user has chosen a specific date range. This helps ensure that users get the results that are most relevant for the date range that they specify.

Cập nhật này Google thay đổi cơ chế cho việc tìm kiếm các nội dung mới đối với một khoảng thời gian nhằm mục đích đem lại kết quả tương thích hơn đối với khoảng thời gian nào đó tương ứng với truy vấn tìm kiếm.

10. Prediction fix for IME queries


This change improves how Autocomplete handles IME queries (queries which contain non-Latin characters). Autocomplete was previously storing the intermediate keystrokes needed to type each character, which would sometimes result in gibberish predictions for Hebrew, Russian and Arabic.

Cái này cũng liên quan đến cập nhật thứ 4 ở trên, Google cập nhật tính năng Autocomple khi người dùng tìm kiếm. Trước đây tính năng này ứng dụng dựa trên việc người dùng gõ bàn phím. Việc bắt trên từng phím được gõ có vẻ như không phù hợp đối với một số ngôn ngữ. Bởi vì có một số ngôn ngữ để ra được ký tự chính xác đôi khi bạn phải dùng kết hợp nhiều phím.