產業快訊 News
Google首次公開Quality rating guidelines
我們之前談過許多關於Google Quality Rater的事情,但是大多的品質規範都來自於非Google的管道,但是現在很奇妙的是,Google自己把Quality rating guidelines公開了,我們來看看Google公開的內容當中,有何特別的說法吧 ...
這篇"Google Gutted Its Search Quality Rating Guidelines For Public Release"說到了,Google公開的品質規範共有43頁,之前的版本有125頁以及161頁。這三種版本的內容其實差異不大,我們把其中比較重要的說法,拿出來討論一下。
最新的版本中,Google加上了序言,全文內容如下:
Google relies on raters, working in countries and languages around the world, to help us measure the quality of our search results, ranking, and search experience.
Google依靠遍及全球不同國家、語言的品質評估者,幫助我們評量我們搜尋結果的品質、排名、以及搜尋經驗。
These raters perform a variety of different kinds of ‘rating tasks’ designed to give us information about the quality of different kinds of results in response to different kinds of queries.
這些品質評估者進行各種不同的評估任務,這些任務是設計來提供我們訊息關於各種不同搜尋結果的品質情況。
The data they generate is rolled up statistically to give us within the Google search team a view of the quality of our search results and search experience over time, as well as an ability to measure the effect of proposed changes to Google’s search algorithms.
這些品質評估者產生的資料,會以統計的方式讓搜尋小組瞭解搜尋結果的品質與搜尋經驗,同時也讓他們瞭解搜尋演算法改變的結果。
Raters’ judgments do not directly impact Google’s search result rankings.
品質評估者的判斷並不會直接影響Google的搜尋排名。
While a rater may give a particular URL a score, that score does not directly increase or decrease a given website’s ranking.
當品質評估者給了某個URL一個分數,這個分數並不會直接給這個網站而影響他的排名。
Instead these scores are used in aggregate to evaluate search quality and make decisions about changes.
而是這些分數使用來讓我們評估搜尋品質,以便決定是否做些給變。
This document is a ‘Cliff’s Notes’ version of our search quality rating guidelines. By this, we mean that it is not the entire version that raters use on a daily basis; however, it is a summary of the important topics.
這份文件只是我們搜尋品質評估的指南導覽版本,這份文件並不是品質評估的完整內容,但是說明了一些重要的主題。
還有另外一個觀點,也蠻值得拿出來討論的是:
Please note that not all pages with copied content are considered “low quality”.
請注意的是,並不是抄襲的內容就一定是低品質的內容。
The website www.answers.com contains content copied from Wikipedia.org and other dictionary and encyclopedia sites, but is not considered to be a low quality site because the content is well-organized and intended to be helpful for users.
例如,answers.com這個網站雖然許多內容來自於Wikipedia以及許多百科內容網站,但是因為這些內容是有組織並且對於使用者是有幫助的,所以他並不是低品質網站。
Similarly, there are pages on medical information sites that contain copied content. If the page is well-organized and appears to be designed to be helpful for users and not just to display ads for users to click on, it should be rated based on how helpful the content would be for users.
類似的例子,如果有醫學資訊網站裡面有抄襲的內容,假如這些內容是組織良好並且對於使用者有幫助,而不是只為了賺取廣告點選費用的話,他應該依照內容對於使用者的有用程度來進行評估。
總結來說,以上的內容有三大重點:
(1) Google終於承認了Quality rating guidelines。
(2) 品質評估者的判斷並不會直接影響Google的搜尋排名。
(3) 並不是抄襲的內容就一定是低品質的內容。
以往大家都在猜測,到底真人在評估是否為真? 果然是事實,也告訴我們: 不要以為Google演算法找不到你的違規事項,因為有許多評估者眼睜睜在瀏覽你的網頁。
並且雖然評估分數不會直接影響搜尋排名,但是我們在"Google Quality Rater的評估結果會影響搜尋排名嗎?"說過,評估分數會影響演算法更正的決定,你的違規事項會變成pattern (樣板),演算法會去抓違規,演算法會修正直到有效取締違法事項為止,所以如果你的違規被評估者紀錄,處罰是遲早的事情。
最後也是很重要的,是對於抄襲內容的看法,Google最終目的不是抄襲於否,而是對於使用者有沒有幫助,如"16 Insights into Google's Rating Guidelines"所說的,相關性跟垃圾內容是獨立的,也就是網站可能一大堆違規項目,但是就是跟使用者的搜尋相關,還是可能有優秀的搜尋排名。
這點可能會開始鼓舞許多文抄公,但是要能夠真正well-organized,其實並不比產生原創內容簡單,要能夠做到Content Curation,也是需要很多時間的。
新聞來源 : DNS台灣研究院