Chromeの行動履歴等のデータをgoogle検索のインデックスや順位付けに使ってるんじゃないか、と私が思う2つの理由

最近は、RankBrainだの何だの、が騒がれてますね。検索順位を決定するアルゴリズムの重要な要素として、

と言われるくらい、RanBrainが重要な要素になっています。で、個人的にはRankBrainと同じくらい、ユーザーの行動履歴も重視されているんじゃないかと思っています。

いや、むしろRankBrainはこのユーザーの行動履歴を元に優劣をつけているんじゃないか、とも思っています。

じゃあ行動履歴って何か、っていうと

っていうような要素が考えられますね。上の2つなら、Google自身でカンタンに測定可能です。

下の3つについては、Analyticsを見てるんじゃないか、とかChromeのデータを使ってるんじゃないか、とかいろいろ言われています。

Analyticsについては、検索順位決定に使っていないってGoogleも発表していますが、Chromeについては特に公式の発表は無かった気がします。

前置きが長くなりましたが、ここから本題。私の推測では、chromeの行動履歴データは使っていると考えます。その根拠は２つ。

どこからもリンクされていないURLがなぜかインデックスされる

僕がサイト作る時、ある程度形が出来るまではテストサーバーにアップして作るんですね。で、「公開しよう」ってなった段階で、データをコピーして、本サーバーにアップします。

ここで初めてクロール依頼やらをするわけです。

でも、たまにテストサーバーがインデックスされちゃうことが有るんです。当然、どこからもリンクは貼ってないです。

制作時にに使っているブラウザはGoogle Chrome。このサイトの事をgoogleが知りえるのは、Chromeの履歴しかありえないわけです。（Analyticsも入れてるので、こっちの可能性もありますけど、googleが使ってないと公言してますので一応除外）

コレもすごく単純な理由なんですけど、Googleにとって、コンテンツの良し悪しは判断できないんですよ。いくらAIが発達して、機械学習だなんだって言っても、本質的にコンテンツの良し悪しはわからない。

「人間がどう評価するか」をシミュレートすることしか出来ないんですね。

「このコンテンツが良質かどうか」ではなく「人間がこのコンテンツを良いって言いそう」っていう位しかわからないんです。

じゃあ、人間が評価するコンテンツのシグナルをどこにみるかって言うと、それがやっぱり離脱率とか、滞在時間とか、回遊率とかになってくるわけですよね。そういうデータを取るのに一番適してるのは、ブラウザの履歴データじゃないですか。

そりゃ、アルゴリズムに使いますよ、って単純な話。

推測でしか無いですが。