Chromeの行動履歴等のデータをgoogle検索のインデックスや順位付けに使ってるんじゃないか、と私が思う2つの理由
最近は、RankBrainだの何だの、が騒がれてますね。 検索順位を決定するアルゴリズムの重要な要素として、
- リンク
- コンテンツ
- Rank Brain
と言われるくらい、RanBrainが重要な要素になっています。 で、個人的にはRankBrainと同じくらい、ユーザーの行動履歴も重視されているんじゃないかと思っています。
いや、むしろRankBrainはこのユーザーの行動履歴を元に優劣をつけているんじゃないか、とも思っています。
じゃあ行動履歴って何か、っていうと
- 検索画面でのクリック率
- 索画面での直帰率
- サイト上の滞在時間
- ペジ回遊率
- 離脱率
っていうような要素が考えられますね。 上の2つなら、Google自身でカンタンに測定可能です。
下の3つについては、Analyticsを見てるんじゃないか、とかChromeのデータを使ってるんじゃないか、とかいろいろ言われています。
Analyticsについては、検索順位決定に使っていないってGoogleも発表していますが、Chromeについては特に公式の発表は無かった気がします。
前置きが長くなりましたが、ここから本題。 私の推測では、chromeの行動履歴データは使っていると考えます。 その根拠は2つ。
- どこからもリンクされていないURLが何故かインデックスされる
- 私がgoogleだったら絶対に使うから
どこからもリンクされていないURLがなぜかインデックスされる
僕がサイト作る時、ある程度形が出来るまではテストサーバーにアップして作るんですね。 で、「公開しよう」ってなった段階で、データをコピーして、本サーバーにアップします。
ここで初めてクロール依頼やらをするわけです。
でも、たまにテストサーバーがインデックスされちゃうことが有るんです。 当然、どこからもリンクは貼ってないです。
制作時にに使っているブラウザはGoogle Chrome。 このサイトの事をgoogleが知りえるのは、Chromeの履歴しかありえないわけです。 (Analyticsも入れてるので、こっちの可能性もありますけど、googleが使ってないと公言してますので一応除外)
私がgoogleだったら絶対使うから
コレもすごく単純な理由なんですけど、Googleにとって、コンテンツの良し悪しは判断できないんですよ。 いくらAIが発達して、機械学習だなんだって言っても、本質的にコンテンツの良し悪しはわからない。
「人間がどう評価するか」をシミュレートすることしか出来ないんですね。
「このコンテンツが良質かどうか」ではなく「人間がこのコンテンツを良いって言いそう」っていう位しかわからないんです。
じゃあ、人間が評価するコンテンツのシグナルをどこにみるかって言うと、それがやっぱり離脱率とか、滞在時間とか、回遊率とかになってくるわけですよね。 そういうデータを取るのに一番適してるのは、ブラウザの履歴データじゃないですか。
そりゃ、アルゴリズムに使いますよ、って単純な話。
推測でしか無いですが。