【簡単解説付き】Googleが主要な検索アルゴリズムのリストを公開。
こんにちは、セトの明石です。
Googleが主要な検索アルゴリズムのリストを公開しました。
ただ、あくまでどのような検索アルゴリズムがあるかを紹介しているだけなので、検索順位の上昇などに役立てられる情報があるかというと、そういう訳ではありません。
しかし、Googleの検索システムを理解し、SEOを行う手助けにはなるでしょう。
紹介されているアルゴリズムはそれぞれ簡単な説明が付いているのですが、SEOに詳しくない方にとってはそれでも難しいと思いますので、もう少し噛み砕いて、わかりやすくご説明したいと思います。
BERT
Googleが検索キーワードの処理に使用しているAIです。
検索キーワードから、その検索の意図やニーズを理解するためのものです。
ちなみにBERTは、「Bidirectional Encoder Representations from Transformers」の略です。
長い名前ですね(笑)。
災害情報システム
このシステムには「個人の危機」と「SOS 緊急情報」の2種類があります。
「個人の危機」は、例えば、自殺をほのめかすようなキーワードが検索された際に、ホットラインや信頼できる組織のURLを表示するといった仕組みです。
「SOS 緊急情報」は、例えば、地震や津波、台風といった災害が発生した際に、国や自治体からの最新情報を表示しくれます。
重複除去システム
検索キーワードによっては数百万ページがヒットしてしまうことがありますが、それらをすべて検索結果に表示することは現実的ではありません。
このシステムはもっとも関連性の高い結果のみを表示し、有益性の低い重複内容は除去するそうです。
検索キーワードとコンテンツの関連性を判断するアルゴリズムがこれなんでしょうか?
だとすると、検索ランキングにも関わるアルゴリズムですね。
完全一致ドメイン システム
恥ずかしながらこんなアルゴリズムあるとは知りませんでした(汗)。
ちょっとここの解説の全文を引用させていただきます。
”Google のランキング システムは、ドメイン名に含まれる単語を、コンテンツが検索に関連しているかどうかを判断するための多くの要素の一つとみなしています。とはいえ、コンテンツをホストするドメイン名が、特定の検索語句と完全一致することを意図して付けられている場合、完全一致ドメイン システムはそのドメインのコンテンツを過度に評価しないことになっています。たとえば、ドメイン名に含まれる単語によってランキングが上がるだろうと狙って仮に「best-places-to-eat-lunch」という単語を含めた場合、その逆の調整が行われることになります。”
まず前提として、Googleはドメイン名に含まれる単語とコンテンツの関連性を見ている、と言っています。
これも驚きではあるのですが、その上でこのシステムは、ドメイン名が特定のキーワードと完全一致するような場合は、そのドメインのコンテンツを評価し過ぎないようにしているそうです。
日本の場合、検索キーワードは日本語でも、ドメインはアルファベットというパターンがほとんどなので、ドメインと検索キーワードの関連性についてはあまり考慮されないと思うのですが、日本語ドメインの場合はどうなるんでしょうね。
日本語ドメインはこのシステムの対象になるんでしょうか?
フレッシュネス システム
検索キーワードによっては、新鮮な情報の方が価値が高い場合があります。そういう場合に、新しい記事を上位に表示するのがフレッシュネスシステムです。
なお、何でもかんでも新しいコンテンツが上位表示される訳ではなく、検索キーワードごとに判断されます。
ヘルプフル コンテンツ システム
SEO目的で機械的に作成されたコンテンツではなく、人間が人間のために作成したコンテンツを評価するシステムです。
リンク分析システムと PageRank
Googleが誕生した当初から、Googleの検索アルゴリズムの中核を成すアルゴリズムです。
「良いコンテンツには良いリンクが集まる」という考え方に基づいています。
かつてに比べるとその影響力は小さくなったと言われますが、今でも現役のアルゴリズムです。
ローカル ニュース システム
地域ごとに「トップニュース」や「ローカル ニュース」に、関連性の高い地域のニュース情報を表示します。
MUM
コロナワクチン情報の検索改善など、特定の用途で使用されてAIです。
MUMは、「Multitask Unified Model」の頭文字を取った略称です。
ニューラル マッチング
検索キーワードやコンテンツの意味や意図を理解して、それらを相互に関連付けるAIです。
オリジナル コンテンツ システム
Googleはオリジナルのコンテンツを、引用コンテンツよりも高く評価します。
そのためにどのコンテンツがオリジナルなのかを判断する仕組みも持っています。
削除ベースの降格システム
Googleは特定の種類のコンテンツをポリシー違反で検索結果から削除することができます。例えば以下のようなコンテンツが該当します。
法的手段による削除
著作権侵害、名誉毀損、偽造品、裁判所による削除命令に関わる申し立てなどに関わるコンテンツを降格します。
個人情報の削除
いろいろなパターンがあるようですが、個人情報に関わる違反を犯したサイトを降格します。
ページ エクスペリエンス システム
近年Googleが力を入れているアルゴリズムで、ページの読み込み速度や、モバイル対応、煩わしい広告がないかなど、複数の基準でそのページの使いやすさを評価しています。
関連性や評価が同程度のコンテンツが複数ある場合、ページエクスペリエンスが優れたコンテンツが上位表示されます。
パッセージ ランキング システム
「パッセージ」は文章などの一節や一区切りを意味する英単語です。
ページ全体ではなく、その一部が検索にどれくらい該当するかを判断しているアルゴリズムです。
商品レビュー システム
ECサイトなどの商品レビューに関して、質の高いレビューや専門家などのレビューを評価するアルゴリズムです。
RankBrain
RankBrainは、Google検索上でこれまでに検索されたことがない新しい検索キーワードなどを処理していると言われるAIです。
これも単語から意図や意味を推測する役割を果たしています。
信頼できる情報システム
Googleには、権威性の高いコンテンツを上位表示して、逆に信頼性の低いコンテンツの順位を下げるシステムなど、信頼性や権威性を判断する複数のアルゴリズムがあります。
サイト多様性システム
特定のサイトのページが検索上位を独占してしまわないように、同じドメインからは2ページまでしか検索上位には表示されないようにするアルゴリズムです。
ちなみに「同じドメイン」にはサブドメインも含まれるので、例えばexample.comとsubdomain.example.comは同じドメインとして判断されます。
スパム検出システム
ネット上のスパムサイトを発見し、それらを検索結果から排除するアルゴリズムで、最近特にGoogleが力を入れているアルゴリズムです。
廃止されたシステム
過去に使われていたもののすでに廃止されたか、後継のアルゴリズムに吸収されたアルゴリズムも紹介されています。これらについては列挙するだけにします。
・Hummingbird
・モバイル フレンドリー ランキング システム
・ページの表示速度システム
・Panda システム
・Penguin システム
・セキュアサイト システム
まとめ
こうしてリスト化されたものを見た時の印象としては、AIがずいぶん増えたなーという感じです。
一昔前のGoogleは検索アルゴリズムにAIを用いるのは難しいと言っていたと思うのですが、それが今ではたくさんのAIが検索を処理しています。
それから、廃止されたアルゴリズムを見ていくと、そのほとんどは後継のアルゴリズムに吸収される形で現在も残っているとはいえ、ほんの数年前までは主要なアルゴリズムだったものばかりです。
検索アルゴリズムの進化は近年ますます加速していますね。