検索エンジンになったつもりで考える内部・外部施策


今回のテーマであるが、

検索エンジンになったつもりで考えてみよう

である。

検索エンジンとは一言で言えば、

  1. 検索キーワードに関連するコンテンツを全てピックアップし
  2. コンテンツを評価して点数をつけ
    (検索キーワードに関して必要十分な情報があるかという観点での評価)
  3. 点数が高い順番に表示する

といった仕組みである。
理解するためにこんな想定をしてみよう。

手元に1000個の様々な内容の印刷物がある(以下コンテンツと呼ぶことにする)。
ボリュームはまちまちで、数百ページにも及ぶ長いものから葉書サイズのごく短いものまで様々。
また、内容の質についても役に立つものから、全く何の役にも立たないレベルまでこれまた様々だ。

コンテンツには全て「タラバガニ レシピ」というキーワードが含まれており、このキーワードでの順位付けを行う。

順位の高いコンテンツから順に10位まで賞金を授与するものとする。

自分だったらどう順位付けするかを考えてみてもらいたい。
前提条件として料理は苦手であり詳しい知識はないものとする。


1.一番最初に考えるべきことはあまり意識されないことだが
 「タラバガニ レシピ」というキーワードの意味を考えることである

これはほぼ自明だ。
タラバガニのレシピとして価値が高いということを評価するということだ。
レシピの原稿をワープロ入力する仕事のアルバイト情報などは、あまり意味がないということが理解される。


2.関連性を意識した上で読む

自分が順位付けをする以上は中身を見なければ始まらないはずである。

真っ先に料理に関係のないコンテンツは機械的に省くはずだ。
例えば、「タラバガニのレシピ30選 田村出版 A2番書庫所蔵」などと書いてあるだけのコンテンツなどである。

次に省くのはほぼタラバガニの料理法と関係ないコンテンツだ。
「お歳暮でタラバガニをもらったが、レシピなんか全然知らないので隣の奥さんにすぐあげてしまった。」
いくら中にオリジナリティのある文章が書かれていたとしても、コンテンツはレシピとしては意味がないため省くだろう。

問題はその後である。

3.自分で内容を評価する

レシピが載っている中での優劣をつけなければならない。

3行程度の説明しかないコンテンツより、詳しく具体的に書いてある方を評価するはずだ。
レシピが1つだけ載っているコンテンツよりも、たくさん載っているコンテンツを評価するだろう。

料理の知識がほとんどない前提においては、判断の基準は内容の充実度となるであろう。

しかし、こんなコンテンツがあったとする。

タラバガニ1匹を殻ごとキッチンタイマーで叩いてつぶします。
つぶしたタラバガニを電子レンジに移します。
生クリーム200cc・卵2個・砂糖大さじ5・オリーブオイル300cc・パン粉100gを加え、
湯煎しながらトロリと角が立つまでよく混ぜます。
一口大に丸めて串に刺し40度の油で120分揚げます。
皿に盛って青のり、ハバネロソース、細かくちぎったキッチンペーパーをたっぷりふりかけて完成です。

中に出てくる用語は全て料理用語で、材料も料理に使うものばかりである。
極端な例ではあるがまったく料理を知らないのであれば、こんなレシピも重要であると判断してしまう可能性がある。

4.他人に内容を評価してもらう

他人に協力してもらい評価してもらうことも考えるだろう。
但し他人に報酬を払うことはできないので、ボランティアでやってもらうしかない。
なので、全てのコンテンツに対して評価がつくわけではない。

自分が知っている人や、料理に詳しいと評判の人が評価してくれる場合もある。
しかし、知らない人の評価はコンテンツを作った人から買収されている可能性もある。

なので、知人ではなかったり、評判を知らない人からの評価は割り引いて考える必要がある。
買収されているということが何らかの方法で分かった場合は、

  • その人からの評判はまるっきり無視する
  • 買収されている人から推薦されているコンテンツは、不正なものとして全て却下する

いずれかの対処を迫られる。


さて、以上で検索エンジンの考え方はほぼ説明できる。
検索エンジンが直面している問題や、検索エンジンからどのように評価されるかはほぼ理解できるはずである。

検索エンジンが評価するポイントは大きく分けて2つある。

  • 内部要因
  • 外部要因

内部要因はコンテンツの中身であり内容の充実度などから行う判断。
内部要因を改善することによって検索エンジンからの評価を高めようとするSEO手法を内部施策という。

外部要因は他人からの評価からの判断。
その分野で評価の高いサイト、有名なサイトからリンクという形で推薦してもらうこと。
それが無理であったとしてもとにかく推薦をもらう。
場合によってはサクラを動員する。
これらをひっくるめて外部施策という。

現在、内部要因と外部要因では、内部要因からの判断が重要になってきている。
検索エンジンはコンテンツの濃さ、薄さを判断できるようになってきたからだ。

2.関連性を意識した上で読む

このレベルまでは検索エンジンはクリアすることができるようになった。

しかし、限界がある。
検索エンジンはあくまで人間ではないため、文章が意図するところを理解することはできない。
内容は一見充実しているものの嘘ばかり書いてある、あるいは役に立たないコンテンツを見分けることは根本的には不可能。
3.自分で内容を評価する」が難しくインチキレシピを見分けることはできないように、検索エンジンにも難しいのだ。

従って、「4.他人に内容を評価してもらう」に相当する、外部要因は今後も重要性を持ち続けるはずである。
検索エンジンがコンテンツの正当性を評価できるようになるのははるか先の話だ。

少々脱線するが人工知能の話をすると、コンピューターというものが発明されてから現在に至るまで、根本的な部分においては進歩していないと言われている。
コンピューターと人間の知性を区別する重要な点は、枠組みを超える判断ができるかどうかにかかっていると言われ、これをフレーム問題という。
この点において根本的な解決がなされておらず、また解決の見通しもまったくない。

検索エンジンがコンテンツを理解するためにはフレーム問題を突破する必要があり、これは現状不可能あるいは遠い未来の話しであろう。

コンテンツの濃さを判断することはできても、コンピュータにはコンテンツそのものから内容の正当性や価値を判断することはできない。

それができるのはあくまで人間だけである。
言い換えると外部要因の評価がない限り判断はできないのだ。

こう書くとコンテンツはいくらでもデタラメを書いていいと誤解されるかもしれない。

なので補足しておくと検索エンジンで上位に表示されたとしても、間違いだらけのコンテンツはやはり駄目である。
もし、ページに来訪があったとしても信頼が得られないので、問い合わせを得るといった目標を達成することはできない。
そして、当然のことながらリンクも集まらない。
だから駄目なのだ。

脱線が長くなった。

外部要因は重要であり続けるであろうというのが私の考えである。

では、外部要因について人為的であるかどうかを見分けることはできるのか?
こちらは技術的にかなりの精度まで見分けることが可能である。

先ほどの例に即して言えば、コンテンツの充実度が低いコンテンツに対して評価をしている人は、サクラである可能性が高いといったような様々な観点からの判断が可能だ。

結論として

内部要因と外部要因を判断することで、
コンテンツの充実度・信頼度をかなり高い精度で検索エンジンは評価することができる

内部要因の改善としての内部施策、外部要因の評価である外部施策はSEOの両輪であると言える。
この2つをたえず押し進めていく施策がSEOであるのだ。

タグ

2012/11/26 | コメント/トラックバック(3) |

カテゴリー:essence

検索エンジンの基本的な仕組みを理解する


車に動力をもたらすエンジンはどういう原理になっているのか?
どうしてブレーキを踏むと止まるのか?

といったことを知らなくても、自動車を運転することはまったく問題なくできる。

しかし、
定期的にエンジンオイルは交換しなくてはならないのは何故か?
長い坂道を降りるにあたって、ずっとブレーキを踏んでいると何故危険なのか?

といったことは、自動車の仕組みをある程度知らないと、理解することができない。
自動車の仕組みを知ることは、自動車を長持ちさせたり、より安全に運転することにつながる。

故障を未然に防いだり、危険を回避することに大きく役立つのだ。

実は検索エンジンにもこれと同じことが言える。
検索エンジンの仕組みを知らなくても、Webサイトの運営はできるしSEOを実施することも可能である。

しかし、知っておくとよりSEOの根本、何故そうしなくてはならないのか?
といった理由がわかるようになる。

なので、初心者向けの内容であるが検索エンジンの基本的な仕組みについて書いてみるのだ。

※クリックすると拡大します

検索エンジンというシステムはGoogleに限らず原理的には

  • クローラー
  • インデクサ
  • サーチャー

この3つのシステムが連携して一つのシステムとして動作している。
社内文書検索システムといった比較的小規模のシステムも、Googleといった超巨大システムであっても動作原理は基本的には一緒である。

Googleといった大量の文書を処理し、多くのユーザーが同時に利用するシステムの場合は、クローラー、インデクサ、サーチャーのそれぞれについて多くの台数のコンピュータが用いられている。
推定では100万台のコンピュータが使われているとも言われている。

さて、これらのコンピュータがどのような働きをしているのか概要を説明してみよう。

  1. クローリング
    クローラーがインターネット上にあるWebページを取得しにいく。
    リンクをたどってリンク先のページを取得するのが原則であるが、ウェブマスターツールから登録されたサイトや、sitemap.xmlなどから取得する場合もある。
  2. インデキシング
    クローラーが取得したデータを、インデクサに蓄積する。
    インデックスとは索引のことである。
    巨大なデータの中から、要求に応じて瞬時に必要なデータを提供するためには、索引に相当する仕組みが必須である。
    検索エンジンというシステムは超巨大データのインデックスそのものであるといえる。
  3. クエリ実行
    ユーザーが検索エンジンのWeb画面を介して検索結果の要求をする。
    ちなみにクエリとは大規模なデータを扱うシステムに対して、データの取得や加工を要求することを一般的には指す。
    つまり検索エンジンに対してクエリするとは、検索結果データの取得の要求をすることを示しているのである。
  4. データ問い合わせ
    クエリの依頼を受け付けたサーチャーが、インデクサに対して該当するデータを要求する。
  5. データ引渡し
    インデクサに蓄積されたデータの中から、必要なデータをサーチャーに対して引き渡す。
  6. 検索結果表示
    引き渡されたデータをアルゴリズムにもとづいて並べ替えを行い検索結果として表示する。
    アルゴリズムとはコンピュータが何かを行う際に、処理を行うための手続きのことを指す。
    コンピュータの処理は全てアルゴリズムに基づいているわけだ。
    しかし、検索エンジンの利便性のほぼ全てを決定するものは、どのページがどれだけ重要かという順位付け(スコアリングという)の良し悪しにかかっている。
    そのために検索エンジンにおいて、アルゴリズムはスコアリングの部分のみを指すようになったのだと思われる。

非常に大雑把ではあったが説明は以上である。
これを理解すると色々なことがわかるようになる。

  • robots.txtの動作は①の部分についてコントロールする。
    クローリングを禁止することができる。
  • noindexを指定すると①によって取得されたページが②の時点でインデックスされない。
    しかし、クローリングは行われるため、noindexが指定されているページ中のリンク先はインデックスされる。

robots.txtによってクローリングを禁止しても、noindexによってインデックスを禁止しても結果的に検索結果には表示されないのは一緒である。
しかし、検索エンジンの動作はまったく異なるといったことが理解できるのだ。

この動作を理解しておかないと、robots.txtでクローラーのアクセスを禁止したページ内にcanonicalを指定してしまう。といった誤用が生じる。
robots.txtでクローリングを禁止されたページに、canonicalを指定しても検索エンジンは見ることができないから意味がないのである。

このようにSEOには最小限この程度の検索エンジンの仕組みを理解しておく必要がある。
仕組みを理解しておけば、テクニカルな問題に対して適切に答えを出すことができるのだ。

タグ

2012/11/19 | コメント/トラックバック(3) |

カテゴリー:essence

正しいSEOの戦略


今回のテーマであるが

正しいSEOの戦略

である。
またしてもSEOのマインドのあり方についての記事である。
いい加減マンネリだと思われるかもしれないが、一つの問いに答えておきたいのだ。

長い間でもないがこのようなSEOのブログをやっていると、たまにこんなコメントをもらう時がある。

「Googleの奴隷になってどうする」

という意見だ。
私のブログをある程度読んでいれば、まったくこれは誤解だとわかっていただけると思うのだが、この点についてわかりやすく改めて書いてみたいと思う次第だ。
私が言いたいのは、こういうことである。

Googleに従うことは、Googleの奴隷になるということではない。

もし、GoogleのアルゴリズムがGoogleだけの利益になるものであるならば、Googleに従うことは奴隷になるということであろう。

しかし、

Googleの目指す方向は
全てのインターネットユーザーにとって望ましいもの

なのだ。

Googleのウェブマスター向けガイドラインから引用してみよう。

デザインとコンテンツに関するガイドライン

  • わかりやすい階層とテキスト リンクを持つサイト構造にします。各ページには、少なくとも 1 つの静的なテキスト リンクからアクセスできるようにします。
  • サイトの主要なページへのリンクを記載したサイトマップを用意します。サイトマップ内にリンクが非常に多数ある場合は、サイトマップを複数のページに分けることをおすすめします。
  • 1 ページのリンクを妥当な数に抑えます。
  • 情報が豊富で便利なサイトを作成し、コンテンツをわかりやすく正確に記述します。

全てユーザーのニーズにかなうことである。
Googleというものがなかったとしても、このようにサイトを作るべきであるという原則は全く変わらない。

こちらの「Google秘録」という書籍を以前読んだのだが、これを読むとGoogleの本質が実によく分かると思う。
一度この本のことは当ブログで紹介したことがあるが、もう一度紹介してみたい。
Google関係者だけではなく、Googleを危険視する立場の人物からも徹底したインタビューを実施した力作だ。
凡百のSEOの技術書より、Googleの本質を理解するために良い本なので是非一読をお勧めしたい。

これを読み、ウェブマスター向けガイドラインを読むと、

Google検索は無私である

Google検索の根本的な思想は始まりから現在に至るまで、まったくぶれていない。
実に明確であることがよくわかる。

Googleは最初から現在のように儲かっていたわけではない。
検索精度を追求していたが、利益を出すことは考えていなかったのである。
どうやって検索エンジンから利益を生み出すかというビジネスモデルが全く見えない中で、Googleはひたすらユーザーに対する検索ニーズにこたえる精度を高め続けていった。

Googleは利益が先ではなく、悪い言い方をすれば技術オタク的にひたすらに精度ありきなのだ。
現在Googleは巨大な利益を生み出す企業に変貌したが、精度ありきは変わっていない。
そうして、未来においても変わらないだろう。

だから、SEOはこう考えるべきなのだ。

Googleの過去と現在と未来、そしてSEOについてまとめてみたのが下の図だ。

Googleアルゴリズムの過去と現在と未来、そしてSEOの採るべき戦略
※Illustratorとかそんなものを使えればいいのだが、MS-Wordしか使えないので美しくない図しか書けないのが残念。

Googleのアルゴリズムの目的地は決まっている。
それは未来の先にある究極の地点である。

それはガイドラインに書いてある通り。

言い換えれば、

「Googleは公開されている」

公開されているポイントに向かってSEOをしていけばよいのである。

その逆がスパムSEO。
現在のアルゴリズムだったら、こうすれば上位表示しやすいというところを狙っていく行為。
理想となるGoogleと現在のGoogleのギャップをつく技だ。

言い換えればゲームプログラムで言うところの「バグ技」である。
バグをつけば確かにゲームを進めるのはだいぶ楽だろう。

しかし、このゲームは常にオンラインで修正されている。
昨日まで通用したバグ技が今日通用するという保証は全くない。

常にバグは修正される運命にあるからだ。
新たに一生懸命にバグを見つけ出して、さらにバグ技を修得し続けなければならない。

こんな自転車操業みたいなことは非生産的だ。

そんなことをする暇があったら、Googleの目的地は決まっているので、そこに向かって最初からSEOすればいいのである。

タグ

2012/11/12 | コメント/トラックバック(2) |

カテゴリー:essence

嘘のSEO情報に気をつけろ!


今回のテーマである。

嘘のSEOに気をつけろ!

である。
本当はこんなことを書きたくはない。
しかしながら、SEOについての誤った知識がtwitterや、はてブなどで広く拡散してしまっていることに憂慮しているのである。

SEOについての正しい知識を啓蒙しているブログは数多くある。

代表的なものを挙げてみよう。

・鈴木謙一氏:海外SEO情報ブログ
・住太陽氏:SEO 検索エンジン最適化
・滝日伴則氏:SEO Japan
・竹内潤平氏:パシのSEOブログ
・渡辺隆広氏:SEMリサーチ

※ちなみに並び順は著者名の50音順である。

これ以外にもよいブログは多数ある。

さて、これらのブログは有用で、正しく、かつ恒久的に通用する知恵を与えてくれる。
しかし、とても残念なことがある。

これらのブログに書かれている記事は
SEOの専門家以外にあまり読まれていない

これらのブログでは100以上はてブされる記事はごくまれである。
本当はSEOのことをよく知らない人こそが読むべきなのだ。

読まれるべき人に読まれていないのだ。

そして、誤ったSEO情報が記載されているブログ記事が、500はてブと、とてつもなく拡散している状況だ。
twitterでリツイートしている人は「参考になった」という意見が非常に多く、間違いを指摘している人はほとんどいなかった。

このまま放置すると誤った認識が広がる可能性が高い。
私は悩んだ末、誤りの箇所を列挙しブロガーの方に直接連絡をしたのだが何も返答がなく、記事が訂正されることはなかった。

だから、袋叩きにあうかもしれないが、それでもあえて言うことにしたのである。

嘘のSEO情報の見分け方とは何か?
※とはいえ、このブログそのものが正しいかどうかは残念ながら皆さんに判断していただくしかない。

その方法だが、3つあると思う。

1.上記の5人からポジティブな意味で引用されている

上記の5つのブログを運営しているSEO人は、日本のSEOを牽引してきた功績者でもあり真のプロである。
そうして名前を公開してブログを運営しており、自らの発言に責任を負っている。

だから、上記5人から紹介されている情報源は信頼に足るといってよい。

ちなみにSEOで非常に著名な人物であっても、私があえて名前を挙げていない人物も複数存在する。
その理由は、スパム手法、言い換えればGoogleをだますことを推奨しているからである。

実名を公表してまでスパムをなぜ推奨しているのか?
それはビジネスのメリットがあるからだ。

本来はスパムを使わなくても、検索エンジンから集客することは可能だ。
しかし、それを言ったらビジネスにならない。

自分だけが知っている独自の研究がSEOに必要だと誤解させるためである。

このようなものを信じてはいけない。
本当はSEOは誰にでもできるのだ。

脱線が長くなった。

さて上記の5人であるが、有意義なSEO情報を紹介するサイトを持っている場合がある。

このようなサイトで評価されているかを調べてみるとよい。

少々面倒ではあるが、Google検索で調べることができる。
(実際には評価されていても取りこぼされるケースもある)

site:サイトURL “評価したいサイトのタイトル”

例えば、私の知人の伊藤氏が運営している「SEO Imagination」の評判を海外&国内SEO情報ウォッチで取り上げられているかを調べる場合は、

site:web-tan.forum.impressrd.jp “SEO Imagination”

と検索してやればよい。
すると、

SEOに効くのは商材への“愛”!? 筆者も感動した良記事

といった紹介記事が検索結果に表示される。
(ちなみに上記の記事は私も感動したので、引用してみたくなった次第である)

このような感じで、SEOについての記事で評価されていれば、SEO情報として信頼するに値する品質があると考えていいだろう。
コピーライティングなどで紹介されている場合は含まないので注意である。

あともう一つの見分け方を書いてみる。
SEOのことがわからない人が、情報の真偽を見分けることは難しいのだが、こんなところに留意してみれば分かる可能性が高い。

2.○○率という言葉を強調する情報は間違いだ

よく言われるのがキーワードの含有率であるが、このような指標には意味がないのである。
検索順位の真実は誰にも分からないにも書いたように、Googleは約200項目にものぼる指標を用いて順位を決定している。
それらは互いに関連しあっているので、単純に何%にすればよいといったことは言えないのである。

SEOの噂を検証する

これに載っている「アナゴさん」というキーワードの例を見ればわかるだろう。

3.少し前のSEO情報は役に立たないと強調する情報は間違いだ

Googleの目指している方向は10年も前から既にわかっていて、まったく現在に至るまでぶれていない。
Googleの目指している方向を志向していれば、Googleが進歩すればするほど自サイトは検索結果上優位なポジションを占めることができる。
参考:Googleは不自然リンクの問題を解決できるか

今のGoogleの状況に合わせてSEOしていくと、いつまでたってもGoogleを追いかけ続けないといけない。
そんなのは一言で言うならば、

「くだらねえ!」

のである。
その背景も専門家がだけが抱えている情報が必須だと誤認させるためである。
もう一度言う、

SEOは誰にでもできるのだ

その情報を書いている人が持っている情報がないと、SEOができないと言うのは100%嘘であると断言するのである。
自らの利益のためにSEOの本質を誤って伝えようとする行為に他ならない。


追伸

通常使用するリダイレクトであればブラックハットSEOになるということはありません。
オールドドメインなどから301リダイレクトさせてやって故意にページランクをあげようとする行為がブラックハットSEOです。

お間違えなきよう・・・

タグ

2012/11/05 | コメント/トラックバック(3) |

カテゴリー:essence

このページの先頭へ