シナプス海老原です。

WEBマーケティング界で、流行のコンテンツマーケティング。そして、人工知能の最新技術ディープラーニング(深層学習)。このふたつのトレンドは、ここ数年ほぼ同時期に発達しました。

コンテンツマーケティングとディープラーイングが同時に発達したのは偶然なのでしょうか。私は必然であると考えます。コンテンマーケティングとディープラーニングは密接に関連しているのです。コンテンツマーケティングの科学的根拠がディープラーニングです。

ディープラーニングの発達によりコンテンツマーケティングが誕生

ディープラーニングがGoogleの検索ランキングアルゴリズムをコンテンツ重視に変えました。ディープラーニング(深層学習)技術の導入により、従来型のSEO対策が様変わりしコンテンツマーケティングという記事のコンテンツの質を重視するWEBマーケティング手法が生まれたのです。

「ディープラーニング」と「コンテンツマーケティング」。このふたつのトレンドの関係性について、理工学修士でディープラーニングのアルゴリズムの話しも理解でき、マーケティングコンサルタントで、自社のWEBマーケティング実行をほぼ一人でやっている海老原が解説します。

1.コンテンツマーケティングとは


コンテンツマーケティングとは、WEBマーケティングの最新トレンドです。

コンテンツマーケティングとは、「顧客にとって、価値のある良質なコンテンツを提供し続けることで、興味・関心をひき、理解してもらい、結果として売上につなげるマーケティング戦略」です。

WEB集客にはSEO対策が重要

消費者は知りたいことがあれば、パソコンやスマホで、すぐインターネット検索する時代となりました。そのため、WEBマーケティングの主な施策として、検索エンジン最適化=SEO対策が重要となっています。

SEO対策とは具体的に何をすることか。突き詰めると「検索エンジンキープレーヤーであるGoogle検索で上位をとること」といえるでしょう。

SEO対策=コンテンツマーケティング

Googleで検索エンジンの上位に掲載されるために、重要となっているのが「コンテンツマーケティング」です。そして、コンテンツマーケティングにディープラーニングという人工知能の最先端技術が影響を与えているのです。

2.コンテンツマーケティングの根拠はディープラーニング

2-1.ディープラーニング以前はリンクが良質なコンテンツの基準

良質なコンテンツを判断するページランクアルゴリズム:リンクの数と質

ディープラーニング以前、Googleの検索順位で上位を獲得するために、重要な要素は「そのページがリンクされている数とリンク元のページの質」でした。

このページランクとWEBページの重み付け方法は、Googleが最初に導入した検索アルゴリズムの画期的な評価方法でした。

ページランクとは、学術論文の品質判断の考え方を元にしています。良質な論文は、他の論文に引用されます。他の論文に引用される数が多ければ多いほど、また、引用する側の論文の質が高ければ高いほど、良質な論文といえます。

つまり、質のよいサイトからのリンクがあればあるほど、良質なコンテンツと判断されるわけです。

ページランクアルゴリズムの悪用によりGoogleアルゴリズムの修正が求められた

しかし、2010年前後のWEBマーケティング・SEOにおいては、このページランクアルゴリズムを悪用する事業者がでてきました。リンク数が多いほど、良質なコンテンツと判断されるなら、とにかくたくさんのページのリンクを集めればよいわけです。

そのため、Google検索順位をあげるSEO対策として、サイトに、無意味な大量のリンクを売る事業者がでてきました。実際に、大量のリンクが獲得でで検索順位上位がとれました。

このため、Googleはユーザーにとってベストな検索結果、ユーザーにとって良質なコンテンツを標準するため、アルゴリズムの改善を迫られました。このアルゴリズム改善の延長線上に、ディープラーニング技術=深層学習があります。

2-2.コンテンツマーケティングの誕生:記事自体の品質重視

Googleアルゴリズムの進化:ペンギン・アップデート、パンダ・アップデート

2012年、WEBマーケティング業界、SEO対策業界に衝撃がはしります。Googleが発表した『ペンギン・アップデート』とよばれる検索順位アルゴリズムの変更です。

このペンギン・アップデートにより、リンクがたくさんはられているだけの、中身のないページは軒並みGoogleの検索順位がさがりました。さがるどころか、ペナルティをうけて、検索結果に表示すらされなくなるサイトもありました。

このペンギン・アップデート、そして、もうひとつの『パンダ・アップデート』という検索アルゴリズムの更新を、Googleは継続的におこなっています。その目的は、Googleで検索するユーザーにとって「最高の品質のコンテンツを提供すること」です。

コンテンツ・イズ・キングの背景は人工知能ディープラーニング技術の発達

Google検索のアルゴリズムが洗練され、人間にとって本当に良質なコンテンツが判断できるようになってきました。人間が読んで良質なコンテンツ、役に立つと思えるコンテンツは、Googleで実際に上位表示される確率があがりました。

そのため、最近WEBマーケティングの世界でいわれているのが『コンテンツ・イズ・キング(Content is King)』です。つまり、「ユーザーにとって良質なコンテンツをつくることが最重要であり、良質なコンテンツさえあればWEB集客ができる」、という考え方です。

良質なコンテンツが重視される技術的背景が「人工知能ディープラーニング技術の発展」です。

2-3.ディープラーニングでGoogle検索の良質なコンテンツ基準が変化

良質なコンテンツの判断基準とは

では、「SEO対策には良質なコンテンツを書けばよい」ということですが、ここで重要になるのは「良質なコンテンツとは何か?どう判断するのか?」ということです。

良質なコンテンツを判断する技術的・理論的な根拠が人工知能の最先端ディープラーニング技術です。

コンテンツマーケティング専門家の判断基準は経験則

コンテンツマーケティングの専門家は、良質なコンテンツについて、下記のようなことをいいます。

  • コンテンツとは見た人の生活の質をあげるもの
  • ユーザーの知りたいニーズを完全に満たす情報を記載する
  • 売ることが目的ではなく徹底的にユーザー目線に立つことが必須である

しかし、この根拠を聞いてみると大抵は経験則です。

「ユーザー目線でコンテンツを書いたら上位を獲得した。だから大事」
「Googleはかなりの精度でコンテンツの質を判断できるようになっている(らしい)」
いわゆる「帰納法」で、過去の成功事例からなんとなく推測した経験則であり、演繹法的に論理立てて根拠を説明されることはありません。

ディープラーニングでできることの理解で理論的説明が可能

Googleは人力での作業をとても嫌う企業です。たとえば、Googleニュースで表示されるニュースは、人の判断が全く入らず、コンピュータのアルゴリズムだけで自動的に判断しています。

単なる経験則ではなく、もっと理論的・技術的な根拠はないか、Googleはどのように良質なンテンツを判断しているのでしょうか。たどりついた答えが「人工知能のディープラーニング技術」です。

3.ディープラーニングとは:人工知能の最先端技術

3-1.ディープラーニングは人工知能の50年ぶりのブレークスルー技術


ディープラーニング(深層学習)とは、いわゆる「機械学習」と呼ばれるジャンルの人工知能の最先端技術です。

人工知能は人間を超えるか -ディープラーニングの先にあるもの-」の著者で、日本の人工知能会の権威である松尾豊氏は、ディープラーニングは、人工知能に50年ぶりのブレークスルーをもたらす可能性のある技術といいます。

ディープラーニングは、画期的な技術であることは確かです。しかし、「ディープラーニングで何でも解決できるのではないか」「ディープラーニングを使った人工知能により、映画のように、コンピュータが人類を滅ぼそうとするのではないか」とディープラーニングに過剰な期待や不安をいだかれることに、著者は不安を感じています。

「ディープラーニングでできること」と「ディープラーニングの限界」を正しく理解しましょう。

<Wikipedia:「ディープラーニング」より>
「ディープラーニング、深層学習(英: Deep Learning)とは、多層構造のニューラルネットワーク(ディープニューラルネットワーク、英: Deep Neural Network)の機械学習のこと。汎用的な人工知能、いわゆる強い人工知能の実現が期待されている。ディープラーニングの概念・手法は1980年前後からあったが、2010年代にディープラーニングを使った画像認識の研究などから、急速に盛り上がり、三度目の人工知能ブームといわれる」

3-2.ディープラーニングはコンテンツの価値判断基準をコンピュータが自ら決定

ディープラーニングとは何でしょうか?誤解をおそれず簡潔にいいます。

ディープラーニングは、「特徴量」つまり、あるものの良し悪しを決めるための、抽象的な『価値判断基準』を、コンピュータが「自動的に発見する技術」です。

ディープラーニング以前はコンピュータの価値判断基準をすべてヒトが設定

具体例で考えてみましょう。
かつて、Googleが検索順位の重みとして重視していた価値判断基準は、リンクの数と質でした。

コンピュータは、ヒトが価値判断基準のルールさえ与えれば、無限の計算力で適切な答えを導き出します。しかし、他のページからのリンクが多いほどコンテンツの質が高い、という価値判断基準を考えたのはヒトです。

ディープラーニングができることは価値判断基準をコンピュータ自身が作ること

コンピュータは、単純作業は得意分野です。しかし、計算するためのルールをつくる、価値判断基準をつくるという、抽象化の作業は、これまでは、あくまでヒトがおこなう領域でした。

このヒトの判断に依存してきた、特徴量といわれる抽象的な価値判断基準の設定を、ヒトが介在せず自動的に生み出す技術が「ディープラーニング」です。

ディープラーニングが、コンピュータ・人工知能の歴史のなかで、どんなにすごいブレークスルーかがわかってきます。

4.ディープラーニングをGoogle検索技術が使う意味

4-1.ディープラーニングによりGoogle検索エンジンが獲得した「ネコの概念」

ディープラーニングで、コンピュータがネコの概念をヒトに頼らず画像認識

2012年6月、Googleはネコの画像を自動認識できた、という研究成果を発表しました(関連記事)。
コンピュータが「ネコという概念」を自らつくり出し画像認識できました。ネコの概念を獲得するのに使われた技術がディープラーニングです。

「なんだ、たいしたことではないではないか」と思う方もいるかもしれません。「ネコの画像を見てネコと認識すること。」人間なら簡単なことです。しかし、これはコンピュータにとっては、とても難しい作業です。

抽象概念の獲得はディープラーニング以前のコンピュータ・人工知能では困難

ディープラーニングが、なぜブレークスルー技術なのか?この例では、一見、簡単そうにみえるネコの画像認識は、コンピュータにとっては、なぜ難しいのでしょうか?

なぜなら、ネコには「白いネコもいれば黒いネコもいる」「大きいネコ小さいネコ」「毛が長いネコ短いネコ」、一匹一匹のネコは少しずつ違いますがすべて「ネコ」です。さらに、どうイヌと違うのでしょうか? あるいは、どうライオンと違うのでしょうか?

たとえば、「ネコを一度も見たことがないヒトに対してネコの概念を間違いなく伝える文章を書いてください」といわれると相当難しいでしょう。

つまり、抽象的な概念をコンピュータにルール化して教えることはとても難しいことなのです。

しかし、ディープラーニングがあれば、ヒトがルールを教えなくても自動的にコンテンツの抽象概念を理解できます。

4-2.Google検索はディープラーニングを使ってコンテンツの質を判断

「Google検索のアルゴリズムのひとつに、ディープラーニングが活用されている。」

ディープラーニングができることから、想定するとディープラーニング技術により、Google検索アルゴリズムは、以下のような抽象的な、日本語理解、自然言語の概念理解は、獲得しているはずです。

Google検索がディープラーニングでできること予測

  • 見た目が読みやすい文章か読みにくいか文章かや、見やすいページか見みにくページかは判断できる
  • 文章の流れとして、ロジックとしてとおっている、とおっていないは判別できる
  • 独自性のあるオリジナル記事と、ほかの記事のコピペのオリジナリティのない文章との違いは認識できる
  • 文法的に正しい文章と正しくない文章や誤字脱字がある文章は認識できる

どのレベルまで判断できるかの予測は難しいところですが、ディープラーニングで、何らかの抽象概念、つまり、「人手を介さずコンピュータが自動的に生成したコンテンツの良し悪しに関する特徴量」を使って良質なコンテンツの価値判断基準に使っているはずです。

5.良質なコンテンツを書くためディープラーニングでできることを理解

ディープラーニングの理解が、なぜコンテンツマーケティングにとって重要か。それは、良質なコンテンツの概念が、ディープラーニングの理解をとおして単なる経験則以上に理論的根拠をもって見えてくるからです。

5-1.ディープラーニングで判断できる良質なコンテンツ

コンテンツマーケティングの専門家は、ユーザーにとって役立つ内容であるだけでなく、「見た目が読みやすいかどうか」「日本語の細かい言い回しの違和感やミスがないか」までを気にしているようです。

Google検索は、このヒトだけがおこなっていた抽象的なコンテンツの良し悪しまで、すでにディープラーニングで判断していると考えられます。

つまり、「コンテンツマーケティング」成功には、ディープラーニングのコンテンツ判断の技術レベルを意識した上で、良質なコンテンツライティングをするべきです。

5-2.現在のディープラーニングでは判別できない「良質なコンテンツ」とは

コンピュータがディープラーニングで認識したネコの概念は単なる画像認識

一方、逆に「ディープラーニングで、今はまだできていないこと」にも注目すべきです。

先の日本の人工知能権威である松尾氏によると、ディープラーニングは人口知能の大きなブレークスルーであるものの、まだまだ研究の余地がたくさん残された段階だそうです。

たとえば、先ほどのディープラーニングによるGoogleアルゴリズムのネコの概念の認識。今回の研究成果はあくまで「画像としてのネコ」を認識できたに過ぎません。

ディープラーニングで自然言語の概念が本質的に理解できるのは10年先

「『ニャーオ』と鳴く動物は、ネコである。」「ネコは気まぐれである(と思われている)。」「ネコは、かわいい。」

このようなヒトならではの抽象的な概念は、ディープラーニングをもってしても、まだ判断できる技術レベルにありません。

人工知能研究のなかで、「自然言語の概念理解」は、現在のディープラーニングの何ステップも先の話、時期でいうと2025年ごろが、ひとつの目安だそうです。

ディープラーニングでは良否が判断できないコンテンツとは

ディープラーニングが自然言語の概念理解をしていなければ、良否が判断できない種類のコンテンツがあります。

たとえば、ディープラーニングを駆使しても、現時点のコンピュータが「シェークスピアの文章に、感動を覚える」ことはないでしょう。あるいは「このWEB記事、電車のなかで読んだら思わず吹いた」という類いのユーモアのあるコンテンツもディープラーニングを使っても理解できないでしょう。

このように、ディープラーニングにより、コンピュータが価値判断基準を自ら作れるのは、まだごく一部の領域です。

ディープラーニングが、ヒトのレベルの抽象概念獲得、たとえば、感動・機微・ユーモアなどを理解できるのはずっと先です。

5-3.ディープラーニングでできることを意識して良質なコンテンツを書く

「ディープラーニングでできることとコンテンツマーケティングの関係」を知ることは、コンテンツマーケティングに現在関わっている方、また、コンテンツマーケティングをはじめたい方にとって重要です。

  • Google検索技術には、確実にディープラーニングが使われている。そのため、ディープラーニングの理解は、コンテンツマーケティングに重要。
  • ディープラーニングの技術は、検索エンジンにとっても画期的技術である。しかし、また、コンテンツの種類により、判断できる特徴、判断できない特徴があり、まだまだヒトの理解には及ばない。
  • ディープラーニングでできること/できないことがわかればGoogle検索が、どんなコンテンツを「良質なコンテンツ」を判断しているかがわかるはず。
  • ディープラーニングでできることの現在値を知り、「良質なコンテンツ」を書けば、コンテンツマーケティングに有効。

まとめ

  1. 現在のWEBマーケティングのトレンドにコンテンツマーケティングがある
  2. ディープラーニングによって、Google検索にとって、良質なコンテンツの意味が変わった
  3. ディープラーニングは、人工知能のブレークスルー。しかし、限界もある
  4. Google検索技術に、ディープラーニングが活用されることは、コンテンツマーケティングに影響を与える
  5. ディープラーニングにできることの現在値を意識すると、コンテンツマーケティングに重要な良質なコンテンツを書ける

※2016/1/23追記:本コラムがはてなブックマークの「テクノロジー>ディープラーニング」の項目に載りました。ありがとうございます!


参考情報

1.ディープラーニング参考図書

2.海老原一司のマーケティングコラムシリーズ一覧


海老原一司:シナプスマーケティングコンサルタント

シナプスでは、主にBtoBマーケティング領域を担当。大手企業、ベンチャーなど、事業会社4社、10年の新規事業、新商品プロジェクトマネジャー経験を経て現職。

新規事業現場でプロジェクト推進してきた、現場感のある、マーケティング・事業推進の裏ワザ系コラムが得意分野。また、理工学修士×MBAの経験を活かした、テクニカル系、サイエンス系のコラムも執筆中。

理工修士×MBAのテクニカル系コラムシリーズ


参考情報

企業研修:マーケティングと人材育成のプロ集団

マーケティングと人材育成に通じたプロ集団、シナプスの企業研修のご紹介です。シナプスの企業研修では、ワークショップ形式での自社課題解決など実務を通して、ビジネススキルを体感しながら身につけ、企業の組織力を高めます。

企業研修プログラムの詳細は『企業研修:マーケティングと人材育成のプロ集団』をご覧ください。


シェアする