シナプス海老原です。

Webマーケティング界で、流行のコンテンツマーケティング。そして、人工知能の最新技術ディープラーニング。このふたつのトレンドは、ここ数年ほぼ同時期に発達しました。

コンテンツマーケティングとディープラーイングが同時に発達したのは、偶然なのでしょうか。私は必然であると考えます。コンテンマーケティングとディープラーニングは密接に関連しているのです。

ディープラーニングの発達→Google検索の変化→コンテンツマーケティングの誕生

ディープラーニングがGoogleの検索ランキングアルゴリズムをコンテンツ重視に変えました。ディープラーニング技術の導入により、従来型のSEO対策が様変わりしコンテンツマーケティングという記事のコンテンツの質を重視するWebマーケティング手法が生まれたのです。

「ディープラーニング」と「コンテンツマーケティング」。このふたつのトレンドの関係性について、理工学修士でディープラーニングのアルゴリズムの話しもある程度理解でき、IT業界15歴年、現在は、マーケティングコンサルタントで、自社のWebマーケティング・コンテンツマーケティング実行をほぼ一人でやっている海老原が解説します。

1.コンテンツマーケティングとは


コンテンツマーケティングとは、Webマーケティングの最新トレンドです。

コンテンツマーケティングとは、「見込み客や顧客にとって、価値のあるコンテンツを提供し続けることで、興味・関心をひき、理解してもらい、結果として売上につなげるマーケティング戦略」です。

Web集客には、SEO対策が重要

消費者は知りたいことをパソコンやスマホで、すぐインターネット検索する時代となりました。そのため、Webマーケティングの主な施策として、検索エンジン最適化策=SEO対策が重要となっています。

SEO対策とは、突き詰めると「検索エンジンキープレーヤーであるGoogle検索で上位をとること」といえるでしょう。

SEO対策で重要なのは、コンテンツマーケティング

Googleで検索エンジンの上位に掲載されるために、重要となっているのが「コンテンツマーケティング」です。そして、コンテンツマーケティングにディープラーニングという人工知能の最先端技術が影響を与えているのです。

2.コンテンツマーケティングの技術根拠はディープラーニング

2-1.ディープラーニング以前:リンクが良質なコンテンツの基準であり、Webマーケティングリンク獲得が重要だった

良質なコンテンツを判断するページランクアルゴリズム:リンクの数と質

ディープラーニング実用化される以前。かつて、Googleの検索順位で上位を獲得するために、もっとも重要な要素は、「そのページがリンクされている数」と「リンク元のページの質」でした。

このページランクとWebページの重み付け方法は、Googleが最初に導入した画期的な評価方法でした。

これは、学術論文の品質判断の考え方を元にしています。良質な論文は、かならず、ほかの論文に引用されます。論文に引用される数が多ければ多いほど、また、引用された論文の質が高ければ高いほど、良質な論文といえます。 つまり、質のよいサイトからのリンクがあればあるほど、良質なコンテンツと判断されるわけです。

ページランクアルゴリズムの悪用によりGoogleアルゴリズムの修正が求められた

しかし、2010年前後のWebマーケティング・SEOにおいては、このページランクアルゴリズムを悪用する事業者がたくさんでてきました。リンクされる数が多ければ多いほど、良質なコンテンツと判断されるのであれば、とにかくたくさんのページからリンクされればよいわけです。

そのため、検索順位をあげるためのSEO対策として、順位をあげたいサイトに対して、数百から数千ページからのリンクを売る事業者、買う事業者がでてきました。実際に、大量のリンクがはられることで検索順位はあがっていました。

このため、Googleはユーザーにとってベストな検索結果、ユーザーにとって良質なコンテンツを標準するため、アルゴリズムの改善を迫られました。このアルゴリズム改善の延長線上に、ディープラーニング技術=深層学習があります。

2-2.コンテンツマーケティングの誕生:リンクより記事の質が重要に

Googleアルゴリズムの進化:ペンギン・アップデート、パンダ・アップデート

2012年、Webマーケティング業界、SEO対策業界に衝撃がはしります。Googleが発表したペンギン・アップデートとよばれる検索順位アルゴリズムの変更です。

このペンギン・アップデートにより、リンクがたくさんはられているだけの、中身のないページは軒並みGoogleの検索順位がさがりました。さがるどころか、ペナルティをうけて、検索結果に表示すらされなくなるサイトもありました。

このペンギン・アップデート、そして、もうひとつのパンダ・アップデートという検索アルゴリズムの更新を、Googleは継続的におこなっています。その目的は、Googleで検索するユーザーにとって「最高の品質のコンテンツを提供」することです。

コンテンツ・イズ・キングの背景に人工知能ディープラーニング技術の発達がある

Google検索のアルゴリズムがどんどん洗練され、読む人間にとって本当に良質なコンテンツが判断できるようになってきました。人間が見て良質なコンテンツ、役に立つと思えるコンテンツは、Googleで実際に上位表示される確率があがりました。

そのため、最近Webマーケティングの世界でいわれているのがコンテンツ・イズ・キング(Content is King)です。つまり、「ユーザーにとって良質なコンテンツをつくることが最重要であり、良質なコンテンツさえあれば集客ができる」、という考え方です。

良質なコンテンツが重視される背景にあるのが「人工知能ディープラーニング技術の発展」です。

2-3.ディープラーニング登場:Google検索の良質なコンテンツの判断基準が変化

良質なコンテンツとは、いったい何か? 経験則で判断されることが多い

では、「良質なコンテンツを書けばよい」ということですが、ここで重要になるのは良質なコンテンツとは何か?ということです。
良質なコンテンツを判断する論理的、技術的な根拠がディープラーニングです。

コンテンツマーケティングの専門家は、良質なコンテンツについて、下記のようなことをいいます。

  • コンテンツとは見た人の生活の質をあげるもの
  • ユーザーの知りたいニーズを完全に満たす情報を記載する
  • 売ることが目的ではなく徹底的にユーザー目線に立つことが必須である

しかし、この根拠を聞いてみると大抵は経験則です。

「ユーザー目線でコンテンツを書いたら上位を獲得した。だから大事」
「Googleはかなりの精度でコンテンツの質を判断できるようになっている(らしい)」
いわゆる「帰納法」で、過去の成功事例からなんとなく推測した経験則であり、演繹法的に論理立てて根拠を説明されることはありません。

ディープラーニングにより経験則に頼らない論理的・技術的な説明ができる

Googleは人力での作業をとても嫌う企業です。たとえば、Googleニュースで表示されるニュースは、人の判断が全く入らず、コンピュータのアルゴリズムだけで自動的に判断しています。

単なる経験則ではなく、もっと論理的・技術的な根拠はないか、Googleはどのように良質なンテンツを判断しているのでしょうか。たどりついた答えが「ディープラーニング」です。

3.ディープラーニングとは:人工知能の最先端技術

3-1.人工知能の最先端:50年ぶりのブレークスルー技術、ディープラーニング


ディープラーニングとは、日本語では、「深層学習」。人工知能の最先端技術です。

人工知能は人間を超えるか -ディープラーニングの先にあるもの-」の著者で、日本の人工知能会の権威である松尾氏は、ディープラーニングは、人工知能に50年ぶりのブレークスルーをもたらす可能性のある技術といいます。

ディープラーニングは、画期的な技術であることは確かです。しかし、ディープラーニングで何でも解決できるのではないか、ディープラーニングを使った人工知能により、映画のように、コンピュータが人類を滅ぼそうとするのではないか、とディープラーニングに過剰な期待や不安をいだかれることに、著者は不安を感じています。

ディープラーニングで、できることと、ディープラーニングの限界を正しく理解しましょう。

<Wikipedia:「ディープラーニング」より>
「ディープラーニング、深層学習(英: Deep Learning)とは、多層構造のニューラルネットワーク(ディープニューラルネットワーク、英: Deep Neural Network)の機械学習のこと。汎用的な人工知能、いわゆる強い人工知能の実現が期待されている。ディープラーニングの概念・手法は1980年前後からあったが、2010年代にディープラーニングを使った画像認識の研究などから、急速に盛り上がり、三度目の人工知能ブームといわれる」

3-2.ディープラーニングは、ヒトが考えていたコンテンツの価値判断基準をコンピュータが自らつくりだす技術

ディープラーニングとは何でしょうか?誤解をおそれず簡潔にいいます。

ディープラーニングは、「特徴量」つまり、あるものの良し悪しを決めるための、抽象的な価値判断基準を、コンピュータが「自動的に発見する技術」です。

コンピュータの価値判断基準・ルールを考えるのはヒト

具体例で考えてみましょう。
かつて、Googleが検索順位の重みとして重視していた価値判断基準(特徴量)は、リンクの数と質でした。

コンピュータは、人が価値判断基準のルールさえ与えれば、無限ともいえる計算力で適切な答えを導き出します。しかし、ほかのページからのリンクが多いほどコンテンツの質が高い、という価値判断基準・ルールを考えたのはヒトです。

価値判断基準・ルール自体をコンピュータが自動的に作れるのがディープラーニングの特徴

コンピュータは、単純作業は得意分野です。しかし、計算するためのルールをつくる、価値判断基準をつくるという、抽象化の作業は、これまでは、あくまでヒトがおこなう領域でした。

このヒトの判断に依存してきた、特徴量といわれる抽象的な価値判断基準の設定を、ヒトが介在せず自動的に生み出す技術が「ディープラーニング」です。

ディープラーニングが、コンピュータ・人工知能の歴史のなかで、どんなにすごいブレークスルーかがわかってきます。

4.ディープラーニングをGoogle検索技術が使う意味

4-1.ディープラーニングによりGoogle検索エンジンが獲得した「ネコの概念」

ディープラーニングにより、コンピュータがネコの概念を人間に頼らずに画像認識できた

2012年6月、Googleはネコの画像を自動認識できた、という研究成果を発表しました(関連記事)。
コンピュータが「ネコという概念」を自らつくり出し画像認識できました。ネコの概念を獲得するのに使われた技術がディープラーニングです。

「なんだ、たいしたことではないではないか」と思う方もいるかもしれません。「ネコの画像を見てネコと認識すること。」人間なら簡単なことです。しかし、これはコンピュータにとっては、とても難しい作業です。

抽象概念の獲得は、ディープラーニング技術以前のコンピュータでは困難だった

ディープラーニングが、なぜブレークスルー技術なのか?この例では、一見、簡単そうにみえるネコの画像認識は、コンピュータにとっては、なぜ難しいのでしょうか?

なぜなら、ネコには「白いネコもいれば黒いネコもいる」「大きいネコ小さいネコ」「毛が長いネコ短いネコ」、一匹一匹のネコは少しずつ違いますがすべて「ネコ」です。さらに、どうイヌと違うのでしょうか? あるいは、どうライオンと違うのでしょうか?

たとえば、「ネコを一度も見たことがないヒトに対してネコの概念を間違いなく伝える文章を書いてください」といわれると相当難しいでしょう。

つまり、抽象的な概念をコンピュータにルール化して教えることはとても難しいことなのです。

しかし、ディープラーニングがあれば、ヒトがルールを教えなくても自動的にコンテンツの抽象概念を理解してくれます。

4-2.Google検索は、ディープラーニングで、どの程度コンテンツの良し悪しがわかるか?

「Google検索のアルゴリズムのひとつに、ディープラーニングが活用されている。」

ここから想定すると、ディープラーニング技術により、Google検索アルゴリズムは、以下のようなレベルの抽象的な、日本語理解、自然言語の概念理解は、獲得しているはずです。

ディープラーニングでできること予測

  • 見た目が読みやすい文章か読みにくいか文章かや、見やすいページか見みにくページかは判断できる
  • 文章の流れとして、ロジックとしてとおっている、とおっていないは判別できる
  • 独自性のあるオリジナル記事と、ほかの記事のコピペのオリジナリティのない文章との違いは認識できる
  • 文法的に正しい文章と正しくない文章や誤字脱字がある文章は認識できる

どのレベルまで判断できるかの予測は難しいところですが、ディープラーニングで、何らかの抽象概念、つまり、「人手を介さずコンピュータが自動的に生成したコンテンツの良し悪しに関する特徴量」を使って良質なコンテンツの価値判断基準に使っているはずです。

5.ディープラーニングにできることを理解し、良質なコンテンツを書く

そう考えると、よいコンテンツとは何かの概念が、ディープラーニングの理解をとおして単なる経験則以上に根拠をもって見えてきます。

5-1.ディープラーニングで判断できる良質なコンテンツ

コンテンツマーケティングの専門家は、ユーザーにとって役立つ文章であるという概念意外に、「見た目が読みやすいかどうか」「日本語の細かい言い回しの違和感やミスがないか」までをかなり気にしているようです。

Googleは、このヒトだけがおこなっていた抽象的なコンテンツの良し悪しまで、すでにディープラーニングを使って判別できていると考えるのが妥当でしょう。

つまり、「コンテンツマーケティングをおこなう」とは、ディープラーニングの技術レベルを意識してコンテンツを書く必要があるということです。

5-2.逆に、現在のディープラーニングでは判別できない「良質なコンテンツ」とは

コンピュータが認識したネコの概念は画像認識に過ぎない

一方、逆に「ディープラーニングで、今はまだできていないこと」にも注目すべきです。

先の日本の人工知能権威である松尾氏によると、ディープラーニングは人口知能の大きなブレークスルーであるものの、まだまだ研究の余地がたくさん残された段階だそうです。

たとえば、先ほどのディープラーニングによるGoogleアルゴリズムのネコの概念の認識。今回の研究成果はあくまで「画像としてのネコ」を認識できたに過ぎません。

ディープラーニングが、自然言語が理解できる技術レベルに達するのは10年先

「『ニャーオ』と鳴く動物は、ネコである。」「ネコは気まぐれである(と思われている)。」「ネコは、かわいい。」

このようなヒトならではの抽象的な概念は、ディープラーニングをもってしても、まだ判断できる技術レベルにありません。

人工知能研究のなかで、「自然言語の概念理解」は、現在のディープラーニングの何ステップも先の話、時期でいうと2025年ごろが、ひとつの目安だそうです。

現在でも、自動翻訳など、自然言語処理技術は、かなり進んでいますが、意味を理解しているわけではなく、単語や文章を1対1に機械的に変換しているだけです。コンピュータが「言語の概念」を理解しているわけではないのです。

たとえば、ディープラーニングを駆使しても、現時点のコンピュータが「シェークスピアの文章に、感動を覚える」ことはないでしょう。あるいは「このWeb記事、電車のなかで読んだら思わず吹いた」という類いのユーモアのあるコンテンツもディープラーニングを使っても理解できないでしょう。

このように、ディープラーニングにより、コンピュータが価値判断基準を自ら手に入れられるようになったものの、まだごく一部の領域です。まだ、ディープラーニングが、ヒトのレベルの抽象概念獲得できるには、ほど遠いのです。

5-3.ディープラーニングを意識して「良質なコンテンツ」を書く

「ディープラーニングの実力の現在値とコンテンツマーケティングの関係」を知ることは、コンテンツマーケティングに関わっている方、これからコンテンツマーケティングをおこないたい方にとって、重要となります。

  • Google検索技術には、確実にディープラーニングが使われている。そのため、ディープラーニングの理解は、コンテンツマーケティングに重要。
  • ディープラーニングの技術は、検索エンジンにとっても画期的技術である。しかし、また、コンテンツの種類により、判断できる特徴、判断できない特徴があり、まだまだヒトの理解には及ばない。
  • ディープラーニングが、「判断できること」「判断できない」ことがわかればGoogle検索が、どんなコンテンツを「良質なコンテンツ」を判断しているかがわかるはず。
  • ディープラーニングの現在値を知り、「良質なコンテンツ」を書けば、コンテンツマーケティングに有効。

6.Google検索技術を論理的・科学的に理解して良い日本語を書く

「コンテンツマーケティングを行うために、どのようにコンテンツライティングを行うべきか?」

そのために、ディープラーニングができることから、Google検索の自然言語処理(日本語処理)能力を予想しました。この自然言語処理能力に合わせた、コンテンツライティング方法について分析しましたので、コンテンツマーケティング実施に興味のある方は、下記のコラムも合わせて参照ください。

まとめ

  1. 現在のWebマーケティングのトレンドにコンテンツマーケティングがある
  2. ディープラーニングによって、Google検索にとって、良質なコンテンツの意味が変わった
  3. ディープラーニングは、人工知能のブレークスルー。しかし、限界もある
  4. Google検索技術に、ディープラーニングが活用されることは、コンテンツマーケティングに影響を与える
  5. ディープラーニングにできることの現在値を意識すると、コンテンツマーケティングに重要な良質なコンテンツを書ける

※2016/1/23追記:本コラムがはてなブックマークの「テクノロジー>ディープラーニング」の項目に載りました。ありがとうございます!


参考情報

1.ディープラーニング参考図書

2.海老原一司のコラムシリーズ一覧


海老原一司:シナプスコンサルタント

シナプスでは、主にBtoBマーケティング領域を担当。大手企業、ベンチャーなど、事業会社4社、10年の新規事業、新商品プロジェクトマネージャ経験を経て現職。

新規事業現場でプロジェクト推進してきた、現場感のある、マーケティング・事業推進の裏ワザ系コラムが得意分野。また、理工学修士×MBAの経験を活かした、テクニカル系、サイエンス系のコラムも執筆中。


BtoBマーケティング、法人営業の裏ワザコラムシリーズ


理工修士×MBAのテクニカル系コラムシリーズ


人材育成担当者必見のメールマガジン「トレメル」のご案内

創業以来18年、株式会社シナプスは、企業の研修企画、運営を数多くお手伝いするなかで、人材育成ナレッジを豊富に蓄積してきました。そうした独自のナレッジを集大成して、人材育成ご担当者に贈る「研修企画、運営の成功のメソッド」。

それが、シナプスの人材トレーニングナレッジメール【トレメル】です。

ご購読をご希望の方は
http://cyber-synapse.com/lp/tramel.html
からか、もしくは、以下のバナーをクリックしてください。



シェアする