理系修士マーケターのシナプス海老原です。

今回は、「Google検索で上位をとるWEBライティングの日本語」と題して、Google検索の日本語力、自然言語処理能力を最新技術動向から科学的に分析します。

そのうえで、Google検索が良質なコンテンツと判断しやすいよう、「Google検索で上位をとるWEBライティングの日本語術」を考察します。

WEBライティングの秘訣はGoogle検索に良質なコンテンツと判断されること

近年コンテンツマーケティング成功には、「良質なコンテンツを書くしかない」といわれます。

では、「良質なコンテンツ」とはなんでしょうか?インターネット検索シェアから考えると、「良質なコンテンツと判断するのはGoogleである」と考えて良いでしょう。

理系マーケターの海老原が、科学的にGoogle検索の日本語力を分析し、Google検索が良質なコンテンツと判断しやすい日本語術を考えます。

WEBライティングの成否を分ける日本語術

コンテンツマーケティングでいう「良質なコンテンツ」とは、専門性・オリジナリティなどは、確実に必要です。

加えてもう一つ重要なのは「日本語文章としての読みやすさ、わかりやすさ」です。

どんなに内容が良くても、読みにくければ、読んでくれません。これは、ビジネスドキュメントと同様です。そして、Google検索は、確実に「日本語の読みやすさ、わかりやすさ」まで判断しています。

1.Google検索の日本語処理技術を科学的に分析

1-1.自然言語処理能力は発展途上

1-1-1.検索技術の基本はンピュータが自然言語を理解すること

検索には、「コンテンツの中身を理解する能力」=自然言語処理能力が必要です。WEBコンテンツは、いわゆる「自然言語」(プログラムは、「コンピュータ言語」)で書かれています。「自然言語処理」は、人工知能の大きな研究テーマの一つです。

1-1-2.自然言語処理は、ディープラーニングで向上したが、まだ人間には及ばない

自然言語処理技術は、近年は、人工知能の発展、ディープラーニング技術で大きく前進しました。しかし、Google翻訳などコンピュータによる「機械翻訳」を体験すればわかりますが、まだまだ「人間の言語力には及ばない」のが実情です。


1-2.Google検索は英語のネイティブスピーカー


Google検索=英語ネイティブ

「Google検索は、英語のネイティブスピーカー」です。もちろんGoogle検索は、世界中で使われますが、言語ごとに「得意/不得意」はあるはずです。


日本語は英語より難しい


自然言語処理で特に問題なのは日本語の文法の違いでしょう。コンピュータにとって、「単語を覚えるのは簡単」です。しかし、特に曖昧で複雑とされる日本語の文法処理は厄介です。

WEBコンテンツの多くは英語

世界では多くの情報は英語で書かれています。元情報が多い言語ほど処理精度が高まりますし、英語圏からのフィードバックの方が日本語圏より圧倒的に多いはずです。

1-3.Google検索の日本語力分析フレームワーク

まず、Google検索の日本語力を分析するうえで、適切なフレームワークはなんでしょうか。これは、可能な限りシステマティックで、機械的なフレームワークを選ぶべきです。ここでは「日本語の単位」を使います。

自然言語能力把握のための日本語の5つの単位

「日本語の単位」は、「文章」「段落」「文」「文節」「単語」の5つに分けられます。

「日本語のWEBライティング」とは、言い換えれば「文章」「段落」「文」「文節」「単語」を書くことです。

【コンテンツマーケティングのための「日本語の単位」】
私たちが普段書いている日本語は、5つの単位に分けて考えることができます。
「文章」「段落」「文」「文節」「単語」です。
※マナペディアより

2.Google検索の日本語力から良質なコンテンツの判断基準を知る

「文章」「段落」「文」「文節」「単語」。
この5つの日本語の単位、それぞれについて、ディープラーニングの最新動向も踏まえたGoogle検索の日本語力、コンテンツ理解力を考察します。
Google検索の日本語力を把握することにより、コンテンツマーケティングの文脈にそった、「Google検索にとっての良質なWEBライティング」ができます。

2-1.Google検索と日本語の「単語」

Google検索の日本語コンテンツに対する「単語」理解はかなり高いはずです。理由は簡単、「Google日本語入力」というソフトウェアがあるからです。

2-1-1.WEBライティングのための「単語」とは

<単語>
意味を、持つ言葉で、これ以上分解できない最小単位のことを「単語」と言います。
「明日は雨が降ると思うよ」という文ですが、これを単語で区切ってみます。
「明日/は/雨/が/降る/と/思う/よ」
※マナペディアより

2-1-2.Google検索は、かなり正確に「単語」を理解している

Google検索の日本語コンテンツに対する、「単語力」は、かなり正確です。それは、Googleが日本語変換ソフトウェア「Google日本語入力」で日々単語力を磨いているからです。

「Google日本語入力」のユーザーは、新しい単語を登録したり、単語の誤変換を直したりと、日々Googleにフィードバックを与えています。この「Google日本語入力」のノウハウがGoogle検索にも応用されているはずです。そのため、Google検索の日本語の「単語」は、かなり正確で良質なコンテンツの判断に活かしているでしょう。

Google日本語入力
Google社のHPより

2-2.Google検索の日本語コンテンツ理解力「文」

Google検索は、かなり正確にコンテンツの「文」を理解しているはずです。これも、理由は簡単、文の区切りは、コンピュータにとって区別しやすいからです。

2-2-1.WEBライティングのための「文」とは

<文>
句点「。」で区切られているものを文と言います。 すぐ上の文章「句点~言います。」これが1文ですね
※マナペディアより

2-2-2.Google検索は、かなり正確に「文」を理解している

Google検索の日本語コンテンツ「文」の理解度は、かなり正確なはずです。
これは、難しく考える必要はありません。理由は簡単です。日本語の文は「。」で区切られているからです。コンピュータのアルゴリズムにとって、「決まった法則がある」というのは、とても扱いやすいものです。
「。」があれば文の区切りである
このルールは、コンテンツを読む時に、Google検索は確実に認識しているでしょう。

2-3.Google検索の日本語コンテンツ理解力「文節」

Google検索は、日本語コンテンツの「文節」力は低いと考えます。文節の区切りは、日本語で難しい領域です。これは、「Google日本語入力」を使ってみれば明らかです。変換性能にかなり不満を感じている人も多いのではないでしょうか。

2-3-1.WEBライティングのための「文節」とは

<文節>
文の意味をできるだけ短く区切った一区切りを文節と言います。
たとえば、「明日は雨が降ると思うよ」という文章を文節に区切ってみます。「明日は(ね)/雨が(ね)/降ると(ね)/思うよ(ね)」
「ね」を入れて自然に切れるところが分節の切れ目となります
※マナペディアより

2-3-2.Google検索は、「文節」の理解度は低い

Google検索の、日本語コンテンツの「文節」理解度は低いはずです。これは「Google日本語入力」を使ったことがある人なら、今の実力値があまり高くないことが想像できるでしょう。「。」があるという、コンピュータにわかりやすい目印がある「文」に比べて、「文節」の理解は、ルール化が大変です。これは、日本語を学習する外国人も苦労するところです。

つまり、「文節」については、ディープラーニングなどの機械学習を駆使しても、良質なコンテンツ判断には使いにくいはずです。逆に、コンテンツマーケティングにおいては、ライティングする側が、Google検索の理解を補ってWEBライティングをする必要があります。

2-4.Google検索の日本語コンテンツ理解力「段落」

Google検索は、日本語コンテンツの「段落」理解度はかなり高いはずです。句読点と同様に、「改行があれば段落である」というルールを学習していればよいだけです。

2-4-1.WEBライティングのための「段落」とは

<段落>
文章中に、書き出しが一段下げて始まっている箇所があるかと思います。
一段下げた箇所から次の一段下げた箇所までの1ブロックのことを段落と言います。
※マナペディアより

2-4-2.かなり正確に「段落」を理解しているはず。ただし、ライティング次第

Google検索の日本語コンテンツの「段落」理解度はかなり高いはずです。これは、単純に、改行し空白行を入れれば、コンピュータは正確に認識するでしょう。
ただし、「コンテンツの文脈を理解した上で、段落の区別を判断しているわけではない」ということは理解しておくべきでしょう。

段落の区切りは、コンテンツの質の判断には利用されないでしょう。しかし、このルールを無視したWEBライティングは、書き手の意図通りの段落構成でGoogle検索に認識されない可能性が高いです。
意図と異なるコンテンツ解釈がなされれば、検索ユーザーとのコンテンツマッチング度が低くなり、コンテンツマーケティングにマイナス影響を与えるでしょう。

2-5.Google検索の日本語コンテンツ理解力「文章」

Google検索の、コンテンツの「文章」に対する日本語力はどのくらいでしょうか? これは、ディープラーニングなどの技術革新により、近年かなり精度が向上してきているものの、理解度は高くはないと思います。
※コラム「ディープラーニングが生んだコンテンツマーケティング」参照

2-5-1.WEBライティングのための「文章」とは

<文章>
文章とは、言葉の中で最も大きい単位です。 わかりやすく言うと、単行本の最初~最後、これが文章です。
※マナペディアより

「コンテンツマーケティング」の観点からすると、「『文章』とは、ホームページの記事1ページのこと」と考えるとわかりやすいでしょう。

2-5-2.「文章」理解力は低い。うまくライティングして伝える必要がある

ディープラーニングを駆使しても、Google検索の「文章」の理解度はあまり高くはないはずです。
もちろん、「どこが文章のはじめで」「どこが文章の終わりか」は、程度は正確に認識しているでしょう。しかし、文章の流れの理解、文脈の理解は、していないはずです。今のディープラーニングは、そのレベルまで達していません。

文章の流れ、文脈を理解していないのですから、うまくWEBライティングして伝えなければ、「ヒトがみたら良質なコンテンツなのに、Google検索には理解されない」ということが起こります。

3.Google検索が良質なコンテンツと判断する日本語の書き方

Google検索の自然言語処理能力=日本語力から、WEBライティングについて考察しました。Google検索の日本語力は、まだ「来日2,3年目のアメリカ人」レベルです。これらのディープラーニングなどの技術動向知識を踏まえて、正しく「良質なコンテンツ」と理解してもらうWEBライティングのコツを考えます。

3-1.単語」表記は、正確でなければならない

「単語」を正確に理解しているとすると、コンテンツマーケティングのライティング時には、何を意識する必要があるでしょうか。

  • WEBライティング時は、「誤字脱字」に注意
    誤字脱字は、かなりの精度で特定されるでしょう。ページ当たりの誤字脱字の数まで正確に把握するはずです。誤字脱字があれば、そのページを質が低いコンテンツと見なすでしょう。
  • WEBライティング時は、「単語表記は統一」する
    「一戸建て」と「一戸建」。どちらも正しい日本語です。おそらく、ふたつは、同じ意味の単語であると認識するでしょう。しかし、「表記が統一されていない」ということは、確実に認識するはずです。誤字脱字ほどではないですが、コンテンツの質が低いと認識されるでしょう。

3-2.コンピュータが理解しやすい「文」を意識して書く

「文」についても、かなり正確に理解し、コンテンツの質の判断に活かしているはずです。

Google検索が、「文」を正確に理解しているとすると、コンテンツマーケティングのライティング時には、何を意識する必要があるでしょうか。

  • WEBライティング時は、文は適度に、「。」で区切る
    「『。』があることが文の区切りである。」、と認識しているのであれば、1文の長さは正確にカウントしているでしょう。ここで、Google検索が、「1文が長い文は読みにくい」というルールを学習していれば、1文が長いページは、質の低いコンテンツと見なされるはずです。

3-3.「文節」をGoogleに理解し易くするため適度に読点「、」を使う

「文節」の理解度が低いとするとコンテンツマーケティングのライティング時には、何を意識する必要があるでしょうか。

WEBライティング時は、1文は適度に、句点「、」で区切る

「文」で述べたように、「。」があれば文の区切りである、というのは、コンピュータにとってわかりやすいルールです。同様に、句点「、」があることは、区切りとして明確に認識することでしょう。
とすれば、1文の中で適度に句点を使い、意味の区切りを正確に伝えることが有効です。特に、コンピュータが文節を取り違えそうな場合は、句点を使って、意味の区切りをはっきりとわかるようコンテンツライティングするべきでしょう。

3-4.コンピュータにわかりやすく、「段落」を明示する

「『段落』の理解度は高い。しかし、形式としての理解であり、意味、文脈を理解しているわけではない。」こう考えると、コンテンツマーケティングのライティング時には、何を意識する必要があるでしょうか。

コンテンツライティング時は、段落は「コンピュータがわかる」ようにライティング

「段落理解が、形式的理解であり、意味、文脈を理解しているわけではない。」とすれば、コンピュータにわかりやすく、明示的に段落の区切りをわかるように伝えるべきです。段落の区切りには、改行と空白行を入れましょう。これは、人間にとって読みやすい文章のセオリーでもあります。

一方、注意するべきところもありそうです。もし、この「改行と空白行があると段落の区切りである。」というルールをGoogle検索が学習しているなら、不必要に改行や空白行を入れると、同じ文脈でライティングしたつもりでも、「別の段落」と認識される可能性があります。

3-5.「文章」の流れ、文脈は「見出し」で明示してライティング

「『文章』理解度は高くない。文章の流れの理解、文脈の理解は、していない。」とすると、コンテンツマーケティングのライティング時には、何を意識する必要があるでしょうか。

WEBライティング時は、文章の流れは、見出しで明示

文章の流れ、文脈は、ヒトだけが理解できる領域であり、ルール化が難しく、コンピュータには理解しにくいでしょう。
とすれば、文章の流れ、文脈をコンピュータに明示するとよいでしょう。コンテンツマーケティングにおいては、ヘッダーをうまく利用して見出しを書くことが重要です。

たとえば、ブラウザ画面には表示されませんが、htmlでは、見出しは、下記のようなタグで明示的に書きます。
<h1>見出し1</h1>
<h2>見出し2</h2>
文章の流れ、文脈を理解できなくても、このように見出しをヘッダーで明示すれば、コンピュータは、正確に理解するはずです。

まとめ

「Google検索の日本語力はどのくらいか。」を科学的に分析し、「どのような日本語WEBライティングを行えば、Google検索が良質なコンテンツと判断しやすいか」を考察しました。

相手(Google検索)を理解すれば、良質なコンテンツが書ける確率は飛躍的に高まります。

Googleは、検索技術に対し、ディープラーニングをはじめとした最新技術を駆使して日々改良し続けています。そのうえ、アルゴリズムはブラックボックスです。

しかし、最新科学技術動向を元に論理的に考えれば「Google検索にとって良質なWEBコンテンツライティング」が見えてきます。本コラムの書き方を参考に、ぜひ実際に「良質なコンテンツ」を書いてください。


参考情報

1.「ディープラーニング」「人口知能」参考図書

2.海老原一司のシナプスビジネスナレッジコラム


海老原一司:チーフマーケティングコンサルタント
1974年生まれ。早稲田大学理工学部修士課程をへて1999年日本テレコム株式会社入社。IT業界を中心に大企業・ベンチャーなどの事業会社で クラウドサービスなどの10年間以上のプロダクトマネージャ経験を持つ、BtoB事業の新規事業立ち上げ、事業成長のスペシャリスト。プロマネとして新サービスを3年で100倍の売上にした経験を持つ。

2014年シナプス入社。BtoBマーケティングプログラム責任者。
立教大学経営学部講師』(2015年~現在)
グロービス経営大学院(MBA)』(2010年卒)


理工学修士×MBAのテクニカル系コラムシリーズ


3.マーケティングの基本を学ぶ企業研修

マーケティング研修(基礎編)

1万人が受講したマーケティング基礎プログラムです。「マーケティング戦略基本プロセスの流れ」「論理的思考法」「顧客ニーズの本質」を学びます。単なる知識に終わらずマーケティングの実務応用に使える論理的マーケティング思考法を身につけます。「マーケティング戦略思考」を共通言語として組織浸透させるための社員集合研修として最適です。

研修プログラムの詳細は 『「マーケティング研修(基礎編)」-1万人受講の看板講座』をご覧ください。

BtoBマーケティング研修(基礎編)

BtoB企業向けにマーケティング思考の基本を組織共通言語化するための研修です。マーケティング戦略プロセスの流れを抑えつつ、BtoBに精通したコンサルタントが「DMU」「購買プロセス」「経済合理性」など、BtoBマーケティングならではのポイントも解説します。

研修プログラムの詳細は『 「BtoBマーケティング研修(基礎編)」-BtoBプロが教える基本スキル』をご覧ください。


シェアする