webコンテンツを書く人が知るべき日本語理解フレームワーク

よいwebコンテンツを書くための正しい日本語理解。英語と日本語の言語特性にも触れながら解説します。

今回は、「なぜ、よいwebコンテンツを書くため正しい日本語理解が必要か」と題して、Google検索の日本語力、言語処理能力とwebコンテンツのため正しい日本語を理解します。

良質なwebコンテンツの成否を分ける日本語術

コンテンツマーケティングでいう「良質なwebコンテンツ」とは、専門性・オリジナリティなどが大前提として必要です。加えて、重要なのが「日本語文章としてのわかりやすさ」です。webコンテンツの内容が良くても、わかりにくければ読み手は、読んでくれません。そして、Google検索は、ディープラーニングなどの技術により「webコンテンツの日本語のわかりやすさ」まで判断しています。

1.webコンテンツ日本語分析技術

1-1.自然言語処理能力は発展途上

検索には、「コンテンツの中身を理解する能力」=自然言語処理能力が必要です。webコンテンツは、いわゆる「自然言語」で書かれています。

自然言語処理技術は、近年は、人工知能の発展、ディープラーニング技術で大きく前進しました。しかし、Google翻訳などコンピュータによる「機械翻訳」を体験すればわかりますが、まだまだ「人間の言語力には及ばない」のが実情です。


1-2.Google検索は英語のネイティブスピーカー


Google検索=英語ネイティブ

「Google検索は、英語のネイティブスピーカー」です。もちろんGoogle検索は、世界中で使われますが、言語ごとに「得意/不得意」はあるはずです。

  • 日本語コンテンツは英語より難しい
  • 世界のwebコンテンツの多くは英語

1-3.webコンテンツのための日本語理解フレームワーク


まず、日本語理解の適切なフレームワークはなんでしょうか。ここではシンプルに「日本語の単位」を使います。

正しい日本語理解のための5つの日本語単位

「日本語の単位」は、「文章」「段落」「文」「文節」「単語」の5つに分けられます。「日本語のwebコンテンツを書く」とは、言い換えれば「文章」「段落」「文」「文節」「単語」を書くことです。

【コンテンツマーケティングのための「日本語の単位」】
私たちが普段書いている日本語は、5つの単位に分けて考えることができます。
「文章」「段落」「文」「文節」「単語」です。
※マナペディアより

2.Google検索力からよい日本語コンテンツの判断基準を知る

「文章」「段落」「文」「文節」「単語」。
この5つの日本語の単位、それぞれについて、ディープラーニングの最新動向も踏まえたGoogle検索の日本語力、コンテンツ理解力を考察します。Google検索の日本語コンテンツ理解力を把握することで、コンテンツマーケティングの文脈にそった、「Google検索にとっての良質なwebコンテンツ」が書けます。

2-1.webコンテンツのための日本語理解「単語」

Google検索の日本語コンテンツに対する「単語」理解はかなり高いはずです。理由は簡単、「Google日本語入力」というソフトウェアがあるからです。

2-1-1.webコンテンツのための日本語「単語」とは

<単語>
意味を、持つ言葉で、これ以上分解できない最小単位のことを「単語」と言います。
「明日は雨が降ると思うよ」という文ですが、これを単語で区切ってみます。
「明日/は/雨/が/降る/と/思う/よ」
※マナペディアより

2-1-2.Google検索は、かなり正確に「単語」を理解している

Google検索の日本語コンテンツに対する、「単語力」は、かなり正確です。それは、Googleが日本語変換ソフトウェア「Google日本語入力」で日々単語力を磨いているからです。「Google日本語入力」のユーザーは、新しい単語を登録したり、単語の誤変換を直したりと、日々Googleにフィードバックを与えています。この「Google日本語入力」のノウハウがGoogle検索にも応用されているはずです。そのため、Google検索の日本語の「単語」は、かなり正確で良質なコンテンツの判断に活かしているでしょう。

2-2.EBコンテンツのための日本語理解「文」

Google検索は、かなり正確にコンテンツの「文」を理解しているはずです。これも、理由は簡単、文の区切りは、コンピュータにとって区別しやすいからです。

2-2-1.WEBライティングのための「文」とは

<文>
句点「。」で区切られているものを文と言います。 すぐ上の文章「句点~言います。」これが1文ですね
※マナペディアより

2-2-2.Google検索は、かなり正確に「文」を理解している

Google検索の日本語コンテンツ「文」の理解度は、かなり正確なはずです。
これは、難しく考える必要はありません。理由は簡単です。日本語の文は「。」で区切られているからです。コンピュータのアルゴリズムにとって、「決まった法則がある」というのは、とても扱いやすいものです。
「。」があれば文の区切りである
このルールは、コンテンツを読む時に、Google検索は確実に認識しているでしょう。

2-3.webコンテンツのための日本語理解「文節」

Google検索は、日本語コンテンツの「文節」力は低いと考えます。文節の区切りは、日本語で難しい領域です。これは、「Google日本語入力」を使ってみれば明らかです。変換性能にかなり不満を感じている人も多いのではないでしょうか。

2-3-1.webライティングのための「文節」とは

<文節>
文の意味をできるだけ短く区切った一区切りを文節と言います。
たとえば、「明日は雨が降ると思うよ」という文章を文節に区切ってみます。「明日は(ね)/雨が(ね)/降ると(ね)/思うよ(ね)」
「ね」を入れて自然に切れるところが分節の切れ目となります
※マナペディアより

2-3-2.Google検索は、「文節」の理解度は低い

Google検索の、日本語コンテンツの「文節」理解度は低いはずです。これは「Google日本語入力」を使ったことがある人なら、今の実力値があまり高くないことが想像できるでしょう。「。」があるという、コンピュータにわかりやすい目印がある「文」に比べて、「文節」の理解は、ルール化が大変です。これは、日本語を学習する外国人も苦労するところです。

つまり、「文節」については、ディープラーニングなどの機械学習を駆使しても、良質なコンテンツ判断には使いにくいはずです。逆に、コンテンツマーケティングにおいては、ライティングする側が、Google検索の理解を補ってWEBライティングをする必要があります。

2-4.webコンテンツのための日本語理解「段落」

Google検索は、日本語コンテンツの「段落」理解度はかなり高いはずです。句読点と同様に、「改行があれば段落である」というルールを学習していればよいだけです。

2-4-1.webライティングのための「段落」とは

<段落>
文章中に、書き出しが一段下げて始まっている箇所があるかと思います。
一段下げた箇所から次の一段下げた箇所までの1ブロックのことを段落と言います。
※マナペディアより

2-4-2.かなり正確に「段落」を理解しているはず。ただし、ライティング次第

Google検索の日本語コンテンツの「段落」理解度はかなり高いはずです。これは、単純に、改行し空白行を入れれば、コンピュータは正確に認識するでしょう。
ただし、「コンテンツの文脈を理解した上で、段落の区別を判断しているわけではない」ということは理解しておくべきでしょう。

段落の区切りは、コンテンツの質の判断には利用されないでしょう。しかし、このルールを無視したWEBライティングは、書き手の意図通りの段落構成でGoogle検索に認識されない可能性が高いです。
意図と異なるコンテンツ解釈がなされれば、検索ユーザーとのコンテンツマッチング度が低くなり、コンテンツマーケティングにマイナス影響を与えるでしょう。

2-5.WEBコンテンツのための日本語理解「文章」

Google検索の、コンテンツの「文章」に対する日本語力はどのくらいでしょうか? これは、ディープラーニングなどの技術革新により、近年かなり精度が向上してきているものの、理解度は高くはないと思います。
※コラム「ディープラーニングが生んだコンテンツマーケティング」参照

2-5-1.webライティングのための「文章」とは

<文章>
文章とは、言葉の中で最も大きい単位です。 わかりやすく言うと、単行本の最初~最後、これが文章です。
※マナペディアより

「コンテンツマーケティング」の観点からすると、「『文章』とは、ホームページの記事1ページのこと」と考えるとわかりやすいでしょう。

2-5-2.「文章」理解力は低い。うまくライティングして伝える必要がある

ディープラーニングを駆使しても、Google検索の「文章」の理解度はあまり高くはないはずです。
もちろん、「どこが文章のはじめで」「どこが文章の終わりか」は、程度は正確に認識しているでしょう。しかし、文章の流れの理解、文脈の理解は、していないはずです。今のディープラーニングは、そのレベルまで達していません。

文章の流れ、文脈を理解していないのですから、うまくWEBライティングして伝えなければ、「ヒトがみたら良質なコンテンツなのに、Google検索には理解されない」ということが起こります。

3.正しい日本語理解で、よいwebコンテンツを書く

Google検索の自然言語処理能力=日本語力から、webライティングについて考察しました。Google検索の日本語力は、まだ「来日2,3年目の日本語ノンネイティブ」レベルです。これらのディープラーニングなどの技術動向知識を踏まえて、正しく「良質なwebコンテンツ」と理解してもらうwebライティングのコツを考えます。

3-1.良質なwebコンテンツの「単語」表記は正確に

「単語」を正確に理解しているとすると、コンテンツマーケティングのライティング時には、何を意識する必要があるでしょうか。

  • 「誤字脱字」に注意しましょう。日本語の誤字脱字があれば、そのページは質が低いコンテンツと見なされます。
  • 「日本語単語表記は統一」する。「一戸建て」と「一戸建」。「表記が統一されていない」ということは、確実に認識するはずです。誤字脱字ほどではないですが、コンテンツの質が低いと認識されるでしょう。

3-2.良質なwebコンテンツは「文」の区切りがわかりやすい

「文」についても、かなり正確に理解し、コンテンツの質の判断に活かしているはずです。

Google検索が、「文」を正確に理解しているとすると、コンテンツマーケティングのライティング時には、何を意識する必要があるでしょうか。

  • webライティング時は、文は適度に、「。」で区切る。「『。』があることが文の区切りである。」、と認識しているのであれば、1文の長さは正確にカウントしているでしょう。ここで、Google検索が、「1文が長い文は読みにくい」というルールを学習していれば、1文が長いページは、質の低いコンテンツと見なされるはずです。

3-3.「文節」をわかり易くするため適度に読点「、」を使う

「文節」の理解度が低いとするとコンテンツマーケティングのライティング時には、何を意識する必要があるでしょうか。

WEBライティング時は、1文は適度に、句点「、」で区切る

「文」で述べたように、「。」があれば文の区切りである、というのは、コンピュータにとってわかりやすいルールです。同様に、句点「、」があることは、区切りとして明確に認識することでしょう。
とすれば、1文の中で適度に句点を使い、意味の区切りを正確に伝えることが有効です。特に、コンピュータが文節を取り違えそうな場合は、句点を使って、意味の区切りをはっきりとわかるようコンテンツライティングするべきでしょう。

3-4.良質なwebコンテンツは「段落」がわかりやすい

「『段落』の理解度は高い。しかし、形式としての理解であり、意味、文脈を理解しているわけではない。」こう考えると、コンテンツマーケティングのライティング時には、何を意識する必要があるでしょうか。

コンテンツライティング時は、段落は「コンピュータがわかる」日本語で

「段落理解が、形式的理解であり、意味、文脈を理解しているわけではない。」とすれば、コンピュータにわかりやすく、明示的に段落の区切りをわかるように伝えるべきです。段落の区切りには、改行と空白行を入れましょう。これは、人間にとって読みやすい文章のセオリーでもあります。

一方、注意するべきところもありそうです。もし、この「改行と空白行があると段落の区切りである。」というルールをGoogle検索が学習しているなら、不必要に改行や空白行を入れると、同じ文脈でライティングしたつもりでも、「別の段落」と認識される可能性があります。

3-5.「文章」の流れは「見出し」で明示するのが良質なwebコンテンツ

「『文章』理解度は高くない。文章の流れの理解、文脈の理解は、していない。」とすると、コンテンツマーケティングのライティング時には、何を意識する必要があるでしょうか。

webライティング時は、文章の流れは、見出しで明示

文章の流れ、文脈は、ヒトだけが理解できる領域であり、ルール化が難しく、コンピュータには理解しにくいでしょう。とすれば、文章の流れ、文脈をコンピュータに明示するとよいでしょう。コンテンツマーケティングにおいては、ヘッダーをうまく利用して見出しを書くことが重要です。

たとえば、ブラウザ画面には表示されませんがでは、見出しは、下記のようなタグで明示的に書きます。
<h1>見出し1</h1>
<h2>見出し2</h2>
文章の流れ、文脈を理解できなくても、このように見出しをヘッダーで明示すれば、コンピュータは、正確に理解するはずです。

まとめ

「なぜ、よいwebコンテンツを書くため正しい日本語理解が必要か」日本語の言語から分析し「どのような日本語webコンテンツが、良質なコンテンツと判断されやすいか」を考察しました。

Google検索の日本語力を理解すれば、良質なコンテンツが書ける確率は高まります。順位付けの方法は詳細公開されていませんが、科学技術動向を元に論理的に考えれば「Google検索にとって良質なwebコンテンツ」が見えてきます。本コラムの書き方を参考に、ぜひ実際に「良質なコンテンツ」を書いてください。

 


 

参考情報

デジタルマーケティングを学ぶ企業研修

デジタルマーケティング基礎研修は、現代のプロモーション実行に必須となったデジタルマーケティング基礎を体系的に理解する研修です。

「ソーシャルメディア」「ビックデータ(データ活用)」「オウンドメディア」など、デジタルの体系的基礎とデジタルの最新動向を、デジタルマーケティングの実務家が教える企業研修です。

研修プログラムの詳細は 『「デジタルマーケティング基礎研修」-プロが教える体系知識』をご覧ください。


他のマーケティングと戦略スキルのコラム