コピペチェックとは?コピペチェックの仕組みとツールをライターとメディア運用者に向けて解説

2023/10/04
BtoBマーケティング コピペチェック コピペチェックとは?コピペチェックの仕組みとツールをライターとメディア運用者に向けて解説

オウンドメディアの記事を、外部の制作会社に発注したり、フリーのライターに書いてもらったりする際、必ずしなければいけないのが「コピペチェック」です。

明らかなコピー記事は著作権侵害にあたるのでもちろんダメですが、コピーとは言い切れないものの微妙に似ているような、どこかで見たようなと感じるコンテンツも、読者にとって魅力が薄いだけでなく、「コピペ記事では? 」という印象を持たれ、イメージダウンにつながる可能性があります。

自社のファンを作る、ブランディングにつなげる、リードを生み出すといったオウンドメディアの目的達成のためには、読者に新たな何かを得てもらえる、オリジナリティのあるコンテンツが理想。コピペコンテンツは掲載しないように、あらかじめルールを決めておきましょう。

今回はコピペチェックの重要性、 コピペと引用や転載の違い、有用なコピペチェックツール、発注するときのポイントなどを紹介します。

コピペチェックとは

コピペチェックとは、作成した文章や画像が、他者の作ったもののコピー&ペースト(複製)でないかチェックすることです。

コピペ記事が納品されるのは、ライター側の意識やスキルの問題、近年オウンドメディアが激増し、各社がSEO施策のために似た見出しの記事を書こうとするため結果的に似てしまうなどの理由があります。

加えて最近はAIライティングによりコピーコンテンツが増えていると言われており、AIコンテンツかどうかを検出するツールも登場しています。

コピーコンテンツが容易に生まれやすい環境なので、記事のコピーチェックは必須の工程です。

コピペチェックの仕組み

コピペチェックは、一般にはチェックツールと目視で行います。

ツールによるコピペチェック

ネット上には有料、無料のコピペチェックサービスがあります。

基本的な仕組みは、調べたい文章をツール上に入力しデータベースに保存→クローラーがWeb上のサイトから似たような単語、用語、文節が多く含まれているサイトを見つけ出す→類似度などを数値としてはじき出すというパターンです。

入力されたテキストは、単語、文章、文節などの単位に分割されて、それぞれの類似性が検索されます。テキストの一致度合いが多かったり、一致する文節が長かったりするほど、コピーコンテンツである可能性が高いと判断されます。

ただし、詳細な検出アルゴリズムは各ツールにより異なり、しかも非公開です。基本的な原則は共通しているものの、UIも違えば活用の手順も異なるので、目的にあったツールがどうかが使う側にとって重要になります。

同じ原理で「Google画像検索」を使用すると、オンライン上の同じ画像、似た画像を含むWebサイトを見つけることができます。Google画像検索を利用する際は、Google上の以下のレンズマークをクリックして、検索バーに画像をドラッグ&ドロップするか、画像URLを入力して検索しましょう。

1.Google画像検索

目視によるコピペチェック

目視によるコピペチェックは、主に引用や転載が正しく行われているかをチェックするためです。引用や転載にはルールがあり(後述)、そこを逸脱していると相手にコピペと判断される可能性があります。

また、コピペチェックツールで類似判定が低く出ても、人間の感覚では似たような記事と感じることは少なくありません。多くの場合、テーマの掘り下げが浅かったり、表現方法が平板だったりすることが理由です。そう感じる場合、より良いコンテンツにするために表現を再考してもらうなど、ブラッシュアップすることが大切です。

コピペチェックの重要性

まず、コピペチェックがいかに重要かを解説します。

Googleからのペナルティを回避する

メディアにコピーコンテンツが多く含まれると、コピーされたと思った人や看過できないと思った第三者から削除依頼を出され、その数が増えるとGoogleからペナルティを受ける可能性があります。最悪、削除対象にされるなどコピーコンテンツだけでなくメディア全体に悪影響があります。

単なる重複コンテンツのペナルティ自体はないという記事もありますが、Googleは以下のように不適切コンテンツについての報告を奨励しています。

2.法的な理由でコンテンツを報告する-Legal-ヘルプ

(出典:Google Legalヘルプ

そして、同サイトの著作権ヘルプセンターでは、以下のとおり明記しています。

Google での著作権侵害への措置はシンプルです。Google はデジタル ミレニアム著作権法(DMCA)を遵守しています。この法律に基づき、Google は、正式な通知を受けた場合、適用される著作権法に違反しているコンテンツへのアクセスを無効にすることがあります。

コピペの意図がなかったとしても、結果的に似たコンテンツになっていれば通報されペナルティを受ける可能性があります。

SEOでの低評価を回避する

コピーコンテンツや類似コンテンツの多いサイトは、検索上位に表示されません。Googleは常にアルゴリズムを見直し、できるだけ質の高い記事を上位表示することを考えているので、メディア運営者もめざすべきは、ユーザーに役立つ高品質の記事です。

Google 検索セントラル(旧称 Google ウェブマスター)の上級者向けSEOのページには、「Google では、無断複製されたページやオリジナルのコンテンツがほとんどなくユーザーにとって価値のないページを表示することでランキングに入ろうとするドメインに対して、処置を取ります。」と記載があります。

以下動画も参照ください。

2.  Google 質の低いコンテンツ

(出典:Google

コピーコンテンツは、そのままコピーペーストした原稿だけでなく、語尾の「です」「ます」や、接続詞などを少し変えただけの原稿も対象です。Googleは「無断複製されたコンテンツ」に該当するものとして以下を挙げています。

”他のサイトのコンテンツをコピーし、独自のコンテンツや付加価値を加えることなく転載しているサイト”

”他のサイトのコンテンツをコピーし、(語句を類義語に置き換えたり自動化された手法を使用したりして)若干の修正を加えた上で転載しているサイト”

(引用:Google

オウンドメディア運営者にとって、コピペ原稿とは本末転倒な手段です。

頑張ってオウンドメディアの記事を増やしても、Googleはコピペが多いコンテンツのサイト、他サイトの内容とほぼ同じで表現だけ変えたサイトは低評価→見込み客に読まれない→オウンドメディアを立ち上げて予算を投資した多数の人材の労力がムダ、という結果になってしまうのです。

読者からの信頼喪失を回避する

ご存知の人もいると思いますが、2016年のDeNAキュレーションサイト炎上事件は、オウンドメディア業界に衝撃を与えました。

3.DeNAサイト問題破綻した“下流”キュレーションビジネス-毎日新聞

(出典:「DeNAサイト問題 破綻した“下流”キュレーションビジネス」 - 毎日新聞 2016/12/19

以下のWeb担さんの安田さんの記事では、どのような体制、予備知識のなさが原因だったかを理解しやすく説明しています。オウンドメディア担当者は目を通しておくとよいでしょう。

もちろん、医療情報という人の生死にかかわる情報だから、専門家や読者の方々も看過できなかったというのが炎上の大きな理由でもあるでしょう。

しかし、今、世間の人のITリテラシーは非常に上がっています。コピペだらけのメディアであれば炎上までいかずとも、ブランド力を低下させてしまうリスクは高いでしょう。

BtoBメディアの想定読者は、その業務について学び始めたばかりの人だけでなく、業界のプロ、もしくは新規参入を検討中などバリバリのビジネスマンもいます。中には大手マスコミ、メディアに出てこないような業界のレアな情報、表に出にくいノウハウ、最新ニュースなどをオウンドメディアに期待する人もいるでしょう。

まったく有益でないコンテンツを出せば、そのような記事を出す企業姿勢にガッカリされるのが落ちです。今やコンテンツは企業を評価する有力指標だということを再認識しましょう。

2019年の米国Finances Onlineの統計によると、B2B バイヤーがベンダーを選んだ理由の3位にコンテンツの質が入っています。オンライン上の顔の見えない取引の段階では、コンテンツこそが自社の印象を決めるといっても過言ではありません。

  1. ソリューションとビジネス環境に関するベンダーの知識 (69%)
  2. バイヤーの会社とニーズに関するベンダーの知識 (65%)
  3. およびベンダーが作成したコンテンツを提供する能力 (62%)

B2Bベンダー選択の理由3つ-1

(出典:81 Relevant B2B Statistics: 2021/2022 Market Share Analysis & Data

コピペと転載・引用・パラフレーズの違い

4.著作物が自由に使える場合-文化庁

(出典:文化庁

コピペはよくありませんが、著作物が自由に使える場合もあります。文化庁のサイトでいろいろなケースがまとめられています。

その中で、転載・引用・パラフレーズは表現の世界で認められており、オウンドメディアでもよく使う表現です。ここでは、それぞれのコピペとの違い、転載の仕方や引用の仕方、パラフレーズの仕方について説明します。

コピペと転載の違い

コピペとはコピー&ペーストの略。自分の作成物や他人の情報を、許可なくそのままコピーして貼り付けることです。

転載は、他人の情報や作品を許可を得て、出典を明記しながら再公開することです。また、転載とは文章中の主従関係で、「他者の文章の割合が自分の割合より多くなる紹介」の仕方であり、以下のルールがあります。

【転載のルール】

  • 著作者の転載許可が必要:引用元の著作者が「企業」「個人」の場合は許可をとらなければなりません。
  • 元の文章を改変してはいけない
  • 明瞭区別性が必要(転載した文章が自分の文章と明確に区別されている)

転載する際は、以下のように明確に他者の作成したコンテンツだと区別する必要があります。

  • “ダブルクォーテーション” で囲う
  • 「」で囲む
  • 斜体にする
  • 背景色を変える
  • 出典を明記する

なお、「無断転載禁止」と書かれているサイトは、無断で転載するなという意味であり、転載許可依頼を出すと転載を許可してもらえるケースも少なくありません。転載を希望する場合は転載許諾依頼メールを出しましょう。あらかじめ転載許諾申請フォーマットを用意しているケースもあります。各社のルールは違うため、確認してから所定の方法で依頼するとよいでしょう。

コピペと引用の違い

引用とは、「文章中の主従関係で他者の文章が自分の文章より少ない紹介」の仕方です。

「引用」については、著作権法32条にあるように「公正な慣行に合致」し、「正当な範囲」であれば無断でできます。引用時のルールは以下のとおりです。

  • 元の文章(引用元)を改変しない
  • 転載した文章が自分の文章と明確に区別されている(明瞭区別性)
  • 主従関係(自分の文章の割合が多く、紹介する他者の文章が少ない)

引用と転載は何が違うかというと「主従関係(文中の割合)」です。

  • 転載:紹介している他人の文章が自分の文章より量が多い(主:他者、従:自分)
  • 引用:自分の文章が紹介している他人の文章より多い(主:自分、従:他者)

この主従関係(自分と他者の文章の割合)は、自分の主観ではなく客観的に判断されます。自分は引用のつもりでも、他者から転載と判断される場合があることに留意しましょう。

つまり他者の意見ばかりを紹介して、そこに自分の考察を少し述べるようなコンテンツは、もともと作った本人から見ればパクられたことになるということです。

コピペとパラフレーズの違い

引用や転載以外に、その中で第3者のメッセージをそのまま伝えるのではなく、自分なりに文章を変えて伝える表現を Paraphrase(パラフレーズ)といいます。

例えば、大量の文章をそのまま紹介できないので、要約してまとめて記載する例などです。パラフレーズには以下のルールがあります。

  • 引用元の内容や趣旨を変えてはいけない
  • 引用元の文章を自分の言葉に言い換える
  • 必ず引用元を明記する(参照、参考等)

昨今は自動パラフレーズツールなどもあります。しかし、パラフレーズしても趣旨がほぼ同じであれば結局は引用元のサイトと似てしまいます。

パラフレーズツールは自分の語彙力を補強するくらいの使い方にして、もともとの原稿に自社オリジナルの事例やデータを盛り込み、他にないコンテンツに仕上げると、結果的にパラフレーズした部分も活きてきます。

コピペチェックが行える無料ツール

おすすめのコピペチェックツールを紹介します。

こぴらん

5.無料コピペチェックツール【こぴらん】

(出典:こぴらん

こぴらんは、フォームにコピペチェックしたい文章を貼り付けてチェックボタンを押すだけで、文章を文に分解し、その文が、他サイトやブログ等で転載されていないかを確認できる簡易コピペチェッカーです。

試しに、この記事の「引用と転載のルールの部分」をチェックしてみたところ、以下のように類似数が1のセンテンスを表示してくれました。

6.【こぴらん】の結果

ただ、こぴらんはあくまで簡易チェッカーなので、詳細にコピペチェックしたい場合は有料のコピペリンが推奨されています。有料といっても年間6,600円とリーズナブルです。

CopyContentDetector

7.無料コピペチェックツール【CopyContentDetector】(出典:https://ccd.cloud/

CopyContentDetectoは、株式会社ウェブサークルが提供しているコピペチェックツールです。簡単・正確・安い(無料版あり)の3拍子がそろっています。

無料版でもかなりの文量のコピペチェックができます。操作は簡単で、コピーチェックしたい文章を貼り付けて「チェックする」ボタンを押すだけです。

チェック結果も見やすく「類似率25% 良好」「類似率50%要注意」と表示されます。コンテンツのどの文章がどのサイトのコンテンツと一致しているか、似ているかが赤、黄、青で3色表示されるのですぐわかります。

  • 所要時間:約1~2分
  • 無料版:1回の文字数上限4000文字。登録数:最新10件
  • 有料版:1回の文字数上限8000文字。ワードプレスプラグイン機能、他
    個人向けー登録数により月300 〜6000円 。

法人向けー登録数により月1万978円〜8万8000円のプラン有

chiyo-co

8.無料コピペチェックツール【chiyo-co】(出典:https://kagemusya.biz-samurai.com/

Chiyo-co(ちよこ)は、クラウド型のコピペチェックツールです。以前は「影武者」というサービスでしたが2020年にリニューアル。コピペだけでなく、文章全体、センテンス、キーフレーズベクトル比較によって類似度を判定します。

解析結果として、「総合類似率」「文章の内容の類似箇所」「キーフレーズ」の類似率が表示され、さらに類似している箇所がピンクに色付けされて並列に表示されるため、直感的にどのくらい類似しているかが見比べられます。

月額料金 

  • フリープラン  10 カウント 0円
  • プラン100   100カウント 4400円  
  • プラン500   500カウント  1万6500円
  • プラン2000  2000カウント 5万5000円   ※1カウント1000文字元の文章を見

sujiko.jp

9.重複コンテンツ、コピーチェックツールsujiko-jp

(出典:http://sujiko.jp/

sujiko.jpは、類似率を調べたい2つのサイトのURLを入力して「判定」をクリックするだけで、どのくらいコンテンツが重複しているかを調べられるツールです。

ネット上から広くコピーコンテンツを探すわけではないので、参考にしたサイトとどのくらい似ているか?あるいは似たサイトを見つけたがコピペされていないかなどのチェックに向いているでしょう。

利用は無料です。さらに、メールアドレスを登録すると、sujiko.jpの回数制限がなくなり使い放題になります。Webマーケティング情報についてのメルマガも配信されます。

コピペチェックの一致率の目安は?

コピペチェックでの一致率は理想は30%程度ですが、指定する際は最低限50%以下が望ましいでしょう。

コピペする気がなくても、どうしても類似してしまう部分があるので、必ずしも30%以下でなければいけないわけではありません。

あくまでコピペを極力なくし、ライターやメディア担当者の言葉で表現したオリジナルコンテンツが重要であることを、意識する目安として考えるとよいでしょう。

実際、テーマによってはコピペ率がどうしても高くなってしまうケースがあります。例えば法改正などをテーマにした記事では、法律をそのまま引用することが多いのでかなりコピペ率が高くなります。また、同じようなテーマの記事がネット上に無尽蔵にある場合も一致率は高くなりがちです。

一致率にあまりにこだわると、ある単語の使用数を無理に押さえるなど表現を制限せざるをえないので、多少バッファを持たせておくことをおすすめします。

コピペのない質の高いコンテンツをつくるために

コピペのない良質なコンテンツを作り続けるためには、メディア運営担当者、ライターそれぞれが共通の意識を持つことが大切です。

ライターが気を付けるべきこと

ライターが知っておくべきルールのひとつに著作権法があります。法律は解釈が難しいところはありますが、基本、知っておけばいいのは以下です。

転載や引用の際のルールや法律を理解する

転載や引用のルールの基本をしっかり押さえておきましょう。確認のために再記載します。

  • 転載:紹介している他人の文章が自分の文章より量が多い(主:他者、従:自分)※許諾要
  • 引用:自分の文章が紹介している他人の文章より多い(主:自分、従:他者) ※許諾不要

転載も引用も、必ず他者の作成したコンテンツだと区別する

  • “ダブルクォーテーション” で囲う
  • 「」で囲む
  • 斜体にする
  • 背景色を変える
  • 出典を明記する

サイトに引用・転載の方法が書かれている場合は方針に沿って紹介しましょう。プレスリリースにも引用、転載の際の推奨記載例がある場合も同じです。

自分の言葉で表現することを心掛ける

そもそも、自らの言葉で表現して伝えることがライターの仕事の本質です。あまりに構成がしっかりしキーワードの縛りが多いと、ついつい構成に忠実に書こうという意識が強くなりますが、そこを忘れてはいけません。

ネット上で参考にできる元記事も正しい内容とは限りません。もともと間違った記事を多少アレンジし、さらに内容が間違って伝わり、というケースも十分ありえます。結果的にコピペ記事を量産すると、ユーザーに何か損害を与えてしまうかもしれません。できるだけ原典にあたり、テーマを掘り下げて自分なりの表現をしましょう。

オウンドメディアのテーマもどんどん変化していくので、あまり知見がないテーマを書くことも多いでしょう。その場合、断片的な知識を寄せ集め無理やりでも文章らしくものにするまでが一山。その時点では、自分の言葉で表現できる余地も少ないので、間をおいて修正し、音読して修正しを繰り返し、自分なりの言葉になっていくものではないかと思います。

すぐ書き上げると似た感じになりやすいので、一回書いて1〜2日ねかせて見直すとよいでしょう。次に見たときよい表現が浮かび、ブラッシュアップしていくと記事が濃くなっていきます。

気持ちが言葉にのっていると感じられるのは、最後でよしと考えておくと、プレッシャーを回避できます。

入稿前に自らコピペチェックをしておく

コピペを意図しなくても一致率が高くなってしまうこともあるかもしれないので、事前に自身でもコピペチェックをしておきましょう。

特に割と知見がある分野だと、ネット記事の上位を参照せず、すいすい書けるときもあります。しかし、同じような言い回しを考える人はいるもので、油断しているとコピペっぽい原稿になっていることがあります。コピペチェックツールで完全一致の文節はないものの、類似性が高いと出るサイトがあるなら、表現を再考しましょう。

何より、発注担当者がコピペチェックをした際に高い数字が出て、不信感につながってしまうことを防げます。

もちろん、中には頑張ってもコピペ率がさがらないキーワードがあります。テーマとキーワードの指定によっては致し方ない面もあるので、クライアントにその旨を伝えて納品しましょう。

尚、ちょっとしたtipsですが、コピペチェックツールのレポートや、類似サイトを見ることで、偶然探していた情報を見つけたり、違う表現が浮かんだりすることもあります。

コピペの意図なくして似てしまう文章というのは、自分と思考回路が似ているということでもあります。1回ラフに書き上げた時点でコピペチェックをすると、何かしらヒントが掴めることもあるでしょう。

メディア運用者が気を付けること

メディア担当者は、発注プロセスにコピペを防ぐ仕組みを組み込んでおきましょう。

前もってコピペをしないように指示をする

コピペをしないことはライターにとっても基本ルールではありますが、たくさんのライターと仕事をしていると、ごく稀に堂々とコピペ記事を納品するような方もいます。だからこそ、リスクヘッジのために発注段階で伝えるルールにしましょう。

何ごともそうですが、言った言わないにならないように、できれば発注書のテンプレートの文面にコピペ率の目安を入れておくとよいでしょう。

【コピペを防ぐ発注書の記載例】

【コピペを防ぐ発注書の記載例】

Googleスプレッドシートで工程を管理している場合、「コピペ率を入力する欄」を設けてもよいと思います。コピペ厳禁と記載してもよいのですが抽象的なので、最初からコピペ率について明確にしておくことがポイントです。

記事がコピペされていないか確認をする

その上で、入稿された記事は必ずコピペチェックツールなどで確認をします。なぜなら、ライターが発注書をよく読んでいないケースや、実際に書くときにどこも参考にせず書いており、コピーではないのでチェックしないケースがたまにあるからです。

制作会社にすべて任せていようが同じです。ルーティンとなっているタスクが、人材の入れ替わり、無理なスケジュール、大丈夫だろうという思い込みなどで、チェックできていないケースはたまに起きます。社内で最終責任を問われるのはメディア運営担当者なので、そこは徹底しておくことをおすすめします。

記事構成案の段階で独自のコンテンツを組み込む

記事のオリジナリティは、構成である程度決まります。SEO施策上、競合や他社のコンテンツとほぼ同じ見出しを用意すると、どうしても似た記事になりがちです。

差別化するためには、キーワードを入れ込む際に何かしら独自性を出すことが重要です。あまりにキーワードに捉われるのもよくありません。なぜなら、Googleのサジェストなどはこれまでによく検索されているキーワードにすぎないからです。

しかし、読者が知りたいのが最新トレンドについての情報なことも多いでしょう。SEOを意識しつつも、できるだけ旬の情報、読者が本当に知りたがりそうなテーマについての構成案作成を心がけましょう。

例:

  • 新しいビジネストレンドの要素を入れこむ
  • 最新の統計データをもとに考える
  • 自社ならではの事例の紹介を入れる

まとめ

BtoBオウンドメディアは歴史自体がまだ浅いので、メディアや法律について初心者の方が担当になるケースは少なくありません。外部のWebライターも同様です。

しかし、何より信用が大事なBtoBオウンドメディア。うっかりコピペ記事を出して著作権法違反になったり、炎上したりしないように注意する必要があります。あらかじめ発注書にコピペ率についてのルールを明確に記載しておくこと、自分のフローにも必ずコピペチェックを組み込むことが大事です。

そもそもコピペの多い原稿、オリジナリティのない原稿を量産しても、検索エンジンが評価しないのでBtoBオウンドメディアの目的を達成することにはつながりません。BtoBオウンドメディアにはある程度の記事の量が必要ですが、レアな情報、価値ある情報を含んだオリジナルコンテンツであれば、月1回の発行であってもそのページは検索上位になることは珍しくないので、構成案作成段階からオリジナリティのある役立つ記事をしっかり考えていきましょう。

著者情報 戸栗 頌平(とぐりしょうへい)

株式会社LEAPT(レプト)の代表。BtoB専業のマーケティング支援会社でのコンサルティング業務、自社マーケティング業務、営業業務などを経て、HubSpot日本法人の立ち上げを一人で行い、後に日本法人第1号社員マーケティング責任者として創業期を牽引。B2Bの中小規模企業のマーケティングに精通。趣味で国外のマーケティングイベント、スポーツイベント、ボランティアなどに参加している。

サービスを詳しく知りたい方はこちら

資料請求