CopyDetect 類似率の判定方法について

コピペチェックツールCopydetectをご利用頂き、ありがとうございます。

Copydetectでチェックをした結果の類似率が、どのくらいであれば盗用の可能性が高いかについてご説明します。

Copydetectのチェック結果の見方について

Copydetectのチェック結果で、類似率が高い場合、類似率・連続文・背景が赤く表示されるのですが、この場合類似率が高いので、類似対象ページと実際に比較して確認する必要があります。

f:id:copydetect:20161209182335p:plain

一般的に使われる表現フレーズなどはどうしても重複するため、重複率と合わせて必ず目視されることをお勧めします。

類似コンテンツを掲載しているURLが類似率と一緒に表示されるので、掲載ページの確認をし、盗用である可能性はないかを確認してください。

文章単位比較の場合、重複率(パーセンテージ)ではなく、重複度合いで修正有無をご判断頂く形となります。

▼パーセンテージは高いが修正は必要なケース(=重複の可能性は低いケース)

単語単位では重複しているものの、文章単位ではない為、このケースでは重複の可能性は低いと考えられます。

f:id:copydetect:20161209182612p:plain

▼パーセンテージが高い上、盗用・重複の可能性が高いケース

文章単位で重複しているため、盗用コンテンツの可能性が高いと判断できます(=修正が必要)

f:id:copydetect:20161209182800p:plain

連続文の文字数について、オレンジ色で表示される文章間が網掛けされていない文字が入らなければ連続文として認識されます。

f:id:copydetect:20161209182927p:plain

部分的な一致でも検出するCopydetect

部分的な判定の数字ではなく全てを含めた連続文字数を文字数にカウントしている理由としては、作成者によって文章をそのまま盗用するのではなく、全体を少しずつ変更して文章を作成したり一部分を抜粋して盗用したりするケースがあるためです。

従来のコピーチェックである「全文章と一致する単語の比率をもとにコピーの可能性を測る方法」か「句読点で文章を分けて検索し、一致するURLを抽出する方法」の2つのどちらかを検索方法で抜粋すると部分的なコピペを正しく検知できない可能性があります。

Copydetectでは、そのような事がないために正しき検知するためにも部分的なコピペにできる限り漏れ無く検知するべく、一致する箇所の文字数からコピーの疑いがある箇所を検知できます。

類似率が80%以上のものは、盗用の可能性が高いので、ページの内容を確認してください。それ以下の場合は、目視で掲載ページの内容の確認が必要です。

文章単位比較の見方

類似Webサイト単位比較の類似度は全単語数に対する一致する単語比率に対し、文章単位での類似率を測れる機能が「文章単位比較」です。

こちらは単語数での類似比率になるので、100%の場合は完全一致の文章となります。

また文章が完全一致した場合一致している文章をコピーし、掲載先URLからどの部分が一致しているかを検索して目視でチェックしてください。

f:id:copydetect:20161209183052p:plain

単語で一致しているものに対しては盗用でないので、チェックの対象から外してください。

f:id:copydetect:20161209183158p:plain

単語単位で一致しているけれど、類似率の高いものに関してはリライトして盗用している可能性があるので、疑わしい文章の横の▼をクリックし、URL単位でチェックをしてください。

f:id:copydetect:20161209184313p:plain

また、部分一致と完全一致の判定方法やコピー判定の確認方法については以下のページに記載していますので、こちらも合わせてお読みください。

 

▼部分一致と完全一致の2つのコピー判定方法について

http://blog.copydetect.net/entry/copy-judgment 

▼部分的なコピペも検出するコピペチェック方法

https://blog.core-j.co.jp/how-to-find-parts-copypaste

▼無断引用や抜粋も漏れ無く検出する方法

http://blog.copydetect.net/entry/detectiing-quotation