読者です 読者をやめる 読者になる 読者になる

しばやん雑記

ASP.NET とメイドさんが大好きなフリーランスのプログラマーのブログ

Bing 検索でパクリサイトが上位に出る件について対応した話

前回書いたフィードからパクるサイトの記事が予定外に伸びすぎた結果、恐らく Bing の中の人にまで伝わったらしいのと、色々と Microsoft と繋がりがあるので直接連絡が来ました。世間は狭くて怖い。

開発チームの方と少しやり取りをした結果、基本的に Bing でも DMCA に基づいた検索結果の削除は可能で、通報用のフォームも前回使ったもので正しかったようです。

既に検索結果から削除は行われているので、タイトルで検索してみるとパクリサイトは出てきません。

f:id:shiba-yan:20150730235213p:plain

検索結果の下には Google のように検索結果が一部削除されたというメッセージが出ます。

f:id:shiba-yan:20150730235347p:plain

まだ一部のページは出ていますが、Bing でも DMCA に基づいて検索結果から削除できることが分かって安心しました。今後は見つけ次第 Google と Bing で同じように通報していきたいです。

Bing で DMCA 侵害申し立てを行う

通報の方法ですが、フォームが用意されているので以下のページから行います。

https://www.microsoft.com/info/FormForSearch.aspx

f:id:shiba-yan:20150730234758p:plain

全部英語ですが、入力するべき項目は簡単です。それぞれの項目について簡単に説明を行っておきます。

  • First name / Last name
    • 本名を入力します。Google とは異なり、名前は何処にも表示されないみたいです。
  • Email address
    • メールアドレスを入力します。申請後、確認メールが飛んできます。
  • Name of the copyright owner (if not you)
    • 代理人が申請する場合には著作権を持っている人の名前を入力します。
  • Country
    • 日本なので Japan と入力します。
  • Title of the copyrighted work
    • 書籍などの場合はタイトルを入れるみたいです。ブログの場合は空でも良いみたいです。
  • Type of work (i.e., text, video, image, code, audio or other)
    • 著作権侵害された種類を選択します。ブログだったので text と image と入れました。
  • Specific online location (URL) where we can view your work (if available online)
    • ブログのトップページ URL を入れておきました。
  • Specific online location (URL) where your copyright is being infringed
    • 著作権を侵害しているコンテンツの URL を 1 行につき 1 つ入力します。
  • Additional information that would help us identify your work and understand the basis of your claim of infringement
    • 補足情報として著作権が侵害された自分のブログの URL を 1 行につき 1 つ入れておきました。

これで署名を行って送信すれば、しばらく後に検索結果から消えるようです。Google と異なり進捗がまったくわからないので、この辺りは改善してもらいたい項目ですね。

Bing でパクリサイトが上位に出た理由

何故 Bing ではパクリサイトの方が上位に表示されたかですが、純粋に Bing に対する SEO に負けた結果だと考えています。URL がページタイトルになっている点も有利に働いたのかもしれません。

気になるのは Bing Webmaster にある SEO レポートを見ると、優先度高の警告が大量に出ていることです。

f:id:shiba-yan:20150731000849p:plain

HTML5 では 1 つのページに複数の h1 タグが存在していても問題ないはずですが、Bing としては問題として扱っている可能性もあります。これで評価が下がったのかもしれません。

とはいえ、この程度の SEO でパクリサイトが上に出てくるのは問題だと思うので、今後はどれがオリジナルコンテンツなのか判別できるように、アルゴリズム側で改善してもらいたいですね。