Web スクレイピングの注意点

  • URLをコピーしました!

はじめに

Web スクレイピングは、それ自体は違法とされていないものの、ルールや注意点を十分に理解して実施しないと違法となる可能性があります。今回は「違法とならないために注意すること」の 4 つについて紹介いたします。
TOPCOURT 様の記事を参考にさせて頂きました。とても詳しく解説されているので一読をおすすめします。

違法とならないために注意すること

利用目的
  • 著作権法は、「情報解析」を目的としている場合は、著作権者の同意を受ける必要はないとしています。つまり、利用目的が情報解析以外の目的の場合は、著作権者の同意を得ないと著作権法違反となります。
スクレイピングの対象

スクレイピングの対象には、文章や画像などがありますが、文章や画像を丸パクリすると著作権法に違反する可能性があります。そのため、文章や画像は一部のみをスクレイピングの対象にすることが重要になります。

アクセス制限の遵守

クローラーに対するアクセス制限のためのファイルとして「robots.txt」というものがあります。大抵はウェブサイトのディレクトリトップ(第一階層)にあります。[1]本サイトの場合は、https://mytech-blog.com/robots.txt になります。
スクレイピングを行う際には、このファイルにある制限内容を守る必要があります。
違反した場合によっては、偽計業務妨害罪の容疑をかけられる可能性があります。

利用規約

同意した利用規約に「スクレイピング禁止」と謳われているにもかかわらず、スクレイピングをした場合は利用規約違反となり、民事上の損害賠償を請求される可能性があります。
スクレイピングしようとするサイトに利用規約が存在する場合は確認することが重要です。

[blogcard url=https://topcourt-law.com/internet_security/scraping-illegal#i-11]

[sitecard subtitle=関連記事 url=https://mytech-blog.com/python-web-scraping/ target=]

以上

脚注

脚注
1 本サイトの場合は、https://mytech-blog.com/robots.txt になります。
よかったらシェアしてね!
  • URLをコピーしました!

この記事を書いた人

クラウド・ネットワーク・セキュリティ・仮想化・プログラミング・オープンソース・Web 開発をテーマにしたブログを運営👨‍💻 コンシューマー向けエンタメ事業の新規開発・運営経験 / VCAP-DCA・CCIE Lifetime Emeritus 認定 / 技術とビジネス書愛好家📚

目次