注目キーワード
  1. AWS
  2. Python

Web スクレイピングの注意点

  • 2021年5月10日
  • 2021年5月10日
  • Python
  • 15view

Web スクレイピングは、それ自体は違法とされていないものの、ルールや注意点を十分に理解して実施しないと違法となる可能性があります。今回は「違法とならないために注意すること」の 4 つについて紹介いたします。
TOPCOURT 様の記事を参考にさせて頂きました。とても詳しく解説されているので一読をおすすめします。

違法とならないために注意すること

利用目的
  • 著作権法は、「情報解析」を目的としている場合は、著作権者の同意を受ける必要はないとしています。つまり、利用目的が情報解析以外の目的の場合は、著作権者の同意を得ないと著作権法違反となります。
スクレイピングの対象

スクレイピングの対象には、文章や画像などがありますが、文章や画像を丸パクリすると著作権法に違反する可能性があります。そのため、文章や画像は一部のみをスクレイピングの対象にすることが重要になります。

アクセス制限の遵守

クローラーに対するアクセス制限のためのファイルとして「robots.txt」というものがあります。大抵はウェブサイトのディレクトリトップ(第一階層)にあります。[1]本サイトの場合は、https://mytech-blog.com/robots.txt になります。
スクレイピングを行う際には、このファイルにある制限内容を守る必要があります。
違反した場合によっては、偽計業務妨害罪の容疑をかけられる可能性があります。

利用規約

同意した利用規約に「スクレイピング禁止」と謳われているにもかかわらず、スクレイピングをした場合は利用規約違反となり、民事上の損害賠償を請求される可能性があります。
スクレイピングしようとするサイトに利用規約が存在する場合は確認することが重要です。

TOPCOURT LAW FIRM

スクレイピングとは何かという点を確認したうえで、スクレイピングに関する法律上の問題点について、ITに詳しい弁護士が解説し…

あわせて読みたい

Web スクレイピングとは スクレイピングとは、web ページから情報を抽出することを言います。取得した情報は、エクセルなどにまとめて利用することができます。…(中略)…Python を使えば、web ページをスクレイピングし、デー[…]

以上

脚注

脚注
1 本サイトの場合は、https://mytech-blog.com/robots.txt になります。