- 2021年7月11日
- 2022年4月15日
Python で SyntaxError: Non-UTF-8 code
Python でスクリプトを実行した際に次のエラーに遭遇しました。 原因と対策 エラーに記載のリンクのとおり、エンコーディングが定義されていないことに起因するようです。対策とし […]
Python でスクリプトを実行した際に次のエラーに遭遇しました。 原因と対策 エラーに記載のリンクのとおり、エンコーディングが定義されていないことに起因するようです。対策とし […]
Twitter API と Python を利用して、過去のツイートを一括削除することができます。Twitter API の概要と申請方法は、以下の記事をご参照ください。 Tw […]
正規表現とは 「.」や「+」などのメタ文字(特殊文字)を使って、パターンを表現する記述方法です。複雑で長い文字列を 1 つの文字列で表現したり、マッチする文字列を抽出したりする […]
Web スクレイピングは、それ自体は違法とされていないものの、ルールや注意点を十分に理解して実施しないと違法となる可能性があります。今回は「違法とならないために注意すること」の […]
Web スクレイピングでページソースを取得しようとした際、ブラウザで表示する場合と異なるテキストが表示されることがあります。User-Agent を設定していない場合、Web […]
HTML 要素の取得について Beautiful Soup で HTML 要素を取得する方法として「select() メソッド」と「find() メソッド」の 2 つがあります […]
Web スクレイピングとは スクレイピングとは、web ページから情報を抽出することを言います。取得した情報は、エクセルなどにまとめて利用することができます。…(中略)…Pyt […]
Python で import requests を実行した時に次のエラーに遭遇しました。 エラー内容 ファイル名を requests.py にしていた事が原因でした。モジュー […]
urljoin メソッドとは 基底 URL(base)と別の URL(url) を結合して、絶対 URL を作成します。 実行例 次のコードを実行します。 出力結果は次のとおり […]
Selenium モジュールとは ブラウザを操作できるモジュールです。主に requests モジュールや Beautiful Soup モジュールと組み合わせて WEB スク […]