Python の Selenium モジュールについて

Selenium モジュールとは

ブラウザを操作できるモジュールです。主に requests モジュールや Beautiful Soup モジュールと組み合わせて WEB スクレイピングに利用されます。

実行例

次のコードを実行すると、Chrome ブラウザが起動します。

from selenium import webdriver
driver = webdriver.Chrome("chromedriver") 
driver.get("https://google.co.jp") 

解説

本記事の例では、Chrome ブラウザを制御します。

Chrome 用 WebDriver のダウンロード

Chrome ブラウザを制御するために、Chrome 用の WebDriver をこちらのサイトからダウンロードします。
プログラムを実行する OS に対応した Driver をダウンロード・解凍して、プログラム実行ファイルと同じフォルダに置きます。

Selenium モジュールのインストール

Selenium モジュールをインストールします。

pip install selenium

コードの記述方法は、次のとおりです。

from selenium import webdriver
from selenium.webdriver.common.keys import Keys
chrome = webdriver.Chrome("C:\scripts\chromedriver_win32\chromedriver.exe") 
chrome.get("https://google.co.jp") 
search_box = chrome.find_element_by_name("q")
search_box.send_keys("test")
search_box.send_keys(Keys.RETURN)

webdriver.Chrome で、chrome ドライバを読み込み、変数(driver)に渡します。
chrome ドライバを使って、https://google.co.jp を起動します。
キーボードの操作(RETURN や ALT など)をするには、「selenium.webdriver.common.keys」からインポートされた keys クラスを使います。

以下は、Google を起動して「Python Selenium」と検索する例です。

from selenium import webdriver
from selenium.webdriver.common.keys import Keys
# Google 起動
chrome = webdriver.Chrome('C:\scripts\chromedriver_win32\chromedriver.exe') 
chrome.get("https://google.co.jp")
# 検索ワード入力
word1 = "python"
word2 = "Selenium"
search_box = chrome.find_element_by_name("q")
search_words = word1, word2
search_box.send_keys(" ".join(search_words))
# 検索実行
search_box.send_keys(Keys.RETURN)
print(chrome.title)
関連記事

requests モジュールとは HTTP 通信ライブラリで、Web サイトの情報を収集することができます。主に Beautiful Soup モジュールと組み合わせて、Web スクレイピングに使用されます。 実行例 […]

関連記事

Beautiful Soup モジュールとは HTML や XML ファイルからデータを取得し、解析するライブラリです。主に requests モジュールと組み合わせて、Web スクレイピングに使用されます。 実行例 […]

以上