Seleniumでブラウザを開く

Seleniumで簡単なスクレイピングをします。今回はブラウザを開くだけです。

”Selenium” とはブラウザの試験をしたり動作を自動化するライブラリです。

普通に”Selenium”を使うとブラウザが開いて動きます。

”ヘッダーレス”という技を使うと表示せずにスクレイピングやブラウザを動かすことができます。

準備
1.Selenium のインストール
  pip install selenium
2.Chromeのウェブドライバーダウンロード
  pip install chromedriver-binary
動作させると、Chrome のバージョンが違う的エラーが出ました。
ドライバーが最新の74でブラウザが73だったからです。
でもChromeのヘルプを見るとは”最新です”的、メッセージが出ます。

最新?
でも実際は、ほんの1週間前に74のベータ版が出たようだ。
対策としてはエラーに出たURLから、ブラウザに会うバージョンの実行プログラムを
ダウンロードしてプログラム上で実行しました。


頭に来たので(?)、今回はこの記事のあるページを開いてスクリーンショットを取りました。

以下が、Selenium でのブラウザを開く簡単なプログラムです。

===========================

#import chromedriver_binary*コメントアウト
from selenium import webdriver
#URL設定
url = “https://www.excite.co.jp/news/article/Cobs_1890436/”
# ヘッドレスモードにする
options = webdriver.ChromeOptions()
options.add_argument(‘-headless’)
# Chrome起動(ダウンロードして変更)
browser = webdriver.Chrome(executable_path= r”d:\driver\Chromedriver.exe”,options=options)
# URL読込
browser.get(url)
# スクリ-ンショット保存
browser.save_screenshot(“website.png”)
# 終了
browser.quit()

===================

下記が抽出したスクリーンショットです。