pyautoguiでマウスを移動してみる

 

Pythonではpipでpyautoguiをインストールしてマウスやキーボードの自動化をプログラミングできます。

簡単な関数

  • position – 現在のマウスカーソル位置を取得
  • moveTo(x,y) – xy座標にマウスカーソルを移動
  • size – 画面解像度を取得。HDモニターなら1920×1080

チートシート

http://pyautogui.readthedocs.io/en/latest/cheatsheet.html

フェイルセーフ

マウスキーボードを自動化プログラムを実行すると、自分でマウス操作ができなくなってしまいます。開発中はそれを避けるため、pyautogui.PAUSEでウェイト秒数を指定して、ゆっくり動作するようにします。またpyautogui.FAILSAFEをTrueにすると、画面左上、つまり(0,0)にマウスカーソルを持っていくと、FaleSafeExceptionが発生しプログラムを強制終了させます。

 

Python3でSeleniumを使ってブラウザーを操作する

Pythonでは、seleniumを使って簡単にブラウザー操作ができます。

環境構築

  1. pip install selenium
  2. Chrome用のWebDriverをダウンロード、スクリプト内でexeファイルを参照

以前のSeleniumでは、Firefoxの場合はWebDriverが不要だったようですが、現在はFirefoxでもWebDriverが別途必要なようです。

ソースコード

XKCDコミックのサイトからコミックをダウンロードする。

https://automatetheboringstuff.com/chapter11/ で指定サイトのHTMLをダウンロードして、そのHTMLをbeautifulSoupでパースして、画像をダウンロードするプログラムを作りました。

これは様々なサイトに応用できます。

Google検索して、結果の上位5個を、ブラウザーを起動して表示するPythonスクリプト

automatetheboringstuff.com でPythonでGoogle検索し結果から上位5つをブラウザーを起動して表示する方法を学びました。pipコマンドで、requests,beautifulsoup4を導入して簡単にできました。

Python List Comprehension リスト内包表記

Pythonでは、タプルやリストをアスタリスク演算子で特定の型に変換できます。静的言語のキャストのような感じで、「アンパック」と呼ばれます。

https://docs.python.jp/3/tutorial/controlflow.html#unpacking-argument-lists

以下の例では、この仕組みを使い、リストの要素がタプルになっている入力データを、Personクラスに変換して、表示しています。このように特定のクラスに変換できると、クラスのプロパティやメソッド呼び出しでコードが見やすくなります。

参考資料

https://docs.python.jp/3/whatsnew/2.0.html#list-comprehensions

https://stackoverflow.com/questions/46528460/passing-a-list-of-argument-sets-to-a-function

https://en.wikipedia.org/wiki/List_comprehension

Automate the Boring Stuff with Python でいろんな自動化を学ぼう。

O’Reilly Japan – 退屈なことはPythonにやらせよう」の日本語版が2017年6月に販売されました。気になったので、目次を見たところ前半の0章から10章までは初心者向けのPython入門なので、購入しようかどうか迷っていたのですが、英語版は、「https://automatetheboringstuff.com/」で公開されていていました。

私はプログラミング経験があり、PythonのWebフレームワークのFlaskやスクレイピングライブラリーのBeautifulSoupを少し使ったことがあるので、英語版で各ライブラリーの使い方を参考にしながら、ソースコードを動かせばよさそうなのが分かりました。

11章からの概要

  • 11章 Web スクレイピング
    • Requests – Webサイトをダウンロードする
    • Beautiful Soup – HTMLパーサー
    • Selenium – ブラウザー起動や操作
  • 12章 Excel操作
  • 13章 PDF,Word
  • 14章 CSV JSON
  • 15章 スケジュール管理、時間制御、タイマー、ストップウォッチ
  • 16章 メール、テキストメッセージ
  • 17章 イメージ操作
  • 18章 キーボードマウス操作

ブラウザー操作、画像認識、キーボードマウス操作がプログラミングで制御できるといろいろできそうです。