スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

seleniumの実行その2

seleniumの続きです。googleに飛んで「エンタープライズエンジニア」を検索するだけの処理。sleepを入れているのは結果取得待ちです。なお、ソースを表示すると膨大なので、確認だけなら不要と思います。いろいろ遊ぶ前にマルチバイトチェックしましたが、うまく動きませんでした。python2.X系だとUTF8の「u」をつけてあげるんですね。普段プログラミングしないからわからんわ。。。
import os
import time
from selenium import webdriver
from pyvirtualdisplay import Display

display = Display(visible=0, size=(800, 600))
display.start()
driver = webdriver.Chrome()
driver.get("http://www.google.com")

search_input = driver.find_element_by_name('q')
search_input.send_keys(u'エンタープライズエンジニア')
search_input.submit()
time.sleep(3)
print driver.title

print driver.page_source.encode('utf-8')
driver.quit()
display.stop()


続いてダイレクトバンクングにアクセスします。以下を基本的にコピペ。環境差分のみを修正して、面倒なのでお知らせ系も省いています。お約束ですが実行は自己責任で。
http://blog.mursts.jp/entry/2015/09/25/scrape-netbanking-by-python-and-selenium/

auf:~/selenium$ cat btmu_drirect.py

#-*- coding: utf-8 -*-

import os
import time
from selenium import webdriver
from pyvirtualdisplay import Display

INFORMATION_TITLE = 'お知らせ - 三菱東京UFJ銀行'
ID = '自分のID'
PASSWORD = '自分のパスワード'
MUFG_TOP_URL = 'https://entry11.bk.mufg.jp/ibg/dfw/APLIN/loginib/login?_TRANID=AA000_001'

try:
display = Display(visible=0, size=(800, 600))
display.start()
driver = webdriver.Chrome()
driver.get(MUFG_TOP_URL)
time.sleep(2)

driver.find_element_by_id('account_id').send_keys(ID)
driver.find_element_by_id('ib_password').send_keys(PASSWORD)
driver.find_element_by_xpath('//img[@alt="ログイン"]').click()
time.sleep(3)


driver.find_element_by_xpath('//img[@alt="入出金明細をみる"]').click()
time.sleep(5)

print driver.title
#print driver.page_source.encode('utf-8')

driver.find_element_by_link_text('ログアウト').click()
time.sleep(3)

finally:
driver.quit()
display.stop()

auf:~/selenium$

以上でソースは問題なくgetできました。表示されると長いので#でコメントアウトしています。

あ、ちなみに前回解決できなかったLinuxのシャットダウンできない問題は、何故か何もしていないのにうまくいくようになりました。基本ITは勝手に変わることはないんですけど、たまにこういうこともありますね。。。いろいろ変更したのは確かなんですが、すぐに反映されないルールがどこかにあるともうお手上げです。
上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。