環境設定 数値 文字列 正規表現 リスト タプル 集合 辞書 ループ 関数 クラス データクラス 時間 パス ファイル スクレイピング その他

Python3系でurllib2は使えない:代わりにurllib.requestとurllib.errorを使う

最終更新日 2023.02.18

Python3 系でウェブスクレイピングを行うときは

import urllib.request, urllib.error

とインポートします。下のコードは Python2 系です。

import urllib2

urllib.request, urllib.error は 2 がつきません。Python3 では urllib2 が urllib.request と urllib.error に分かれたとイメージしてもいいでしょう。

URLのオープンは

url = 'https://www.mathpython.com/'
html = urllib.request.urlopen(url=url)

とやります。ここでurlopen に url を入れると、その url のページの情報を GET できます。引数を指定するときは url=url と書くといいかも。

参考: Effective Python ―Pythonプログラムを改良する59項目

○ html = urllib.request.urlopen(url=url)
△ html = urllib.request.urlopen(url)