Python3系でurllib2は使えない:代わりにurllib.requestとurllib.errorを使う
2023.02.18
Python3 系でウェブスクレイピングを行うときは
import urllib.request, urllib.error
とインポートします。下のコードは Python2 系です。
import urllib2
urllib.request, urllib.error は 2 がつきません。Python3 では urllib2 が urllib.request と urllib.error に分かれたとイメージしてもいいでしょう。
URLのオープンは
url = 'https://www.mathpython.com/'
html = urllib.request.urlopen(url=url)
とやります。ここでurlopen に url を入れると、その url のページの情報を GET できます。引数を指定するときは url=url と書くといいかも。
参考: Effective Python ―Pythonプログラムを改良する59項目
○ html = urllib.request.urlopen(url=url)
△ html = urllib.request.urlopen(url)