【BeautifulSoup】imgタグをスクレイピングして画像をダウンロードする
- 作成日時:
- 最終更新日時:
- Categories: サーバーサイド
- Tags: BeautifulSoup Python tips スクレイピング
DoS攻撃になってしまうので、ダウンロードのたびに1秒待つようにしたほうが良いだろう。
import requests,bs4,time
result = requests.get("https://noauto-nolife.com/")
soup = bs4.BeautifulSoup(result.content, "html.parser")
elems = soup.select("img")
count = 0
for elem in elems:
url = elem.get("src")
result = requests.get(url)
#バイナリで書き込み
with open(str(count)+".png", "wb") as f:
f.write(result.content)
count += 1
#1秒待機する(DoS攻撃になってしまうため)
time.sleep(1)