自動化無しに生活無し

WEBとかAIとかLinux関係をひたすら書く備忘録系ブログ

【BeautifulSoup】imgタグをスクレイピングして画像をダウンロードする

thumbnail

DoS攻撃になってしまうので、ダウンロードのたびに1秒待つようにしたほうが良いだろう。

import requests,bs4,time

result  = requests.get("https://noauto-nolife.com/")
soup    = bs4.BeautifulSoup(result.content, "html.parser")


elems   = soup.select("img")


count   = 0
for elem in elems:

    url     = elem.get("src")
    result  = requests.get(url)

    #バイナリで書き込み
    with open(str(count)+".png", "wb") as f:
        f.write(result.content)

    count += 1

    #1秒待機する(DoS攻撃になってしまうため)
    time.sleep(1)
スポンサーリンク

シェアボタン

Twitter LINEで送る Facebook はてなブログ