自動化無しに生活無し

WEBとかAIとかLinux関係をひたすら書く備忘録系ブログ

OGP(Open Graph Protocol)情報から動画のサムネイル等を抽出する【Python使用】

thumbnail

例えば、YouTubeなどの動画のURLをTwitterに貼り付けると、自動的にリンク先の動画のサムネイルが表示される。

これはYouTubeのHTMLに含まれるOGPという情報をTwitterが抜き取り、表示しているからだ。

OGPとは

HTMLのheadタグに書く、metaタグでproperty="og:image"などの情報が含まれている。

参照: https://ogp.me/

例えば、下記動画であれば、OGPは

https://www.youtube.com/watch?v=jNQXAC9IVRw

このmetaタグのことをいう。og:imageのURLをたどると、

https://i.ytimg.com/vi/jNQXAC9IVRw/hqdefault.jpg

動画のサムネイルを取得できる。今回は、このOGP情報をPythonを使用して取得していく。

PythonでOGPをスクレイピングする。

import requests,bs4

TARGET  = "https://www.youtube.com/watch?v=jNQXAC9IVRw"


result  = requests.get(TARGET)
soup    = bs4.BeautifulSoup(result.content,"html.parser")


og_image_elems  = soup.select('[property="og:image"]')

for og_image_elem in og_image_elems:
    print(og_image_elem.get("content"))

これでサムネイルのURLが出力される。

スポンサーリンク

シェアボタン

Twitter LINEで送る Facebook はてなブログ