自動化無しに生活無し

WEB開発関係を中心に備忘録をまとめています

  • CNNとNLPの問題

    試験範囲 CNN : VGG,GoogLeNet,ResNet(WideResNet),MobileNet,DenseNet,EfficientNet NLP : Word2Vec(skip-gram),seq2seq,HRED,Transformer 問題 間違えている箇所は → で解答を表示。 1. VGG Q1: VGG16において、すべての畳み込み層で 3×3 カーネルが採用されている理由として適切なものは? 空間方向・チャンネル方向双方に畳み込みを行い、層を増やすため。5x5では特徴量がぼやけてしまい、1x1では空間方向の特徴抽出が難しいため。 Q2: PyTorchの models.vgg16 において、特徴抽出部分の最後にある nn.AdaptiveAvgPool2d((7, 7)) の役割は? 7x7で平均プーリングを行い、全結合 ...
  • 動画の扱い方の学習ロードマップ

    動画の扱い方の学習手順と方針をまとめる。 よりリアルタイムで、より高画質で、より便利で扱いやすいアプリ開発をバックアップする。 動画の基本単位 動画はコーデックとコンテナによって作られている。 動画を構成しているのは、映像と音声。これらをひとまとめにするため、圧縮と保存を行う。 その圧縮と保存が、コーデックとコンテナである。 コーデック (映像と音声の圧縮) コーデックには映像用のコーデックと、音声用のコーデック ...
  • AI実装検定A級のメモ

    AI概論 AIのコンペ(ILSVRC)とAIの歴史 ILSVRC という画像認識の精度を競い合うコンペがあり、2012年の大会でディープラーニングが有用であると認識されるようになった。 2011年付近まではサポートベクターマシン(SVM)という手法が上位であったが、2012年にはAlexNetという手法が登場。これが従来のニューラルネットワークを元にして作られた、深層ニューラルネットワーク、ディープラーニングである ...