goduni

日記&備忘録

Pythonで画像処理のお勉強 〜準備編〜

今日も今日とて幼馴染のT君とマクドで作業をしてきました。

なんだかんだ今週に入って4回目くらいでびっくりです。笑

相変わらずT君はブログの記事作成に明け暮れていました。
ですが、「ブログで稼いでいく!」と言われた一ヶ月前と比べると見方はだいぶ変わった気がします。


T君への見方、というよりもブロガー全体に対しての見方なのかな。

ブロガーというと自分の中ではTwitterのプロフ文に「アフィリエイトで月○○万円稼いでいます!」みたいな、どうも嘘っぽいと言いますか、あまり良い印象は持てなかったんですよね。

ただ、実際にT君の行動を見てるとSEO対策、あるキーワードでの競合サイトはどれくらいか、他にも本を読みまくったりとか結構調べまくっていたので、そういう絶え間ぬ努力を積み重ねてようやく得た肩書き「アフィリエイトで月○○万円稼いでいます!」だったらそれはそれですごいと思いました。


あとは、僕自身がブログを書くことにハマってきたってことですかね。笑

最近は割とどんな記事を書こうか考えている時間が長くなった気がします。
昨日も寝る時に考えていました。

「明日はなにを書こうか?ためになること?技術系?でもそれだけだと面白くないなー。趣味ゴリ押しのガンダムの記事を書こうか?でもそれは好き嫌い別れるぞ。。。あ!だったら技術系の内容にガンダムを絡めよう!」

こうして生まれたのが今回の記事です。笑


では本題に行きましょう!

やりたいこと

ガンダムの画像を学習させて、「これは○○のシリーズのモビルスーツです」とか「これはガンダム(or ザク)です」的なことをしたい。

手順

  1. 画像処理の記事を調査
  2. 画像収集(スクレイピング
  3. 画像処理プログラムの作成
  4. 学習&実行


とりあえずはこんな流れかな。

1. 画像処理の記事を調査

正直、僕は機械学習とかの知識がそこまでないのでまずは調査することから始めました。

だいたい予想はしていましたが、Pythonを用いた記事が多かったので、今回はPythonを使用します。

2. 画像収集

画像収集は僕がよくやっているスマホゲーム「スーパーガンダムロワイヤル」の攻略Wikiの機体図鑑から取得します。

f:id:redosel:20190413023046p:plain


手動でダウンロードするのはさすがに死ぬので、スクレイピングします。
幸い、以前にスクレイピングのプログラムを作成していたのでそれを改変して今回用のプログラムを作成しました。

ただよくわからんエラーなどに苦戦してしまい、3時間くらいかかってしまいました。

以下は実際のダウンロードしている様子です。

f:id:redosel:20190413023507g:plain

自動で動いているのを見るとテンションあがります。


ダウンロードが完了してから、実際どの程度画像があるのか確認したところ1329件もありました。

大量のガンダムの画像がローカルに保存できただけでもかなりハッピーです。




「画像処理プログラムの作成」に移りたいところではあるのですが、結構ここで今苦労しています。
なので、まだ記事にできる状態ではないので、最後の「学習&実行」まで終わり次第、また記事にしていこうと思います。

今回は〜準備編〜ということで。


記事のコードをコピペして使用、実行するだけではなく、せっかくの良い機会なので機械学習について時間をかけてじっくり勉強していこうと思います。