参加者
武田様、山森様、宮森様、戸張
議題
1. 前回の議論
山森さんによる採点結果と機械学習による採 点結果で乖離がある。 特に「顔立ち」の乖離が大きい。
- [要因]
- 顔立ちの項目は加点方式のため、精度がよほど高くないと点数が上がりづらいのと、特に「先天的要因」による減点が目立つ
- そもそもの「先天的要因」の推論精度が低い?
- [対応]
- データ量(応募者の写真)を増やし精度を高めていく
- その前にまずは現状の精度(正答率)を計測する(←今ここ)
2. 【運用について】推論の精度を高めるために
2-1. 【前回の振り返り】運用フロー
- どれくらいデータを増やせばよいのか?
- →学習曲線を用いて精度を管理していく
- 機械学習モデルの性能をどう高めていくのか?
- →以下に具体的な流れ
- データ準備
- 1.写真撮影&2.フォルダ分け&3.画像加工
- モデル作成(Lobeで自動化)
- トレーニング&モデル検証
- サービス運用(GCPで自動化)
- サーバーへデプロイ&運用&監視
- データ準備
- →以下に具体的な流れ
- そもそも 性能を評価するにはどうするのか?
- →正答率を用いる
- どういった流れで管理していくのか
- →最初はスプレッドシートとフォルダ管理。後々独自システム化。
2-2. 改善施策
- 随時データ量を増やしていく
- 学習用画像データセットの改善
- 学習に使用する画像を統一(撮影場所、撮影角度、服装など)
- 機械学習モデルの分割
- 先天的要因を以下の機械学習モデルに分割。
- 顎あり顎なし
- 斜視ありなし
- 三白眼か否か
- 顔が左右非対称か否か
- 骨盤に張りがあるか否か
- 全機械学習モデルの学習用データにおいて、全身写真以外のバストアップ写真を全て顔だけを切り抜き再トレーニング
- 先天的要因を以下の機械学習モデルに分割。
2-3. 今後の作業内容
- 新しいデータ(応募者写真)に対して
- プロモデルスタジオ様
- 写真撮影
- ラベリング作業(フォルダに仕分け)
- WEBRAL
- トリミング作業(Google Cloud Vision APIで自動化)
- プロモデルスタジオ様
- 既存データに対して
- WEBRAL
- 既存写真のトリミング後、再トレーニング
- 機械学習モデルの追加
- WEBRAL
2-4. 今後のスケジュールについて
- 納品(受け入れテスト、操作方法レクチャー)
- 運用フェーズ
3. 本日の決定事項やTODO
- 次回打ち合わせ4月10日(月)14時
- 既存写真のトリミング後、再トレーニング
- 機械学習モデルの分解