メインコンテンツまでスキップ

2023-03-06(月)

参加者

武田様、山森様、宮森様、戸張

議題

  1. 前回の議論
  2. 【運用について】推論の精度を高めるために
  3. 本日の決定事項やTODO

1. 前回の議論

山森さんによる採点結果と機械学習による採点結果で乖離がある。 特に「顔立ち」の乖離が大きい。

  • [要因]
    • 顔立ちの項目は加点方式のため、精度がよほど高くないと点数が上がりづらいのと、特に「先天的要因」による減点が目立つ
    • そもそもの「先天的要因」の推論精度が低い?
  • [対応]
    • データ量(応募者の写真)を増やし精度を高めていく
    • その前にまずは現状の精度(正答率)を計測する(←今ここ)

2. 【運用について】推論の精度を高めるために

2-1. 【前回の振り返り】運用フロー

  • どれくらいデータを増やせばよいのか?
    • →学習曲線を用いて精度を管理していく
  • 機械学習モデルの性能をどう高めていくのか?
    • →以下に具体的な流れ
      1. データ準備
        • 1.写真撮影&2.フォルダ分け&3.画像加工
      2. モデル作成(Lobeで自動化)
        • トレーニング&モデル検証
      3. サービス運用(GCPで自動化)
        • サーバーへデプロイ&運用&監視
  • そもそも性能を評価するにはどうするのか?
    • →正答率を用いる
  • どういった流れで管理していくのか
    • →最初はスプレッドシートとフォルダ管理。後々独自システム化。

2-2. 改善施策

  1. 随時データ量を増やしていく
  2. 学習用画像データセットの改善
    1. 学習に使用する画像を統一(撮影場所、撮影角度、服装など)
  3. 機械学習モデルの分割
    1. 先天的要因を以下の機械学習モデルに分割。
      1. 顎あり顎なし
      2. 斜視ありなし
      3. 三白眼か否か
      4. 顔が左右非対称か否か
      5. 骨盤に張りがあるか否か
    2. 全機械学習モデルの学習用データにおいて、全身写真以外のバストアップ写真を全て顔だけを切り抜き再トレーニング

2-3. 今後の作業内容

  • 新しいデータ(応募者写真)に対して
    • プロモデルスタジオ様
      • 写真撮影
      • ラベリング作業(フォルダに仕分け)
    • WEBRAL
      • トリミング作業(Google Cloud Vision APIで自動化)
  • 既存データに対して
    • WEBRAL
      • 既存写真のトリミング後、再トレーニング
      • 機械学習モデルの追加

2-4. 今後のスケジュールについて

  • 納品(受け入れテスト、操作方法レクチャー)
  • 運用フェーズ

3. 本日の決定事項やTODO

  • 次回打ち合わせ4月10日(月)14時
    • 既存写真のトリミング後、再トレーニング
    • 機械学習モデルの分解