Now Loading...

Now Loading...

データセットの偏りによる注意

データセットの偏りによる注意

機械学習モデルの学習に用いるデータは母集団を適切に代表するような、偏りのないデータを抽出する必要があります。

データに偏りがあるとそれを学習するモデルがその影響を受けてしまう恐れがあります。過去には、アマゾンの採用AIが女性よりも男性を高く評価していたことが発覚し、炎上問題を引き起こしました。これは技術職に応募してくる人間がほぼ男性であり、それを教師データとしてAIが学習したために起こりました。また、マイクロソフトの顔認証システムにおいて有色人種と白色人種で精度に大きく差があり、性別すら間違えることもあり問題になりました。これも学習データにおいて白色人種の画像の量が多かったことが一因です。このように、開発チームに差別意識がなくとも偏りのあるデータを用いることで問題へと発展することは多々あります。

クイズ

2014年にAmazonが社員採用AIの開発を始めたが、学習用に用いたAmazonの過去の採用者の履歴書データの大半が男性だったために偏りのあるモデルが生まれてしまい、2017年にこの採用AI開発は中止された。このように偏った学習用データを与えることで発生する「アルゴリズムバイアス」を防ぐために有効な対応策として、最も不適切な選択肢を一つ選べ。
  • 正解を見る
  • 解説を見る
    個人個人で認識にバイアスがかかるのは当然であり、これを防ぐことは不可能であるため様々な人間の視点を取り入れることでアルゴリズムバイアスをある程度抑制できます。

人工知能基礎講座を提供中

人工知能の第一人者である東京大学の松尾豊教授が監修した人工知能基礎講座を受講してみませんか? 人工知能の歴史から自然言語処理、機械学習、深層学習といった最先端のトピックやAIに関わる法律問題まで網羅しているので全てのビジネスパーソン・AIの初学者におすすめです。

サンプル動画

人工知能基礎講座はこちら↓ zero to one G検定 人工知能基礎 jdla

AIエンジニアを目指すならE資格

日本ディープラーニング協会の実施するE資格の受験に必要となるE資格認定プログラムを割引価格で提供中です。最短合格を目指す方向けのスピードパッケージを70,000円で提供中。(一発合格で33,000円のキャッシュバックキャンペーンも実施中です) zero to one E資格 jdla

AI初学者・ビジネスパーソン向けのG検定対策講座

G検定受験前にトレーニングしたい方向けの問題集「G検定実践トレーニング」も提供中です。 zero to one E資格 jdla

関連ワード

ディープラーニングの社会実装に向けて

AIと社会

AIプロジェクトの進め方

データの収集

データの加工・分析・学習

実装・運用・評価

クライシス・マネジメント