Now Loading...

Now Loading...

データリーケージ

データリーケージ

データリーケージとは本来得られるはずのないデータを学習の段階で使用してしまうことです。

これによって訓練時には精度の高いモデルができていても、実装の時点では全く機能しないといった問題が生じます。説明変数へのリーク、訓練データでのリーケージ発生などが挙げられ、これらを改善するために目的変数を説明変数より後に観測するということや、訓練用目的変数の観測をテスト用目的変数の観測時間的に前段階で行うといったことが必要である。

クイズ

学習データにデータリーケージがあると,学習モデルを実際に予測に使う際に検証時よりも精度が低くなるという問題がある.データリーケージとはどのようなものか,最も適切な選択肢を一つ選べ.
  • 正解を見る
  • 解説を見る
    本来予測に使えない情報がデータに含まれることをデータリーケージと言います.データリーケージがあると,検証時には高い精度が出たが実際に導入すると精度が悪いという問題が起こります.

人工知能基礎講座を提供中

人工知能の第一人者である東京大学の松尾豊教授が監修した人工知能基礎講座を受講してみませんか? 人工知能の歴史から自然言語処理、機械学習、深層学習といった最先端のトピックやAIに関わる法律問題まで網羅しているので全てのビジネスパーソン・AIの初学者におすすめです。

サンプル動画

人工知能基礎講座はこちら↓ zero to one G検定 人工知能基礎 jdla

AIエンジニアを目指すならE資格

日本ディープラーニング協会の実施するE資格の受験に必要となるE資格認定プログラムを割引価格で提供中です。最短合格を目指す方向けのスピードパッケージを70,000円で提供中。(一発合格で33,000円のキャッシュバックキャンペーンも実施中です) zero to one E資格 jdla

AI初学者・ビジネスパーソン向けのG検定対策講座

G検定受験前にトレーニングしたい方向けの問題集「G検定実践トレーニング」も提供中です。 zero to one E資格 jdla