データの扱い方
データの扱い方
データの扱い方に関して、データの収集や注釈付け(アノテーション)、加工といった作業はモデルの学習の成功の可否を決める要素として最も重大な要素の一つです。
例えば、データの収集であれば質の高いデータを偏りなく大量に集める必要があります。また、言語データ等においては表記ゆれや誤植、言葉の間違い等を修正する必要があります(データクレンジング)。画像データのデータ拡張における画像反転は有効ですが、数値や文字といった画像に対しては不適切です。目的とするタスクに最適なデータの扱い方を考えることが重要です。
👉より体系的に学びたい方は「人工知能基礎」(東京大学松尾豊先生監修)へ
クイズ
交通量調査を自動で行うため、路上を走る自動車を検出する物体検出モデルを学習したい。この際に行うデータ拡張の方法として、最も不適切な選択肢を1つ選べ。
人工知能基礎講座を提供中
人工知能の第一人者である東京大学の松尾豊教授が監修した人工知能基礎講座を受講してみませんか?
人工知能の歴史から自然言語処理、機械学習、深層学習といった最先端のトピックやAIに関わる法律問題まで網羅しているので全てのビジネスパーソン・AIの初学者におすすめです。
サンプル動画
AI初学者・ビジネスパーソン向けのG検定対策講座
zero to oneの「E資格」向け認定プログラム
日本ディープラーニング協会の実施するE資格の受験ならzero to oneの「E資格」向け認定プログラム (税込165,000円) をおすすめします。当講座は、東京大学大学院工学系研究科の松尾豊教授と東北大学大学院情報科学研究科の岡谷貴之教授が監修する実践的なプログラムとなっています。
厚生労働省の教育訓練給付制度対象のE資格認定プログラムの中では最安値※となり、実質負担額49,500円~(支給割合70%の場合)で受講可能です。※2023年弊社調べ