MatrixFlowは、データ分析・機械学習の知識がなくても、ノーコードで精度の高い人工知能(AI)を構築できるサービスです。
今回は、データ分析の練習でよく使われるタイタニック号の生存者予測を実施します。具体的には、以下の流れで予測していきます。
〔1〕学習用データの前処理
〔2〕AIに〔1〕のデータを学習させる
〔3〕推論用のデータの前処理
〔4〕〔2〕で学習させたモデルに3のデータを渡して予測させる。
1.学習用データの前処理
前処理とは、AIのモデルが学習しやすい形にデータを加工することです。ここでは欠損値(欠けてしまっているデータ)を処理します。
データの管理を選択すると、練習用に準備されているデータを確認できます。予測したいデータを自分で持っている場合は新規追加で追加可能です。
前処理・データ解析に移り、データのところで「タイタニック生存者_AIの学習用」を選択します。
下にスクロールしていくと、このようにデータの内容を見ることができます。欠損値があるデータは年齢のように赤く表示されます。ここで、年齢の横にあるグラフのマークをクリックします。
すると、このように右の部分にヒストグラムが表示されます。左の欠損値数の横の矢印をクリックすると、欠損値を値で埋めるか、削除するかを選択できます。が、今回は削除してしまいます。このように他の赤いデータの欠損値も削除します。
すべての欠損値を削除したら、上にスクロールし、加工したデータをデータ管理に保存を選択し、名前をつけて保存します。
2.AIに〔1〕のデータを学習させる
上の学習を選択し、AIに〔1〕で前処理をしたデータを学習をさせます。無料プランではレシピを自分で作ることはできないので、用意されているものを選び、予測する値は生存結果とします。テストデータの比率や学習に使う値を変えると、結果も変わるので、試してみてください。最後に下にスクロールして、学習開始をクリックします。
3.予測用のデータの前処理
基本的に〔1〕と同じ作業をします。最初のデータの選択で推論用のデータを選択することに注意します。
4.〔2〕で学習させたモデルに3のデータを渡して予測させる。
上の推論を選択し、学習させたモデルと前処理をした推論用のデータなどを選択したら、推論開始をクリックします。
生存結果を予測することができました。
最後に
今回はmatrixflowを使い、データ分析を実施しました。欠損値の前処理などをコード書かずにできるのは便利だと思います。ぜひ初心者の方も試してみてください。
+ There are no comments
Add yours