ブラック ジャック に よろしく 無料k8 カジノWine Dataset:ワイン(アルコール度数/色の濃さなどの13項目)の表形式データセット仮想通貨カジノパチンコヘリオス 1000
花 の 慶次 誕生 日k8 カジノ
猪木 スロット 伝説連載目次
データセット解説
Wineデータセット(ワインの化学分析データ)は、「アルコール度数/色の濃さ」などの13個の特徴量と、3種類のワインのいずれかを示すラベルで構成される表形式データセット(=構造化データセット)である(図1)。
図1 Wineデータセットの内容例※データセットの配布元: 「https://archive.ics.uci.edu/ml/datasets/wine」。
Wineデータセットは、主に多クラス分類(具体的には「ワインの種類の予測」)を目的とした統計学/機械学習/ディープラーニングなどの練習で活用できる。
図1を見ると分かるように、説明変数となる13個の特徴量は以下の通り。
alcohol: アルコール度数malic_acid: リンゴ酸ash: 灰分(かいぶん)alcalinity_of_ash: 灰分のアルカリ度magnesium: マグネシウムtotal_phenols: 全フェノール含量flavanoids: フラボノイドnonflavanoid_phenols: 非フラボノイドフェノールproanthocyanins: プロアントシアニンcolor_intensity: 色の濃さhue: 色相od280/od315_of_diluted_wines: 希釈ワイン溶液のOD280/OD315(=280nmと315nmの吸光度の比)proline: プロリン
これらの特徴量は、イタリアの同じ地域で栽培された、3種類の異なる品種に由来するワインの化学分析の結果である。
また、「ワインの種類」を示す、目的変数(target variable)となるラベル(=正解を示す教師データ)には、
クラス1: 値は「0」(59件)クラス2: 値は「1」(71件)クラス3: 値は「2」(48件)
の3種類がある。上記の(○件)は各クラスのデータ件数である。このように、各クラスの件数は同数ではないことに注意してほしい。
各件数を合計すると、全データ数は178件となる。
引用のための情報
このデータセットは、基本的に自由に使用できる(※ライセンスは指定されていない)。
データセットを引用する際に使える情報を以下にまとめておく。
元となる書籍の著者: M. Forina, R. Leardi, C. Armanino and S. Lanteri元となる書籍のタイトル: PARVUS: An extendable package of programs for data exploration, classification and correlation元となる書籍の公開年: 1988データセットの配布元: https://archive.ics.uci.edu/ml/datasets/wine元のデータセット(wine.data)ファイル利用方法
実際にWineデータセットを使うには、ライブラリscikit-learnが提供する機能を利用することをお勧めする。ムダな作業を省いて、効率的に使えるためだ。
※なお、TensorFlow/Keras/PyTorchにはWineデータセットは用意されていなかった。ただし、TensorFlowには代わりに「wine_qualityデータセット」(データセットの配布元)が用意されているが、本稿の内容とは異なるので説明を割愛する。
以下に、scikit-learnで「どのようなコードを書くとWineデータセットが使えるか」の典型的なコードを簡単に示しておく。
scikit-learn
# !pip install scikit-learn # ライブラリ「scikit-learn」をインストールfrom sklearn.datasets import load_winewine = load_wine()
リスト1 scikit-learnでWineデータセットを利用する基本的なコード
sklearn.datasets.load_wine()関数を呼び出せばよい。戻り値として(sklearn.utils.Bunch型の)辞書オブジェクトを返す。その配下の、
dataにデータがtargetにラベル(目的変数の値)がfeature_namesに特徴量名がtarget_namesに分類クラス名が関数の引数にas_frame=Trueを含めた場合は、frameに全11列のpandasデータフレーム(※target列は最後の列)が
格納されている。
「AI・機械学習のデータセット辞典」
仮想通貨カジノパチンコスペイン 代表 ユーロ 2020