Python と SPSS® Modeler で XGBoost の特徴量選択を比較する
特徴量選択(feature selection)= 「どれを説明変数として使うか」は、データ分析では重要です。このBlogでは、特徴量選択についてXGBoostのアルゴリズムでSPSS® Modeler の特徴量選択とPython Scikit-Learnの結果を比較してみたいと思います。
特徴量選択(feature selection)= 「どれを説明変数として使うか」は、データ分析では重要です。このBlogでは、特徴量選択についてXGBoostのアルゴリズムでSPSS® Modeler の特徴量選択とPython Scikit-Learnの結果を比較してみたいと思います。
Excelファイルの内容をKey Word検索するPython Scriptをまとめました。
Docker 環境があると、ちょっとPythDon の勉強用の試しコード作成等や本来ならば個人のPCでやるべきようなことを仕事用などのPCを使う場合等、PCを汚したくない時にDocker環境の中にJupyter Notebook稼働環境を作ってPC環境から独立して使うことができます。
Pandas のstr.contaisを利用して指定の値を含まない行の抽出方法をまとめました。 データフレームの中身をクリーニング等で抽出作業は必須スキルです。 今回は、 str.contains(“除きたい文字列”)と否定演算子 ** ~ ** を使って** ~df ** として指定の文字列を含まない行の抽...
カテゴリカルデータの個数、構成比率、トータル行を集計、整形する