データセットの結合 pd.concat 縦向き、横向き結合
Pandas の pd.concat を使ったデータフレームの縦結合・横結合をわかりやすく解説。 複数データの統合、行追加・列追加の基本を図解で理解できます。 データ分析で必須の concat の使い方を短時間でマスターしましょう。
Pandas の pd.concat を使ったデータフレームの縦結合・横結合をわかりやすく解説。 複数データの統合、行追加・列追加の基本を図解で理解できます。 データ分析で必須の concat の使い方を短時間でマスターしましょう。
データフレーム内の異なる列同士の値が一致しているか、不一致かを判定する関数の作り方と適用方法を紹介します。行単位で比較し、新しい列に結果を付与する実務でよく使う処理を、最小限のコードでシンプルにまとめた Reference 記事です。
50列以上ある複雑なデータセットから「どの変数同士に関係がありそうか」を 見つけるための実践的なサーチ方法をまとめたリファレンスです。 Pandas のクロス集計表と Seaborn のヒートマップを使い、 度数分布の確認、クロス集計、正規化、可視化までを通して データの構造を素早く理解し“発見の糸口”をつかむ手...
データ分析でよく使う DataFrame・ndarray・list の違いと使い分けを、実務目線でわかりやすく整理した How To 記事です。2次元データを扱う際に、それぞれの形式がどんな場面で適しているのかを比較し、用途に応じて変換できるようになることを目的に解説しています。
Python(Scikit-Learn)と SPSS Modeler の XGBoost を比較し、特徴量重要度がほぼ同じ結果になることを示しながら、実務で本当に重要なのはツールの違いではなく「どの特徴量を使うか」を決める前段階の判断であることを解説した記事です。地理的座標のようにドメイン知識で除外すべき特徴量を...