Posts in Pythonでデータ分析

DataFrameの特定の要素に特定の文字列を含む行の抽出と削除

pandasのDataFrameの特定の列の要素に指定した文字列を含む行を抽出する方法と、その行を削除する方法です。

Read more ...


DataFrameの欠損値を特定の値で置き換える

pandasのDataFrame内にある欠損値を、特定の値で置き換えます。

Read more ...


Python(pandas)でExcelファイルを読み込んでDataFrameにする

PandasでExcelファイル(xlsx)にアクセスするときに、openpyxlなどの外部モジュールが必要になります。 pipなどでインストールしてください。

Read more ...


Pythonでデータ分析入門3(初めての決定木(多クラス分類))

Pythonで決定木を使った多クラス分類をします。

Read more ...


pandasでクロス集計する

Pythonでpandasを使ってクロス集計をします。

Read more ...


Pythonでデータ分析入門2(初めてのロジスティック回帰(2クラス分類))

Pythonでロジスティック回帰を使って2クラス分類問題を解いてみます。

Read more ...


Pythonでデータ分析入門1(初めての回帰分析)

Pythonを使って重回帰分析をしてみます。

Read more ...


Pythonで回帰モデルの評価関数

機械学習(回帰モデル)で利用される評価関数について、Python(Scikit-learn)を使って計算する手順です。

Read more ...


Pythonで箱ひげ図を描く

Pythonで箱ひげ図を描画します。いくつかの方法を紹介します。

Read more ...


Pythonでデータを学習用と検証用に分割する

機械学習用のデータをScikit-Learnを使って学習用と検証用に分割します。

Read more ...


pandasで同じデータ(要素)がいくつあるか調べる

pandasでDataFrameやSeries内の各データが、データセット内でどの程度の頻度で出現するかを調べます。

Read more ...


scikit-learnのサンプルデータセットを入手する

scikit-learnには、いくつかのデータセットが備わっています。大別すると、ToyデータセットとRealworldデータセットに分けられます。Realworldデータセットの方が、大規模なデータになります。

Read more ...


pandasで相関係数を計算する

pandasのDataFrameの各項目間の相関係数を計算してみます。

Read more ...


pandasでカテゴリ変数を数値データに変換する

pandasのDataFrameに格納されているカテゴリ変数(質的データ)を数値データ(量的データ)に変換します。

Read more ...


pandasとseabornでデータの可視化(散布図行列)

pandasとseabornを使って、簡単にデータの可視化をします。具体的には、散布図行列(ペアプロット)を作成します。

Read more ...


pandasの学習用のデータセットを入手する

Pythonでpandasの学習をしていると、お試し用のデータセットが欲しくなることがあります。pandasにはデータセットをダウンロードする機能はありませんが、seabornにDataFrameとしてデータをダウンロードする機能があります。

Read more ...


Pythonでpandas入門5(欠損値(NaN)の扱い)

Pythonのデータ分析で用いられるpandasの入門編です。欠損値の確認や置換方法について解説します。

Read more ...


Pythonでpandas入門4(データの連結と結合)

Pythonのデータ分析で用いられるpandasの入門編です。データ(DataFrame)の連結や結合について解説します。

Read more ...


Pythonでpandas入門3(データの統計量の計算)

Pythonのデータ分析で用いられるpandasの入門編です。データ(DataFrame)の最大値や平均などの統計量の計算について解説します。

Read more ...


Pythonでpandas入門2(データの追加と削除および並び替え)

Pythonのデータ分析で用いられるpandasの入門編です。データ(DataFrame)の列と行の追加および削除と、データの並び替えについて解説します。

Read more ...


Pythonでpandas入門1(データの入力とデータへのアクセス)

Pythonのデータ分析で用いられるpandasの入門編です。データの入力と、入力されたデータから必要な部分の取り出しについて解説します。

Read more ...