Python と R の違い (ランダムフォレスト法)

本ページでは、R と Python それぞれでランダムフォレスト法 (Random Forest; RF) を利用した判別分析の方法を紹介します。

本例では、あくまで両環境でのコードや分析結果の表示についての比較の目的で行ったため、分析手法の説明や学習や検証における詳細なパラメータ設定は行っていないことをあらかじめご了承ください。

R での実装例

randomForest パッケージを用いて実行できます。

ソースコード

library(randomForest)

data(iris)
trainset <- iris[1:149,]
testset <- iris[150,][-5]

(dt.model <- randomForest(Species ~ ., data=trainset))

predict(dt.model, testset, type="class")

出力結果

Python での実装例

scikit-learn の sklearn.ensemble.RandomForestClassifier クラスを用いて実行できます。

ソースコード

from sklearn.datasets import load_iris
from sklearn.ensemble import RandomForestClassifier

iris = load_iris()
X, y = iris.data[:-1], iris.target[:-1]

rf = RandomForestClassifier()
rf.fit(X, y)

print(rf.predict([iris.data[-1]]))

出力結果

“2” と出力されているのは “Virginica” なので、正しく推定できたことがわかります。

参考: Python for R Users