gepuro.net
gepulog

データ分析エンジニアによる備忘録的ブログ

JuliaTokyo #1で「Julia0.3でランダムフォレスト」というタイトルでLTをしました

JuliaTokyo #1でLTをしました。 以下が資料です。

Julia0.3でランダムフォレスト from Atsushi Hayakawa

Julia 0.3で箱ひげ図を描く

データやパッケージのロードは、「Julia 0.3でヒストグラムを描く」を参照してください。

箱ひげ図を描くには、次のようなコマンドを打つ。

julia > plot(iris[[:SepalLength, :Species]], Geom.boxplot, x="Species", y="SepalLength")

Rでは変数が一つだけでも箱ひげ図を描くことが出来るけど、JuliaのGadflyではx軸とy軸を指定する必要があるみたい。また、x軸やy軸のラベル名も指定しないと動かなかった。

現状では、Rの方が手軽に作図出来るなあって印象です。

Julia 0.3でヒストグラムを描く

RDatasetsを読み込んで、ヒストグラムを描いてみました。 bincountでヒストグラムの粗さを指定出来ます。Rでいうbreaksは無いのだろうか。

julia> Pkg.add("RDatasets")
julia> using RDatasets
julia> using Gadfly
julia> iris = dataset("datasets", "iris")
julia> plot(x=iris[:SepalLength], Geom.histogram(bincount=30))

RとJuliaの散布図比較

RとJulia0.3でGadflyを使う時の比較です。

通常の散布図

R

plot(x=1:10, y=1:10)

Julia 0.3

plot(x=1:10, y=1:10)

データを直線で結ぶ

R

plot(x=1:10, y=1:10, type="o")

Julia

plot(x=1:10, y=1:10, Geom.point, Geom.line)

軸名とかタイトルとか

R

plot(x=1:10, y=1:10, xlab="x label", ylab="y label", main="Graph Title")

Julia

plot(x=1:10, y=1:10, Guide.xlabel("x label"), Guide.ylabel("y label"), Guide.title("Graph Title"))

全部使うと、

となります。

Julia 0.3で散布図を描く

julia> Pkg.add("Gadfly")

をすると、githubからソースをダウンロードしてインストールしてくれる。 パッケージを利用するときは、

julia> using Gadfly

とする。

julia> plot(x=rand(10), y=rand(10))

で、散布図を描くことができる。出力結果は、JavaScriptで吐かれて、