GRANVALLEY

ブログBlog

無料の統計ソフト『R』 ~ データ分析編 ~

公開日 2015年11月6日    最終更新日 2016年8月1日

R による分析方法『広告費と来客数を使った単回帰分析』

取り込んだデータを元に単回帰分析を行います。

ここでは、単回帰分析を行うために lm 関数を使用しています。広告費を独立変数とし、来客数を従属変数として、広告費が増えるごとに来客数がどのように変化するのかを分析します。結果を変数 result に格納します。

> result<-lm(来客数~広告費,data=x)

分析結果の表示は summary 関数を使用します。

r_007

Residuals は四分位数、Coefficients には直線の傾きとその有意確率が表示されます。また、最終列には決定係数と調整済み決定係数と、その有意確率が表示されます。

次からは分析結果をグラフに表示していきます。

まず、plot 関数を使用して、変数 x ( エクセルデータを格納した変数)に格納されているデータで散布図を作成します。

r_008

 次に、abline 関数を使用して、変数(回帰分析の結果を格納した変数)の内容から回帰直線をグラフに追加します。

r_009

このようにして、R を使った「広告費と来客数を使った単回帰分析」の分析結果を求めました。

最後に

これまでの操作内容をご覧頂いた通り、R は、命令を入力していく事で分析を行っていきます。そのため、マウス操作が基本となるパソコンを使用されている方には、使いづらいかもしれません。

また、オープンソースのフリーソフトウェアのため、メーカー製品の様なサポート体制も期待できませんが、各教育機関などの世界中の有志による検証やパッケージの開発が行われており、常に新しい個別分野の分析手法や関数が提供されています。そのため、製品として信頼性と拡張性が高くなっています。

R のパッケージは自分で作成する事も可能なため、独自の分析手法を追加する事ができます。さらに他の BI 製品が R との連携機能の提供を開始するなど、統計分析ソフトとしての知名度は飛躍的に高まってきています。

※ Microsoft、MS、Windows、Windows Server、Windows Vista、Excel、AccessおよびPowerPointは、米国 Microsoft Corporationの米国およびその他の国における登録商標です。
※ Windows の正式名称は、Microsoft Windows Operating System です。
※ その他の会社名、製品名は各社の登録商標または商標です。
※ 記事の内容は記事公開時点での情報です。閲覧頂いた時点では異なる可能性がございます。