Maximaを活用した数学学習

in [数ナビの部屋]

「Maxima」を活用した数学学習を取りまとめました．

[SiteMAP]

(注) MathJaxを使用しているので、スマホでは表示に時間がかかることがあります。
モバイル利用(Android)でのメニュー選択は、 SiteMapを利用するか、「長押し」から「新しいタブを開く」を選択してください。

■ 数式処理ソフト「Maxima」を活用した数学学習　[Map]

[御案内] 「Maxima」(マキシマ)は，フリーの数式処理ソフトです．有料の Mathematica や Maple に劣らないレベルの数式処理が可能であり， Linux，Windows，MacOSのみならず，Android版もあります. ここでは，数学学習での Maxima の活用法について解説します．

[お知らせ] スマホ(Android)版Maximaの解説本を出版しました．計算問題やグラフの確認をするときに非常に重宝します．フリーソフトなので一度試してみてください． PC版のコマンドレファランスとしても利用できます。

いつでも・どこでも・スマホで数学！

試し読み，森北出版， amazon，楽天， honto， 7net，紀伊國屋，電子版、読書メーター

■数学学習での活用

以下では，「TeXmacs」＋「Maxima」の画面で基本的な使い方を解説します．
詳しい解説は，リンク集に登録したサイトを参照してください．

確率・統計

　統計に特化したソフトウェアとしては，SPSS，SAS，Rなどが有名ですが， Maximaにも統計向けのパッケージが備わっています．

■回帰分析

　回帰分析では，互いに関連性があると思われる2種類のデータ \(\small X, Y\) があるとき，それらの関係を最もよく近似すると思われる関数 \(\small Y=f(X)\) を求めようとします．その関数を1次式で求めるのが単回帰分析です．説明変数が2変数以上のときは重回帰分析と呼ばれます．いずれも1次式による線形回帰です。パッケージ「stats」を読み込むと，これらの計算を行うコマンド「linear_regression」を利用することができます．指数関数などの1次式ではない関数で近似する場合は，別のコマンド「lsquares_estimate」を利用します．

単回帰分析

　単回帰分析では，目的変数を \(\small Y\), 説明変数を \(\small X\) とするとき，与えられたデータを「最も良く近似する1次式」を求めます．「最も良く近似する」ということをどのように考えるかが問題ですが，設定した式で推定される値と実際の値との差を求めて，その平方和が最小になるように定めます．この考え方は「最小二乗法」と呼ばれ，いろいろな場面で利用されます．

最小二乗法
　コマンド(linear_regression)にデータ(行列)を入力すると分析結果が得られますが，ブラックボックスとして利用するのではなく，どのようにして結果が得られているのかも理解した上で利用すべきでしょう．ここでは，基本となる「最小二乗法」の考え方について解説します．

　今，\(\small (X, Y)\) の具体的なデータを \(\small (x_1, y_1), (x_2, y_2), \ldots, (x_n, y_n)\) とすると，\(\small Y=b+mX\) による \(\small x=x_i\) のときの \(\small y_i\) の推測値は \(\small \hat{y}_i=b+mx_i\) です．最小二乗法は，実際の値との差の平方 \(\small (y_i-\hat{y}_i)^2\) を合計して

\[\small \sum_{i=1}^{n}\left\{y_i-(b+mx_i)\right\}^2\] が最小になるように \(\small b, m\) の値を定めます． \(\small (x_i, y_i)~(1\leq i\leq n)\) の値は与えられるので，この式は \(\small b, m\) の関数です．それを \(\small F(b, m)\) とおくと，結局は2変数関数 \(\small F(b, m)\) の最小値を求める問題になり，そのような点では極値になっていると考えられます． 1変数関数 \(\small f(x)\) の場合は， \(\small x=a\) で極値を取れば \(\small f'(a)=0\) が成り立ちます．偏微分法(多変数関数の微分法)で学ぶように， 2変数関数でも同様のことが成り立ちます．つまり，\(\small F(b, m)\) が極値をとれば，その点で \(\small b, m\) で微分するといずれも偏導関数の値は\(0\)になり \[\small \frac{\partial}{\partial b}F(b, m)=0,\quad \frac{\partial}{\partial m}F(b, m)=0\] が成り立ちます． \(\small \partial\) は，2変数以上の場合の微分を表す記号です．
　ここで，実際に \(\small F(b,m)\) を微分すると，合成関数の微分法により \[\begin{align*} \small \frac{\partial F}{\partial b} &\small =2\sum_{i=1}^{n}\left\{y_i-(b+mx_i)\right\}\cdot (-1)~ (1)\\ &\small =-2\left(\sum_{i=1}^{n}y_i-bn-m\sum_{i=1}^{n}x_i\right)\\ &\small =0\\ \small \frac{\partial F}{\partial m} &\small =2\sum_{i=1}^{n}\left\{y_i-(b+mx_i)\right\}\cdot (-x_i)\\ &\small =-2\left(\sum_{i=1}^{n}x_iy_i-b\sum_{i=1}^{n}x_i\right.\\ &\small　　　　\left. -m\sum_{i=1}^{n}x_i^2\right)=0\quad (2) \end{align*} \] となります．したがって，\(\small b, m\) は次の連立1次方程式を満たします． \[ \begin{cases}\small\displaystyle m\sum_{i=1}^{n}x_i^2+b\sum_{i=1}^{n}x_i=\sum_{i=1}^{n}x_iy_i ~ (3)\\ \small \displaystyle m\sum_{i=1}^{n}x_i+bn=\sum_{i=1}^{n}y_i\qquad (4) \end{cases}\] これを \(\small m\) について解くと次のようになります． \[\small m=\frac{\displaystyle n\sum_{i=1}^{n}x_iy_i-\sum_{i=1}^{n}x_i\sum_{i=1}^{n}y_i} {\displaystyle n\sum_{i=1}^{n}x_i^2-\left(\sum_{i=1}^{n}x_i\right)^2} \] 　ここで，共分散 \(\small s_{xy}=\displaystyle \frac1{n}\sum_{i=1}^{n}(x_i-\bar{x})(y_i-\bar{y})\) は， \[\small s_{xy}=\frac1{n}\sum_{i=1}^{n}x_iy_i-\bar{x}\bar{y} \] と変形することができ，分散 \(\small\displaystyle \sigma_x^2= \frac1{n}\sum_{i=1}^n(x_i-\bar{x})^2\) は \[\small \sigma_x^2=\frac1{n}\sum_{i=1}^{n}x_i^2-(\bar{x})^2\] と表すことができることに注意すると， \(\small m\) の分子・分母を \(\small n^2\) で割ることにより \[\small m=\frac{s_{xy}}{\sigma_x^2}\] と簡潔な式で表されます．
　一方, \(\small b\) の値は，(4)より \[\begin{align*}\small b&\small =\frac1{n}\sum_{i=1}^{n}y_i-m\cdot \frac1{n}\sum_{i=1}^{n}x_i\\ &\small =\bar{y}-m\cdot\bar{x}\end{align*}\] となります．つまり，2変量 \(\small X, Y\) について， \(\small \displaystyle \sum_{i=1}^nx_i, \sum_{i=1}^ny_i, \sum_{i=1}^nx_i^2, \sum_{i=1}^nx_iy_i\) の値が分かれば， \(\small b, m\) の値を計算できることになります．
　ここで，実際の値と推測値との差の平方の合計を \(\small n\) で割った平均の式 \[\begin{align*} &\small \frac1{n}\sum_{i=1}^{n}(y_i-\hat{y}_i)^2\qquad (5)\\ &\small =\frac1{n}\sum_{i=1}^{n}\left\{y_i-(b+mx_i)\right\}^2 \end{align*}\] に，今求めた \(\small b, m\) の値を代入して \[\small \frac1{n}\sum_{i=1}^{n}\left\{(y_i-\bar{y}) -\frac{s_{xy}}{\sigma_x^2}(x_i-\bar{x})\right\}^2\] を計算すると， \[\begin{align*} &\small \sigma_x^2=\frac1{n}\sum_{i=1}^{n}(x_i-\bar{x})^2\\ &\small \sigma_y^2=\frac1{n}\sum_{i=1}^{n}(y_i-\bar{y})^2\\ &\small s_{xy}=\frac1{n}\sum_{i=1}^{n}(x_i-\bar{x})(y_i-\bar{y}) \end{align*} \] であることなどから，(5)は \[\begin{align*} \small \sigma_y^2-\frac{s_{xy}^2}{\sigma_x^2} =\sigma_y^2\left\{1-\left(\frac{s_{xy}}{\sigma_x\sigma_y}\right)^2\right\} \end{align*}\] と変形することができます．ここに現れた \(\small \frac{s_{xy}}{\sigma_x\sigma_y}\) が相関係数 \(\small r\) です．\(\small r\) の値が 1 に近いほど推測値と実際の値との差が小さいことなり，データが一つの直線 \(\small y=b+mx\) の近くに分布していることを示しています．この直線が回帰直線であり，その係数 \(\small b, m\) が回帰係数です．
　以上の詳細は，統計の教科書やWebサイトを参照してください．