Pages

Thursday, December 2, 2021

データ分析やAI予測の基本中の基本「回帰分析」「最小二乗法」の基礎をPythonコードと図で理解する - ITmedia

この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。

 AIに欠かせない数学を、プログラミング言語Pythonを使って高校生の学習範囲から学び直す本連載『「AI」エンジニアになるための「基礎数学」再入門』。前回まではSeason1として基礎を学んできました。

 今回からはSeason2、応用編として下記の範囲を学んでいきます。

 応用編初回のテーマは「最小二乗法」です。

データ分析やAI予測の基礎「回帰分析」とは、「最小二乗法」とは

 皆さんは「Microsoft Excel」などで「回帰分析」を行ったことはあるでしょうか。

図1

 経験のある方は必見です。今回の記事を読めばモデル(=予測線)がどのように生成されるかが理解できます。これまでなんとなくポチっとボタンを押すと引かれていた線が、どのような線なのかが気になってきませんか。

 なお、「回帰分析とは何ぞや?」という方のために説明すると、概要はこちらの通りです。

  • 量的データ(連載第2回参照)の予測を直線で行う手法
  • 図1は「アイスの販売個数」を「気温」を用いて予測する様子

 図1のような線があれば「明日は27度になるそうだ」と分かり、「明日は240個ほどアイスが売れそうだ」と予測できるわけです。

2点を通る直線

 まずは高校数学の内容から思い出してみましょう。図2のような2点を通る直線はどのように求めるか覚えていますか?

図2

 このように解きます。

 まず、仮の線を「y = ax + b」と置く。

 点A (1,1) から、「1 = a + b」が成り立つ【1】。

 点B (2,2) から、「2 = 2a + b」が成り立つ【2】。

 ここで、【1】から、「a = 1 - b」を?に代入すると、「b = 0」となる【3】。

 【3】を【1】に代入すると、「a = 1」となる。

 よって、点A、点Bを通る直線は、「y = x」となる。


 これは比較的簡単ですね。

3点ある場合(直線的ではない)どうする?

 では図3のような3点がある場合に、「全ての点の近くを通る線を求めよ」といわれたら、どのような線が適切でしょうか?

図3

 問いをもう少し具体化します。仮の線を「y = ax + b」とすると、先ほどのようにa,bの値が決まれば線が決定します。

 従って、「どのような線を描くか?」=「a,bの値はいくつか?」ということになります。それでは、a,bはどのように求めるのでしょうか?

Copyright © ITmedia, Inc. All Rights Reserved.

Adblock test (Why?)


からの記事と詳細 ( データ分析やAI予測の基本中の基本「回帰分析」「最小二乗法」の基礎をPythonコードと図で理解する - ITmedia )
https://ift.tt/3pgLQw6

No comments:

Post a Comment