Back to page

− Links

 Print 

Python​/正規分布に従う乱数を生成する :: NJF Wiki

xpwiki:Python/正規分布に従う乱数を生成する

はじめに anchor.png[1] Edit [2]

Pythonでは正規分布(ガウス分布)に従う乱数を発生させる方法が標準で提供されています。

普通の一様な乱数よりは使用頻度は低いものの、正規分布は誤差などで自然に現れる確率分布で、統計の分野では非常に重要な分布です。

そのため、統計関係のテストデータの作成などにこの機能が使えます。

また、グラフィックなどで自然な形で集中したランダムな点を描画したい時や、ゲームで弾の照準に誤差を入れたいときなどにも使えます。

自分で実装するのもそう難しくはないのですが、少し面倒なので標準で使えるのは便利です。

注意:Pythonの正規分布の上側確率などを求める方法はPython​/標準正規分布[3]で紹介しています。

Page Top

random.gauss anchor.png[4] Edit [5]

生成するにはrandom.gaussを使います。 例えば、標準正規分布に従う乱数を生成するには以下のようにします。

import random

print(random.gauss(0,1))

結果:

-1.5001413318395698

など。

第一引数が平均値で第二引数が標準偏差です。

他にほぼ同様のメソッドとしてrandom.normalvariateがあります。

使い方も全く同じで第一引数が平均値で第二引数が標準偏差です。

ただし、gaussの方が高速で動作します。normalvariateはスレッドセーフのようです。(検証はしていません。)

一つだけ生成しても実際に正規分布になっているかどうか分からないので、100,000個の乱数を生成して小数第二位で四捨五入し、度数を数える以下のようなプログラムを作ってみました。

import random

dataCnt = {}
for i in range(100000):
    d = round(random.gauss(0,1),1)
    if d in dataCnt:
        dataCnt[d] += 1
    else:
        dataCnt[d] = 1

sortedData = sorted(dataCnt.items())

for k in sortedData:
    print("%.2f\t%d" % (k[0],k[1]))

この結果を表計算ソフトに貼り付けてグラフを描くと次のようになりました。

chart.png[6]

乱数なので少しばらつきがありますが、ほぼ正規分布になっていることが分かります。

Pythonにはこれ以外にも、対数分布、ガンマ分布やパレート分布、ワイブル分布などが標準で実装されています。

詳しくはこちらのドキュメント[7]で。

Page Top

おまけ:中心極限定理と一様分布から標準正規分布に従うランダムな数を生成する anchor.png[8] Edit [9]

計算コストが高くて実用性はないのですが、一様分布と中心極限定理から標準正規分布に従うランダムな数を生成してみます。

中心極限定理とは、母集団の分布が何であれそこから抽出された無作為標本の平均値は正規分布に従い、平均値は母集団と同じになり、標本の分散は母集団の分散の標本の大きさの平方根分の一となるというものです。

Wikipedia 中心極限定理[10]

そこで、たいていのプログラミング言語に実装されているランダムな一様分布を使って標準正規分布を導くことを考えてみます。

区間(a,b)の一様分布の平均は(b-a)/2、分散は(b-a)^2/12と分かっていますから、これと中心極限定理を使います。nを標本の大きさとして、平均0、分散1の標準正規分布となるようにa,bについての連立方程式を解くと、a=b=sqrt(3n)と求まります。

nを100として、標準正規分布に従うランダムな数を返す関数を作ると以下のようになります。

def cltRandom():
    n = 100
    sqr3 = 2 * math.sqrt(3*n)
    x = 0
    for i in range(n):
        x += (random.random() - 0.5) * sqr3
    
    return x / n

これを前節と同じように100,000回実行して小数第二位で四捨五入し、度数を数えてグラフを描くと以下のようになりました。

chartClt.png[11]

前節のグラフとほぼ同じになり、予想通り標準正規分布に従っていることが分かります。

この関数は、100回も乱数を生成するので実行速度はかなり遅く実用性はありません。

しかし、中心極限定理を実際に確かめられる簡単な例となっており、統計での正規分布の重要性を理解できると思います。


Last-modified: 2019-04-08 (Mon) 23:56:47 (JST) (596d) by njf