数値計算の補足

Author

Affiliation

柳本和春

神戸大学

Published

October 11, 2025

Modified

January 16, 2026

Warning

このページは数値計算に関する補足を雑多にまとめたものです. 書きかけの内容を多く含みます.

Code

using Plots
using LaTeXStrings
using Distributions
using Roots
using Optimization
using OptimizationNLopt
import Random
Random.seed!(1234)

default(size=(500, 309), titlefontsize=10, fmt=:svg)

計算量

アルゴリズムの効率性を評価する尺度として、計算時間とメモリ使用量があります. ここでいう計算時間とは, アルゴリズムが終了するまでにかかるステップ数 (時間計算量, time complexity) のことをいい, 実際のPC上での実行時間とは異なります. より高いスペックのPCを使えば, 同じアルゴリズムでも実行時間は短くなる一方で, ステップ数の次元が異なるアルゴリズムはマシンの性能に関わらず効率的と言えます.また, メモリ使用量とはアルゴリズムが終了するまでに必要なメモリの量 (領域計算量, space complexity) のことをいいます.

時間計算量

時間計算量は, 入力の大きさ \(n\) に対するステップ数 \(T(n)\) の関数として表されます. 例えば, 配列の要素数が \(n\) のときに, すべての要素を1回ずつ見るアルゴリズムは, \(T(n) = n\) となります. また, 2重ループで配列のすべての組み合わせを調べるアルゴリズムは, \(T(n) = n^2\) となります. このように, アルゴリズムの時間計算量は, 入力の大きさに対するステップ数の増加率によって特徴づけられます.

時間計算量を評価する際, 重要なのは支配的な項の次元数になります. 例えば, \(T(n) = 3n^2 + 2n + 1\) の場合, \(n\) が大きくなると \(3n^2\) の項が支配的になるため, \(n^2\) に着目すれば十分です. この考え方に従ったとき, 計算量を \(O(n^2)\) と表記します. より厳密に表現すると以下のようになります.

\(O\)-記法

\(f(n)\) が \(O(g(n))\) とは, 任意の \(n \ge 0\) に対して, ある定数 \(C > 0\) が存在して, 以下の不等式が成り立つことをいう.

\[ |f(n)| \le C |g(n)|. \]

定量モデルで気にする必要があるのは, ほとんどの場合, グリッド数によるオーダーです. 例えば, \(V(k, z)\) のような2次元の価値関数をグリッド上で計算する場合, \(k\) のグリッド数 \(n_k\) と \(z\) のグリッド数 \(n_z\) に対して, 計算量は \(n_k n_z\) の関数となります.

領域計算量

領域計算量は, アルゴリズムが終了するまでに必要なメモリの量を, 入力の大きさ \(n\) に対する関数として表します. 例えば, 配列の要素数が \(n\) のときに, すべての要素を保存するアルゴリズムは, 領域計算量が \(O(n)\) となります. また, 2次元配列を保存するアルゴリズムは, 領域計算量が \(O(n^2)\) となります.

メモリのヒエラルキー

なぜメモリの使用量が重要なのでしょうか. 近年のPCは何百GBもの容量があるし, いくら使おうと問題ではないのではないか, と思うかもしれません. しかし, 実際には, メモリのヒエラルキー (memory hierarchy) によって, メモリの速度と容量が大きく異なります.

一般に, 高速なメモリは高価であるため搭載量が少なく, 低速なメモリは安価であるため搭載量が多いです. それらを合わせると図 1 ようなピラミッド型のヒエラルキーが形成されます.

レジスタ (Registers): CPU内部にある最も高速なメモリ
キャッシュ (Cache): (近年では) CPU内部にある高速なメモリ. L1, L2, L3 などのレベルがある. ここまでCPU内部にある.
主記憶 (Main Memory): RAM (Random Access Memory)
補助記憶 (Auxiliary Storage): SSD (Solid State Drive) やHDD (Hard Disk Drive)

たとえば, AMDの最新世代のCPUである Ryzen 5 9600 の場合, L1キャッシュは480KB, L2キャッシュは6MB, L3キャッシュは32MBです. レジスタはサイズで表現することはあまりありませんが, ざっくり数百B程度と考えてください. 一方で, 一般にメモリと呼ばれる RAM は8GBから64GB 程度が一般的です. さらに, 一般にストレージとよばれるSSDやHDDは数百GBから数TBの容量があります.

計算量の実践

実際にモデルを使って, 計算量を測定してみましょう. 例えば, 以下のような単純なライフサイクルモデルを考えます.

Model

\[ \max_{\{c_t, a_{t+1}\}_{t=0}^{T-1}} \sum_{t=0}^{T-1} \beta^t u(c_t) \\ \quad\text{s.t. } c_t + a_{t+1} = (1+r) a_t + w, \quad a_0 \text{ given}, \quad a_T \ge 0. \]

これは後方帰納法で解くことができます. コードで表すと次の solve! 関数のようになります.

module My

@kwdef struct Model{TF<:AbstractFloat,TI<:Integer}

    # Utility function
    γ::TF = 2.0
    β::TF = 0.96
    T::Int = 10

    # Prices
    r::TF = 0.07
    w::TF = 5.0

    # Grid for assets
    n_a::TI = 30
    a_min::TF = 0.1
    a_max::TF = 4.0
    a_grid::Vector{TF} = collect(range(start=a_min, stop=a_max, length=n_a))

    # Value function
    V::Matrix{TF} = zeros(n_a, T)
end

u(c, m::Model) = isone(m.γ) ? log(c) : c^(1 - m.γ) / (1 - m.γ)

function solve!(m::Model)
    (; T, n_a, r, w, β, a_grid) = m

    V = zeros(n_a, T)
    for t = T:-1:1, i_a = 1:n_a

        utility = -Inf
        for i_a′ = 1:n_a
            V′ = (t == T) ? 0.0 : V[i_a′, t+1]
            c = (1 + r) * a_grid[i_a] + w - a_grid[i_a′]

            if c > 0
                utility = max(u(c, m) + β * V′, utility)
            end

        end

        V[i_a, t] = utility
    end

    m.V .= V

    return nothing
end

end # module My

時間計算量の数え方として, 四則演算, 比較 (>, max など), 代入, 配列へのアクセスは \(O(1)\) とします. すると, 計算回数の主要部は for-loop つまり, \(O(n_a^2 T)\) です. メモリ使用量は, 価値関数 \(V\) の保存に使用している部分が支配的なので \(O(n_a T)\) です. では, \(T = 10\) で固定して, \(n_a\) を変化させたときの計算時間とメモリ使用量を測定してみましょう.

BenchmarkTools.jl

Juliaでは, BenchmarkTools.jl パッケージを使うと実際の計算時間とメモリ使用量を測定できます.¹

using BenchmarkTools

@benchmark My.solve!(m) setup = (m = My.Model(n_a=100))

BenchmarkTools.Trial: 10000 samples with 1 evaluation per sample.
 Range (min … max):  375.875 μs … 877.041 μs  ┊ GC (min … max): 0.00% … 0.00%
 Time  (median):     403.459 μs               ┊ GC (median):    0.00%
 Time  (mean ± σ):   409.112 μs ±  12.697 μs  ┊ GC (mean ± σ):  0.00% ± 0.00%

                       █▂▅▄▄▂▃▂▂▁▂▁▁▁▁▁▁▁     ▁  ▁▁             ▁
  ▆▁▃▁▁▁▁▁▁▃▃▁▃▁▁▁▃▁▃▁▁████████████████████████████▇▇▆▇▇█████▇█ █
  376 μs        Histogram: log(frequency) by time        454 μs <

 Memory estimate: 8.08 KiB, allocs estimate: 3.

@benchmark マクロは上記のように関数の実行時間に合わせて適切な試行回数を自動で決定し, 実行時間の分布を表示してくれます. 基本的には中央値 (median) を見るのが良いでしょう.

メモリ使用量も8.08KiBと表示されています. 今回の配列 V は Float64 型の2次元配列で, \(n_a\) 行 \(T\) 列なので, メモリ使用量は \(8 n_a T\) バイトになります (64bit = 8バイト) . 例えば, \(n_a = 100\) のときは \(8 \times 100 \times 10 = 8000\) バイトで, 8.08KiB (1KiB = 1024バイト) とほぼ一致しています.

次に \(n_a = 1000\) としたときの計算時間を測定してみましょう.

@benchmark My.solve!(m) setup = (m = My.Model(n_a=1000))

BenchmarkTools.Trial: 125 samples with 1 evaluation per sample.
 Range (min … max):  40.004 ms …  41.663 ms  ┊ GC (min … max): 0.00% … 0.00%
 Time  (median):     40.131 ms               ┊ GC (median):    0.00%
 Time  (mean ± σ):   40.157 ms ± 161.254 μs  ┊ GC (mean ± σ):  0.00% ± 0.00%

        ▂▃   █▁  ▆                                              
  ▃▁▁▄▆▆███▆▆██▇▆█▇▄▆▄▃▄▅▆▁▁▁▃▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▃▁▁▁▁▁▁▁▃▁▁▁▁▁▃ ▃
  40 ms           Histogram: frequency by time         40.6 ms <

 Memory estimate: 80.08 KiB, allocs estimate: 3.

おおむね計算時間が100倍, メモリ使用量が10倍になっていることがわかります. これは, 計算時間が \(O(n_a^2 T)\), メモリ使用量が \(O(n_a T)\) であることと一致しています.

微分

数値計算の文脈において微分は主に3種類あります.

数式微分 (Symbolic Differentiation)
数値微分 (Numerical Differentiation)
自動微分 (Automatic Differentiation)

数式微分 (手計算による解析的な微分) が可能な場合は, これが最も高速で効率的ですが, 複雑な関数に対しては, 数値微分や自動微分などで計算する必要があります. 以下では, 次のラグランジアンを例に, それぞれの微分方法を説明します.

\[ \mathcal{L} = \phi \log \left(w(1-l)\right) + (1-\phi) \frac{l^{1-\gamma}}{1-\gamma} \]

数式微分 (Symbolic Differentiation)

いわゆる手計算による微分です. 一階条件を求めると,

\[ \frac{\partial \mathcal{L}}{\partial l} = -\frac{\phi}{1-l} + (1-\phi) l^{-\gamma} = 0. \]

Symbolics.jl パッケージを使うと, Julia上で数式微分を行うこともできます.

using Symbolics
using Latexify

@variables w l ϕ γ
L = ϕ * log(w * (1 - l)) + (1 - ϕ) * l^(1 - γ) / (1 - γ)
∂l = Differential(l)
∂L∂l = expand_derivatives(∂l(L))
println(latexify(∂L∂l))

\[\begin{equation} \frac{ - \phi}{1 - l} + l^{ - \gamma} ~ \left( 1 - \phi \right) \end{equation}\]

数値微分 (Numerical Differentiation)

\[ f'(x) = \lim_{\Delta \to 0} \frac{f(x+\Delta) - f(x)}{\Delta}. \]

数値微分は上記の微分の定義を数値的に近似する方法です. 定義通りに行うと, 非常に小さい \(d\) (例えば \(10^{-9}\) など) を使って, 以下のように近似できます.

\[ f'(x) \approx \frac{f(x+d) - f(x)}{d}. \]

実用上は, 中心差分 (central difference) を使うことが多いです.

\[ f'(x) \approx \frac{f(x+\frac{1}{2}d) - f(x-\frac{1}{2}d)}{d}. \]

Julia では, FiniteDiff.jl パッケージを使うと数値微分ができます.

using FiniteDiff
f(l; w=1., ϕ=0.5, γ=1.5) = ϕ * log(w * (1 - l)) + (1 - ϕ) * l^(1 - γ) / (1 - γ)
f′_analytical(l; w=1., ϕ=0.5, γ=1.5) = -ϕ / (1 - l) + (1 - ϕ) * l^(-γ)
f′_numerical(l; Δ=1e-9) = (f(l + 0.5 * Δ) - f(l - 0.5 * Δ)) / Δ
f′_finitediff(l) = FiniteDiff.finite_difference_derivative(l -> f(l), l)

Code

plot(0.2:0.01:0.9, f′_analytical, label="Analytical")
plot!(0.2:0.01:0.9, f′_numerical, label="Numerical", linestyle=:dash)
plot!(0.2:0.01:0.9, f′_finitediff, label="FiniteDiff.jl", linestyle=:dot)

Figure 2: Comparison of analytical and numerical derivatives.

自動微分 (Automatic Differentiation)

数値微分はとてもシンプルな実装ですが, \(d\) の選び方によっては精度が悪くなる可能性があります. より高い精度を求める場合は, 自動微分を用いることができます. 自動微分は, 関数を基本的な演算 (多項式, 三角関数, 対数関数など) の組み合わせとして分解し, 各基本演算の微分を連鎖律に基づいて計算する方法です. これは, 数式微分を数値的に実行するようなイメージです.

順伝播と逆伝播

\[ \frac{dy}{dx} = \frac{dy}{du} \cdot \frac{du}{dx} \]

順伝播 (forward mode): 入力から出力に向かって微分を計算する方法.
- \(\frac{du}{dx}\) を計算し, それを用いて \(\frac{dy}{du}\) を計算する.
逆伝播 (reverse mode): 出力から入力に向かって微分を計算する方法.
- \(\frac{dy}{du}\) を計算し, それを用いて \(\frac{du}{dx}\) を計算する.

一般に \(f: \mathbb{R}^m \to \mathbb{R}^n\) に対して, \(m > n\) の場合は逆伝播が効率的であり, \(m < n\) の場合は順伝播が効率的です. 例えば, ニューラルネットワークでは, 多数のパラメータ (重み) を持つモデルに対して, 単一の損失関数を最小化するために逆伝播がよく使われます.

順伝播の効率的な実装は双対数 (dual numbers) を用いて行えることが知られています. 一方, 逆伝播の効率的な実装は難しく, 様々な手法が提案されている状況です. 詳しくは, Perla, Sargent, and Stachurski (n.d.) の9.2節を参照してください.

Julia では, ForwardDiff.jl パッケージを使うと順伝播の自動微分ができます.

using ForwardDiff
f′_forwarddiff(l) = ForwardDiff.derivative(l -> f(l), l)

Code

plot(0.2:0.01:0.9, f′_analytical, label="Analytical")
plot!(0.2:0.01:0.9, f′_forwarddiff, label="ForwardDiff.jl", linestyle=:dash)

Figure 3: Comparison of analytical and automatic derivatives.

並列計算

現代のPCは複数のコアを持つマルチコアCPUを搭載しています. パッケージのバックグラウンドで並列計算が用いられていることもありますが, 基本的にはユーザーが明示的に並列計算を指示する必要があります.

まずは, 自分のPCが何コア持っているかを確認してみましょう.

Threads.nthreads()

ここで, スレッド数が1となっている場合は, Juliaを起動する前に環境変数 JULIA_NUM_THREADS を設定する必要があります.

Quarto: julia.exeflags: ["--threads=auto"] をYAMLヘッダーに追加
VSCode: settings.json に "julia.numThreads": "auto" を追加
ターミナル: export JULIA_NUM_THREADS=auto を実行

auto と設定した場合, 利用可能なコア数に応じて自動的にスレッド数が設定されます. 現代のPCであれば, ほとんどの場合, 利用可能なコア数が2以上になるはずです.

function solve_multi!(m::My.Model)
    (; T, n_a, r, w, β, a_grid) = m

    V = zeros(n_a, T)
    for t = T:-1:1
        Threads.@threads for i_a = 1:n_a
            utility = -Inf
            for i_a′ = 1:n_a
                V′ = (t == T) ? 0.0 : V[i_a′, t+1]
                c = (1 + r) * a_grid[i_a] + w - a_grid[i_a′]

                if c > 0
                    utility = max(My.u(c, m) + β * V′, utility)
                end

            end

            V[i_a, t] = utility
        end
    end

    m.V .= V

    return nothing
end

@benchmark My.solve!(m) setup = (m = My.Model(n_a=1000))

BenchmarkTools.Trial: 125 samples with 1 evaluation per sample.
 Range (min … max):  39.952 ms … 40.570 ms  ┊ GC (min … max): 0.00% … 0.00%
 Time  (median):     40.133 ms              ┊ GC (median):    0.00%
 Time  (mean ± σ):   40.148 ms ± 90.382 μs  ┊ GC (mean ± σ):  0.00% ± 0.00%

           ▂ ▂▄█▄▄    ▄▃▄ ▂                                    
  ▃▁▁▁▁▁▁▅▃██████████████▆█▅▇▁▁▁▆▆▃▁▃▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▃▁▁▁▁▁▃ ▃
  40 ms           Histogram: frequency by time        40.6 ms <

 Memory estimate: 80.08 KiB, allocs estimate: 3.

@benchmark solve_multi!(m) setup = (m = My.Model(n_a=1000))

BenchmarkTools.Trial: 1204 samples with 1 evaluation per sample.
 Range (min … max):  3.887 ms …  18.181 ms  ┊ GC (min … max): 0.00% … 74.57%
 Time  (median):     3.987 ms               ┊ GC (median):    0.00%
 Time  (mean ± σ):   4.143 ms ± 588.134 μs  ┊ GC (mean ± σ):  0.69% ±  3.79%

      ▅█▅▂        ▁▁       ▁▂▂▂▁▂▂                             
  ▅▁▄▆██████▇▇██▆▇████▆▆▇███████████▆▆▅▇▅▆▅▅▄▆▅▅▄▄▄▁▄▅▁▅▄▁▄▁▄ █
  3.89 ms      Histogram: log(frequency) by time      4.85 ms <

 Memory estimate: 181.02 KiB, allocs estimate: 863.

並列化した場合, 1コアで実行した場合と比べて, おおむねスレッド数に応じて計算時間が短縮されていることがわかります. ただし, ここまで理論値に近い速度向上が得られることは稀で, 実際には理論値の数%から数十%程度の速度向上にとどまることが多いです.

並列化できない計算

並列計算の大前提は, 各スレッドが独立して計算できることです. 今回は後方帰納法で解くため, 時刻 \(t\) の価値関数を計算する際に, 時刻 \(t+1\) の価値関数が必要になり, 時刻方向に並列化することはできません.

function solve_multi_illegal!(m::My.Model)
    (; T, n_a, r, w, β, a_grid) = m

    V = zeros(n_a, T)
    Threads.@threads for t = T:-1:1
        for i_a = 1:n_a
            utility = -Inf
            for i_a′ = 1:n_a
                V′ = (t == T) ? 0.0 : V[i_a′, t+1]
                c = (1 + r) * a_grid[i_a] + w - a_grid[i_a′]

                if c > 0
                    utility = max(My.u(c, m) + β * V′, utility)
                end

            end

            V[i_a, t] = utility
        end
    end

    m.V .= V

    return nothing
end

Code

m = My.Model(n_a=100)
solve_multi_illegal!(m)

plot(m.a_grid, m.V[:, end], xlabel=L"a", ylabel=L"V(a, t)", label=L"t=T")
plot!(m.a_grid, m.V[:, end-2], label=L"t=T-2")
plot!(m.a_grid, m.V[:, begin], label=L"t=1")

Figure 4: Value function computed with illegal parallelization.

図 4 のように, 時間方向に並列化すると正しい価値関数が得られません.

Monte Carlo Simulation for SMM

SMM (Simulated Method of Moments) のようなシミュレーションベースの推定では, モデルのパラメータを変化させながら (モンテカルロ) シミュレーションを繰り返す必要があります. このとき, 正確に実装しないと, モデルのパラメータを変化させるたびにランダムな数を生成してまい, 正確な最適化ができません. そのため, モデルのパラメータを変化させるたびに新たに乱数を生成するのではなく, 事前に乱数を生成しておきそれを使いまわす必要があります.

例として, 第二回の授業で扱った次のモデルを考えましょう.

モデル

\[ \max_{c, l} u(c, l) = \frac{c^{1-\gamma_c}}{1-\gamma_c} + \alpha_l \frac{l^{1-\gamma_l}}{1-\gamma_l} \quad \text{s.t.} \quad c = w (1 - l), \]

where

\[ \log w \sim \mathcal{N}(\mu, \sigma). \]

標準化のため, \(\mu = 0\) とする. この時, \(\theta = (\alpha, \sigma)\) を推定する.

Code

mean_hours_data = 33.4 / (16 * 7)
earn = [25, 75, 150, 250, 350, 450, 550, 650, 750, 850, 950, 1100, 1200]
density = [13.7, 12.2, 12.3, 14.8, 20.2, 16.3, 7.0, 2.0, 0.6, 0.4, 0.1, 0.3, 0.2] / 100
mean_learn_data = density' * log.(earn)
sd_learn_data = sqrt(density' * (log.(earn) .- mean_learn_data) .^ 2)

foc(l; w=1.0, γ_c=1.5, α_l=1.2, γ_l=1.5) =
    w^(1 - γ_c) * (1 - l)^(-γ_c) - α_l * l^(-γ_l)

function hours_worked(w; γ_c=1.5, γ_l=1.5, α=1.2)
    y::Float64 = find_zero(y -> foc(1 / (1 + exp(y)), w=w, γ_c=γ_c, α_l=α, γ_l=γ_l), 0.0)
    l = 1 / (1 + exp(y))
    return 1 - l
end

悪い実装例

function mc_bad(α, σ; n_mc=10^3)
    ws = rand(LogNormal(0, σ), n_mc)
    hs = similar(ws)
    learns = similar(hs)
    for (i, w) in enumerate(ws)
        h = hours_worked(w; α=α)
        hs[i] = h
        learns[i] = log(w * (1 - h))
    end
    return [mean(hs), std(hs)]
end

loss(α, σ; fn_mc, d=[mean_hours_data, sd_learn_data]) =
    sqrt(sum(((fn_mc(α, σ) .- d) ./ d) .^ 2))
prob = OptimizationProblem((x, p) -> loss(x[1], x[2], fn_mc=mc_bad), [0.5, 0.5],
    lb=[1e-3, 1e-3], ub=[10.0, 10.0])

try
    sol = solve(prob, NLopt.LN_SBPLX())
catch e
    println("Optimization failed as expected:")
    println(e)
end

Optimization failed as expected:
CapturedException(Roots.ConvergenceFailed("Algorithm failed to converge"), Any[(#find_zero#40 at find_zero.jl:229 [inlined], 1), (find_zero at find_zero.jl:210 [inlined], 2), (find_zero at find_zero.jl:243 [inlined], 1), (#hours_worked#9 at 10-2-numerical-method.qmd:429 [inlined], 1), (hours_worked at 10-2-numerical-method.qmd:428 [inlined], 1), (mc_bad(α::Float64, σ::Float64; n_mc::Int64) at 10-2-numerical-method.qmd:444, 1), (mc_bad at 10-2-numerical-method.qmd:439 [inlined], 1), (loss(α::Float64, σ::Float64; fn_mc::typeof(mc_bad), d::Vector{Float64}) at 10-2-numerical-method.qmd:451, 1), ((::var"#16#17")(x::Vector{Float64}, p::SciMLBase.NullParameters) at 10-2-numerical-method.qmd:453, 1), ((::OptimizationFunction{true, SciMLBase.NoAD, var"#16#17", Nothing, Nothing, Nothing, Nothing, Nothing, Nothing, Nothing, Nothing, Nothing, Nothing, Nothing, Nothing, Nothing, typeof(SciMLBase.DEFAULT_OBSERVED_NO_TIME), Nothing, Nothing, Nothing, Nothing, Nothing, Nothing, Nothing, Nothing, Nothing, Nothing})(::Vector{Float64}, ::Vararg{Any}) at scimlfunctions.jl:4276, 1)  …  (with_inline_display(f::QuartoNotebookWorker.var"#7#8"{String, String, Int64, Dict{Any, Any}}, cell_options::Dict{Any, Any}) at InlineDisplay.jl:31, 1), (_render_thunk(thunk::Function, code::String, cell_options::Dict{Any, Any}, is_expansion_ref::Base.RefValue{Bool}; inline::Bool) at render.jl:43, 1), (_render_thunk at render.jl:35 [inlined], 1), (render(code::String, file::String, line::Int64, cell_options::Dict{Any, Any}; inline::Bool) at render.jl:15, 1), (render(code::String, file::String, line::Int64, cell_options::Dict{Any, Any}) at render.jl:1, 1), (render(::String, ::Vararg{Any}; kwargs::Base.Pairs{Symbol, Union{}, Nothing, @NamedTuple{}}) at startup.jl:145, 1), (top-level scope at none:1, 1), (eval(m::Module, e::Any) at boot.jl:489, 1), ((::Main.var"#22#23")(chan::Channel{Any}) at startup.jl:158, 1), ((::Base.var"#562#563"{Main.var"#22#23", Channel{Any}})() at channels.jl:141, 1)])

ナイーブな実装として, パラメータ \(\alpha, \sigma\) を変化させるたびに新たに乱数を生成する方法を示しました. これでは, 最適化アルゴリズムが正しく動作しません. 例えば, 上記のコードを実行すると, 収束すべき hours_worked の時点で失敗してしまいました. これは, SMMの中の推定が安定せず, α, σ がかなり極端な値に飛んでしまったためです.

良い実装例

SMMで推定するパラメータが確率分布のパラメータであるときは, どのように乱数を生成すれば良いでしょうか. これには大きく二つの方法があります.

1. 逆関数法 (Inverse Transform Sampling)

累積分布関数 (CDF) の逆関数 (分位点関数) を用いる方法です. 任意の確率分布 \(F(x; \theta)\) に対して, 一様乱数 \(u \sim U[0, 1]\) を生成し, \(x = F^{-1}(u; \theta)\) とすることで, パラメータ \(\theta\) に依存した乱数を生成できます. SMMでは, \(u\) を固定し, \(\theta\) を変化させることで, 滑らかな目的関数を得ることができます.

us_fixed = rand(10^3)

function mc_inverse(α, σ; us=us_fixed)
    hs = similar(us)
    learns = similar(hs)

    ws = quantile.(LogNormal(0, σ), us)
    for (i, w) in enumerate(ws)
        h = hours_worked(w; α=α)
        hs[i] = h
        learns[i] = log(w * (1 - h))
    end
    return [mean(hs), std(learns)]
end

prob = OptimizationProblem((x, p) -> loss(x[1], x[2], fn_mc=mc_inverse),
    [0.5, 0.5], lb=[1e-3, 1e-3], ub=[10.0, 10.0])
sol = solve(prob, NLopt.LN_SBPLX())
α, σ = sol.x

2-element Vector{Float64}:
 3.7240732754118326
 0.899322477232912

2. 位置・尺度変換 (Location-scale Transformation)

正規分布や一様分布のように, 標準分布 \(Z\) からの線形変換 \(X = \mu + \sigma Z\) で表現できる分布 (位置・尺度母数族) の場合, 標準分布からの乱数を固定して変換する方法が使えます. 対数正規分布の場合も, \(\log w \sim N(\mu, \sigma^2)\) なので, \(\log w = \mu + \sigma \varepsilon,\quad\varepsilon \sim N(0, 1)\) と表せます.

εs_fixed = randn(10^3)
function mc_transform(α, σ; εs=εs_fixed)
    hs = similar(εs)
    learns = similar(hs)

    ws = exp.(σ .* εs)
    for (i, w) in enumerate(ws)
        h = hours_worked(w; α=α)
        hs[i] = h
        learns[i] = log(w * (1 - h))
    end
    return [mean(hs), std(learns)]
end

prob = OptimizationProblem((x, p) -> loss(x[1], x[2], fn_mc=mc_transform),
    [0.5, 0.5], lb=[1e-3, 1e-3], ub=[10.0, 10.0])
sol = solve(prob, NLopt.LN_SBPLX())
α, σ = sol.x

2-element Vector{Float64}:
 3.6752461544094808
 0.8845469509294177

なお, 多変数正規分布 \(X \sim \mathcal{N}\left(\symbf{\mu}, \Sigma \right)\) は, \(X = \symbf{\mu} + L \Xi,\quad \Xi \sim \mathcal{N}(\symbf{0}, I)\) と表せます. ここで, \(L\) は \(\Sigma\) のCholesky分解です. したがって, 多変量正規分布の場合も, 標準正規分布からの乱数を固定して変換する方法が使えます.

References

Perla, Jesse, Thomas J. Sargent, and John Stachurski. n.d. “Quantitative Economics with Julia.” Quantitative Economics with Julia. https://julia.quantecon.org/intro.html. Accessed October 8, 2025.

Footnotes

@time マクロでも簡易的に測定できますが, 関数の宣言によるコンパイル時間なども含んでしまうため, 関数の実行速度を正確に測定するには BenchmarkTools.jl パッケージを使うのが望ましいです.↩︎