2020 SIRモデルでコロナシミュレーション: A Toy Model

JCGR理事/専修大学商学部教授

大林守

 コロナウイルスをはじめとする感染症に関してはSIRモデルという基本的なモデルがあります。SIRは、Susceptible, Infected, Recovered Modelの略です。学生用に最も単純なモデルをExcelファイル(SIRmod.xlsx)で配布したので、共有したいと思います。

 モデルは3変数(うつってしまった感染人口I、うつるかもしれない感受人口S、治ってしまった免疫人口R)と3係数(感染率λ、回復率γ、一定の総人口数)のみです。モデルで変化させる係数(パラメータ)は感染率λと回復率γです。仮に、ある感染者(キャリア)の感染力(感染させる確率)が1万分の1とし、単位時間に5人と接触すると仮定すると、1万分の5(0.0005)が感染率λとなります。単位時間あたり感染者の25パーセントが免疫を持ち回復する場合、回復率γは0.25となります。1000人の総人口に最初の感染者1人を仮定します。

これだけ準備ができれば、後はExcelファイルを添付しましたので、ダウンロードしてみてください。最初の5期までを出します。

SIRモデル(Susceptible, Infected, Recovered Model)

 

感受人口

感染者数

免疫人口

t

S(t)

I(t)

R(t)

0

1000.00

1.00

0.00

1

999.50

1.25

0.25

2

998.72

1.80

0.48

3

997.60

2.58

0.82

4

995.99

3.71

1.31

5

993.68

5.32

2.00

 結果を図示したのが以下です。通称エピグラフと言われているものです (epidemic: 疫学的)。今の想定では、28期に感染人口Iのピークを迎え、その後収束していきます。

 モデルシミュレーションを手軽に行うために、モデル係数を変化させることができるようにしてあります。まず、Excelシートの黄色の部分に数値を入れるとモデルの係数をパーセントで変化させることができます。感染率を25パーセント増加させる場合には数字で25を入れます。回復率を25パーセント減少させるには数字でマイナス25を入力します。

 

感染率

 

回復率

 変化分

  25.00%

 変化分

 -25.00%

    λ=

  0.00050

    γ=

  0.25

 

  0.00063

 

  0.19

 

  0.00063

 

  0.19

 

  0.00063

 

  0.19

 シミュレーション結果は自動的に図が変化します。感染者のピークが早まり、かつ爆発的に増加していますが、免疫獲得は早くなっています。ただし、このモデルでは免疫人口に死亡者が含まれています。

 Excelシートのオレンジ色の部分を個別に変更すれば、様々なケースを作りだすことができます。ロックダウンで感染率を下げたり、解除して感染率を上げたり、医療崩壊で回復率が悪化したり、医療体制の整備や治療方法の発見で回復率が向上したりという想定を細かく設定することができます。

 こういったモデルに統計的にきちんと日本の感染率と回復率を推計して入力すると現実を描写するモデルになります。さらに、感染率と回復率を決定する要因を精査すれば、様々な政策の効果も計算できます。ただし、そういったことをするなら、もっと精緻なモデルでやった方が賢いので、このレベルではこの程度が適度なモデル利用方法だと思います。お楽しみください。

 なお、数式があった方が分かりやすい方は、以下をご覧下さい。

感染人口の変化は、感染人口Iと感受人口Sに関して感染率λで比例すると仮定します。感受人口Sの変化は感染人口Iの裏返しで、感染人口増加分だけ感受人口は減少します。免疫人口Rは、感染人口Iに回復率γで比例します。このモデルでは、キャリア1人が登場すると、感受人口に感染率λを介して感染人口Iが決まり、回復率γを介して免疫人口Rを決めるようになっています。なお、免疫人口には死亡者も含まれますのでご注意ください。

数式では以下となりますが、Excelファイルに組み込んであるので、確認する程度にご覧下さい。

S(t)-S(t-1)=-λS(t)I(t)

I(t)-I(t-1)= λS(t)I(t)-γI(t)

R(t)-R(t-1)=γI(t)

以上

2020 経営幹部のためのデータサイエンス ーあしたのために(その1)ー

・データサイエンス研究会を10月開講予定に延期せざるをえなかった状況をご理解いただき有り難うございます。10月からの講座に有用な情報をブログで発信し、潜在的な受講者の方々とも情報共有して行きたいと思います。

・データサイエンスという言葉を狭い意味で使うときにはブラックボックス(アルゴリズム)的に分類や予測を行うコンピュータサイエンス(機会学習・深層学習・AI)を意味しますが、広い意味では伝統的な統計学から、計量経済学、計量ファイナンスそして計量マーケティングといった理論フレームワークを含めて考えるべきだと思います。

・一時は21世紀もっともセクシーな仕事と呼ばれたデータサイエンティストになるためには、数学、統計学、計量手法、そしてプログラミングなどの準備が必要となります。当然のことながら、経営幹部が今からそういった準備をするわけには行きません。本講座では、部下やコンサルタントが提出してくるデータ分析結果を理解する能力を養成することを主眼とします。最低限の必要な統計学を学び、さらに計量経済学を中心とした理論フレームワークで作業仮説を検証し、新たな知識創造につなげていくプロセスを体験することによってデータ分析結果を建設的かつ批判的に読解することを可能にします。

・10月までのあいだに何冊か参考書を読んでいただくことを考えたのですが、仕事を抱えながらサポートもなく独学するのは負担だと思います。そこで、”無料”のe-learningを紹介します。以下、e-learning情報を、負担が軽い順番に紹介します。

・まずは腕試しに軽く試してみるには良いと思います。

  0.コロラド大学の回帰分析シミュレーターで単回帰分析を経験
https://phet.colorado.edu/sims/html/least-squares-regression/latest/least-squares-regression_ja.html 

0.高校生のためのデータサイエンス入門
https://lms.gacco.org/courses/course-v1:gacco+pt010+2020_06/about

・サーベイ的ですから、聞き流し、というか見流し?すると良いでしょう。
1.データサイエンス・オンライン講座、社会人のためのデータサイエンス入門。
https://gacco.org/stat-japan/

・ほぼ本格的な講義です。意志が強くないと途中で挫折します。
2.統計学Ⅰ:データ分析の基礎 
https://lms.gacco.org/courses/course-v1:gacco+ga014+2020_04/about

・自分で手を動かしてついて行かないと、挫折します。そのうち(2)も公開されるはずです。
3.大学生のためのデータサイエンス(Ⅰ)
https://lms.gacco.org/courses/course-v1:gacco+ga109+2020_05/about

・とりあえず、これらでしばらくはデータ分析に対する知的好奇心を刺激し続けることができるでしょう。

大林 守 JCGR理事、専修大学商学部教授

2019 第3回-経営幹部のためのデータ分析:回帰分析101

第2回 経営幹部のためのデータ分析:回帰分析101の報告
 12月17日(火)に第2回特別早朝勉強会を開催しました。重回帰分析を復習した後、ダミー変数の使い方、重回帰分析結果を見るための勘どころを議論しました。さらに、より効率的に分析するため、表計算ソフトを卒業して、計量経済ソフトGretlでデータビジュアライゼーションと重回帰分析を行いました。

1月28日(火)午前8時より第3回特別早朝勉強会を開催します。
 回帰分析の応用を実習主体で行います。受講生の課題そしてデータの持ち込みを歓迎し、それらにチャレンジするという試みをやることになりました。気温と売り上げの関係を分析したいというお話があり、気象庁の東京の月次平均気温を取得したので分析してみます。その他、どんな課題でもよいので事前に分析候補そしてデータをお知らせください。データに関して、プライバシーや企業秘密にかかわるデータは注意して提出してください。なお、受講生からの課題やデータ提出がない場合は、こちらで練習データを準備します。
 なお、第1回参加者の方々も参加いただくことが可能です。

専修大学商学部 大林 守
Professor, School of Commerce, Senshu University<br/ >

以上。