cocolog:95436730
大日康史&菅原民枝『パンデミック・シミュレーション - 感染症数理モデルの応用』と 栗田順子『新型コロナウイルス感染症第一波のパンデミック・シミュレーション - 数理モデルからの振り返り』を読んだ。興味あるところをザッと目を通しただけだが。 (JRF 3168)
JRF 2025年5月 9日 (金)
その流れで今回の2冊も読んだ。シミュレーションに関心を持つだけで、医学・生物学には関心を持たず、ザッと目を通しただけになる。
まず、『パンデミック・シミュレーション』のほうから、ちょっとだけ引用しながらコメントする。
JRF2025/5/93122
……。
『パンデミック・シミュレーション - 感染症数理モデルの応用』(大日 康史 & 菅原 民枝 著, 技術評論社 tanQブックス, 2009年8月)
https://www.amazon.co.jp/dp/4774139408
https://7net.omni7.jp/detail/1102718603
2009年8月の新型インフルエンザの話題のころの本で、コロナを知った我々にはまだ牧歌的な風景のもとにある。コンピュータの性能も今ほどではない。
JRF2025/5/90044
……。
SIR モデルは単純すぎるモデルだが、実データとのあてはめ(real-time estimation など)には有効で、ibm (ABM: agent-based model と同じ意味か、より人間性のあるモデルのこと)のほうが制御性があっていろいろできるが、実データとの関連は難しいとのこと。
JRF2025/5/98519
>real-time estimation のための方法論はすでに確立しており、あとは本番を待つのみです。これは SIR モデルの非常に重要な特徴で、次節で詳しく述べ、本書の基本的なモデルである individual based model (以下、略して ibm) では実施が極めて困難です。ibm は real-time estimation を行うにはモデルが複雑すぎるのです。
JRF2025/5/94523
実際の新型インフルエンザ発生時には、現地に統計学者を派遣して疫学調査と並行して real-time estimation が行われるでしょうから、その現地の環境に大規模なコンピュータ資源を持参できないし、また日々刻々と変わる状況に対応できません。ここは身軽な SIR モデルの方がはるかに適しています。
<(p.53)
JRF2025/5/93741
SIR モデルなどで使われてる常微分方程式の実データとのマッチは、Stan などで常微分方程式のまま行える。それは、岩見&中岡&岩波『ウイルス感染の数理モデルとシミュレーション』で知った(参: [cocolog:95369157](2025年4月))
いちおう大久保潤『確率的シミュレーション』第8章で読んだ(参: [cocolog:95358180](2025年4月))粒子フィルタとかが複雑なモデルのデータ同化に使えるとの話だったが、ibm ぐらい複雑になるとそれは無理なのだろう。
JRF2025/5/95026
……。
>もちろん ibm では「現実性」が重要になります。そのために、家族構成や、学校や職場への通勤通学時間、学校や職場の規模を、国勢調査などの調査に合わせています。<(p.54)
実は Grok さんに教えてもらった直近のシミュレーションの前に、↓というものを作って、「ibm」的シミュレーションをしようと思っていた。
《JRF-2018/simple_synthetic_population: 仮想合成人口個票の簡易な実装》
https://github.com/JRF-2018/simple_synthetic_population
JRF2025/5/92508
ただ、ウィルス弱毒化とか示したいものは、直近のシミュレーションで示してしまったので、simple_synthetic_population を使って何を示せばよいのか…とちょっと悩んでいた。(↑は家族構成だけの生成だが、それに職場・学校・通勤などを考慮する拡張も当然やろうとは思っていた。その上での話。)
今回の本によると、初発者からの広がりにおいて、その初発者がどういう人物かによって広がり方が違い、対策として例えば抗ウィルス薬(タミフルなど)の予防によって封じ込めが行える…等のシミュレーションができるとわかった。
まぁ、それをマネするかどうかはわからないが…。
JRF2025/5/99354
……。
諸外国で作られた ibm には、日本の感染動態にとって大事な満員電車などの通勤・通学が考慮されていない。それを考慮するため、著者らは「パーソントリップ調査」の結果をシミュレーションに組み入れた。
JRF2025/5/91155
>日本には、実際の「所在」と「移動」を同時に示したデータが調査されています。これはパーソントリップ調査(以下、PT データ)と呼ばれ、「人(パーソン)の移動(トリップ)の調査です。どのような人が、いつ、何の目的で、どこから、どこへ、どのような交通手段で動いたかについて調査してあり、1日のすべての動きが把握されています。このデータは、あくまでも都市計画のために調査されたデータで、主に都市の望ましい交通体系のあり方が検討されています。このデータは、知り得る最も現実的な所在と移動の情報です。
JRF2025/5/93497
この PT データを用いることで、家庭や学校、職場などの所在地での感染、電車などの移動手段内での感染を組み込むことができます。
(…)
こうした実際のデータを用いた ibm (real individual based model。以下略して ribm) は、シミュレーション上感染や発症を確認した患者の居住地を具体的に提供できます。それを正確に地図上で表現することによって、空間的な状況を視覚的にとらえることも可能になりました。このことから、感染症対策を計画するときに、具体的な対策を考案することができるようになります。
<(p.77-78)
JRF2025/5/97652
PT データは各自治体に頼んで提供してもらったようだ。こういう苦労をかけられるのがちゃんとした研究者となんちゃって素人の私の違いで、頭が下がる。
JRF2025/5/95048
……。
>症候群サーベイランス<(p.152)
症候群サーベイランスが重要なのはわかるが、そのリアルタイムデータをどう活かせるのか…と考えると限界もあるように思う。
何か特別な症状が見られるという場合、医師が気付いて上のほうに連絡するだろう。それと比べて気付きにくい広がりがわかるのが、サーベイランスだが、地域封鎖とかを行う規模だとすれば、医師個人の側でも気付くだろう…というのはある。
薬の備蓄には有効だと思う。リアルタイムデータに合わせて、薬の供給を操作するというのはかなり有効そうだ。だから薬局サーベイランスが大事でまずそこから手が付けられたのだろう。
JRF2025/5/97946
医師供給を増やす時間を考えれば、薬局ほど早いデータがなくても時間的にそれほど変わらないだろう。緊急車両にはまずまず有効だが、これは資源に限りがあり、近隣ほどすぐに必要になる可能性が高く、その供給をコントロールする現実性は薄い。まぁ、どちらもやれるならやるにこしたことはないが。
JRF2025/5/94580
薬の備蓄についても、ジャストインタイム生産と同じで、だから需給をタイトにしてコストを下げ、医療保険予算を削減する…みたいな使い方もなされうるが、そうするとパンデミックみたいなものには弱くなる。安全マージンという考え方も大事だが、私の直近のシミュレーションで気付いたことは感染を広げる対処療法みたいなのもわりと大事で、それが見過ごされがちな現状を考えると、保守的な薬のあり方も馬鹿にはできず、安全マージン的な考えではそこは失なわれるのでは…と懸念する。
JRF2025/5/94318
あと、症候群サーベイランスをどうシミュレーションに活かすかも難しい。予算とか効率とかを考えるという方向なら、取り入れやすいのだが。診察にかかるまでのスピードといウパラメータを取り入れる…とかになるんだろうか?
JRF2025/5/93644
……。
『パンデミック・シミュレーション - 感染症数理モデルの応用』についてはここまで。
JRF2025/5/95464
……。
……。
『新型コロナウイルス感染症第一波のパンデミック・シミュレーション - 数理モデルからの振り返り』(栗田 順子 編著, 大日 康史 & 菅原 民枝 協力, 技術評論社, 2020年12月)
https://www.amazon.co.jp/dp/4297118491
https://7net.omni7.jp/detail/1107145460
JRF2025/5/92072
2019年12月ぐらいに新型コロナがはじまって、それから第1波が終了するのが2020年4月下旬。それぐらいの情報を元に書かれた本で、波が収まったころに書かれていたので、緊急事態宣言などにやや批判的である。その後の2020年6月から7月にかけての第2波にも少し言及があるが、それが収束した原因は不明とのこと。当時の緊張感や議論が思い出される。R_0 や R(t) の推定なんかは、ネットでも当時見た。
JRF2025/5/99618
使っているモデルは SIR (改良) モデルだけで、ibm は予算や時間の制約から分析には使えなかったという。どういうモデルにしたか、ヒントは書かれているが、ヒント止まりで、私のレベルだと再現シミュレーションはできない感じ。ただ、論文へのリンクはあるので、AI さんに頼んで解説してもらったり、訳してもらったりすれば、素人の私でも追えるのだと思う。その気にさえなれば…だが。
例えば、p.54 の世代を三世代に分けて接触割合を決めうちして R_e を推定する…みたいなのは、たぶん AI さんに聞けば教てくれるのだろう。
JRF2025/5/90207
……。
>3月29日、芸能人の志村けんさんが新型コロナウイルスの感染により死去したことが報道されました。<(p.8)
あのころも感染症のシミュレーションに関心を持って、JAGS とか Stan とかをはじめて触っていた。
《「志村けん問題」を JAGS で解く その1 結論編》
http://jrf.cocolog-nifty.com/software/2020/05/post-918b0f.html
JRF2025/5/93896
>新型コロナウィルス(COVID-19)により稀代のコメディアン・志村けん氏が亡くなった。その志村けん氏がまだ闘病中だったころ、新型コロナについて一つの確率的問題が提起された。
志村けん氏ほどの有名人が新型コロナに罹ったということは、感染者数は言われているよりもっと多いに違いない。…これは本当か。
…というのが、その問題のだいたいである。
「それは本当だ」というのを R 言語上のベイズ統計モデリングソフト JAGS を用いて示せたというのが本稿の主張である。
<
JRF2025/5/90571
……。
>ブートストラッピング<(p.41)
私が頭悪いんだと思うが、ここらあたりの説明が何がいいたいのかさっぱりわからなかった。MCMC 法の説明とかがしたかったのだろうか。Stan とか類似技術での推定とかが必要だろうし。
Gemini さんによると…。
JRF2025/5/93223
Gemini:>
ブートストラッピングは、統計学で広く使われるリサンプリング手法の一つです。簡単に言うと、手元にある観測データから繰り返しランダムに(重複を許して)サンプリングを行い、それぞれのサンプルに対して統計量(例えば平均値や、感染症モデルのパラメータ、R(t)の値など)を計算することで、その統計量のばらつきや信頼性を推定する手法です。
JRF2025/5/96156
感染症モデルにおいては、限られた観測データ(例えば日々の新規感染者数)からモデルのパラメータやR(t)といった値を推定しますが、この推定値には必ず不確実性が伴います。データが完璧でない、モデルが単純化されている、といった理由からです。ブートストラッピングは、この**推定値の不確実性(どれくらい確からしいか、推定値にどれくらいの「幅」があるか)**を評価するためによく用いられます。
JRF2025/5/95680
例えば、日々の新規感染者数データに対してブートストラップを行うことで、R(t)の推定値が「ある一点の値」としてではなく、「この範囲(信頼区間)に収まる確率が高い」といった形で、その不確実性を含めて示すことができるようになります。これにより、「R(t)は1.0より大きいと confidently 言えるか?」といった判断の助けになります。
JRF2025/5/94728
MCMCやStanは、主にベイズ統計学の枠組みでパラメータの事後分布をサンプリングする手法であり、ブートストラッピングとは異なりますが、どちらも推定値の不確実性を評価するという目的で使われることがあります。統計的な推定において、推定値が単なる点ではなく「幅」を持つことを示すのは非常に重要であり、ブートストラッピングはそのための強力なツールの一つです。
<
JRF2025/5/91007
……。
まぁ、簡単だけど、この本も以上で。当時の記録として意味があるが、当時の文脈に引きずられすぎるので、これからにどれだけ備えるか…となれば、別の本や別の視点が必要だろうと思った。
JRF2025/5/96751
感染症のシミュレーションに関心を持っていて、いくつか本を読んでいる。
直近では、Grok さんにうながされてシミュレーションも作った。
[cocolog:95428644](2025年5月)
>Grok さんに教わりながら、ウィルスの弱毒化のシミュレーションと、病痕を美的に評価する集団の実効潜伏期間が短縮されるよう性選択されるというウィルスと人類との共進化(?)シミュレーションを作った。<
JRF2025/5/93388