【緊急事態宣言】大阪府 コロナウイルス感染者ピークを検証【有効だったんじゃね?】

先に結論

重要
3月28日が大阪のコロナウイルス感染のピークだったという結論、発症日不明の感染者がデータに考慮されておらず、間違った判断だと思う。
実際のピークは4月初旬(4月7日の緊急事態宣言日がピーク)の可能性あり、自粛は絶大な効果があったのではないかと思います。
再検証を望みます。

重要
院内感染は除外している。
発症日不明者が多く発生していた時、検査数追い付かず、感染~発症~検査まで、2週間くらいかかっていた。
など、ご指摘いただきました。
データ再検証させてください。

はじめに

どうも、おはこんばんちは。
お茶太郎です。

緊急事態宣言が開け、徐々に、徐々に新たな日常生活が戻ってくると同時に、感染者数も増加傾向を示しております。
感染第2波の可能性もささやかれている中で、大阪府が専門家会議を発足し、第一波の対策に関するレビューを行っております。

この中のやり取りで、とても気になる・スッと心に入ってこない部分がありました。

【緊急事態宣言後の自粛活動は、全く効果がなかった】

人から人に感染する感染症の対策、日本中で自粛という対策をとったことが意味がないなんて、全く持って納得できません。
(厳密には、大阪で独自に行った3月終盤程度の対策で十分だった。8割接触を減らすため自粛する必要まではなかったという話かと思います。)

納得がいかないので、これをここで確認してみたいと思います。

データ出典 大阪府における新型コロナウイルス感染症患者の発生状況

新型コロナウイルス感染症について』で公開されている下記のエクセルファイルを使っています。
大阪府における新型コロナウイルス感染症患者の発生状況【令和2年6月24日現在】[エクセルファイル]

会議資料:京都大学 宮沢孝幸准教授 公開のPDFファイル

ニュース報道

まずは、読売新聞オンラインの記事『大阪の感染ピーク、「宣言」10日前だった…吉村知事は指標見直しも』に掲載されている下記グラフ、こちらを確認してみましょう。


出展:読売新聞オンライン

お茶太郎
このグラフ、青色の棒グラフは感染確定日を基準としたグラフ。
黒の折れ線は、感染者の発症日の6日前を推定感染日としているぞ。
感染してから発症するまで6日かかるという想定で、いつ感染したのかをグラフ化したものだ。
ニガウリくん
普段の報道ではPCR検査で陽性確定した感染者さんの人数を報道していますもんね。
その人が、いつ感染したかをグラフにしたのが折れ線グラフなんですね。
お茶太郎
そうだな。
確定日で感染者の推移をみれば、増減は確認できるけれど、その増減が対策実施の結果なのかどうかがわからない。
だから、感染日基準で感染者数を見ることで、対策が効果あったのか、なかったのかを確認したんだろうな。
ニガウリくん
だから、実施対策も書き込まれているんですね。
お茶太郎
そうだな。。。。
で、おっさんな、このグラフに違和感があるんだよ。
ニガウリくん
はぁ。
何か気になることでもあるんですか?
お茶太郎
2つほどあるんだよな。

まず、一点目。
グラフの山の数。
確定日と感染日で山の数があわないんだよ。
感染して、発症し、確定する。だから、波形がそんなに変わらないと思うんだ。
でも、明らかに山の数があわない。

二点目。
グラフが描く平面の面積。
「感染者数=確定者数」だから、グラフが描く平面の面積(総人数)って、同じになるはずなんだ。
でも、このグラフ、感染者数の方が小さい気がするんだよ。

ニガウリくん
確かに、そういわれてみるとそんな気もしますね。

【大阪府における新型コロナウイルス感染症患者の発生状況】データ

大阪府のサイトで開示されている[エクセルファイル]データを使って確認していきます。

データは、下記のようなテーブル形式のデータです。

改めてみたところ確定日ではなく【報道提供日】となっていますね。
確定日としてデータをいじっておりますが、提供日であると思って、以下ご欄下さい。

お茶太郎
データは、「番号(通し番号、ID)」「報道提供日(ブログ内で確定日と記載することあり)」「年代」「性別」「居住地」「発症日」「症状」で構成されたデータだな。
後で重要になるのだが。。。発症日に不明(ピンクセル)があるぞ。

発症から確定(報道提供)までのタイムラグ

まず、発症した人が確定するまでのタイムラグ。
これが何日くらいあるのか、確認してみます。

補足
データは、確定日基準で3月1日から5月10日までを絞り込んだものを処理しているつもりです。
しかし。。。
tableau勉強を兼ねての作業のため、多少の誤差があるかもしれません。
その点はご了承ください。
データ検証の論旨に大きな影響を与える誤差ではないと思っております。

この期間の1739名。発症日不明者が338名。不明者の割合は、19.43%です。
不明者除外した上で、平均値求めたところ、7.78日です。
最頻値は、グラフにあるように、5日。

お茶太郎
まあ、多少のロングテール傾向がでているが、それなりにきれいな山を形成しているんじゃねーかな。
感染者が急増したことで、検査までの待ち時間が増えたりすれば、山は右にずれていくしな。
あと、RawDataみると亡くなっている方でタイムラグが長い方もいらっしゃった。
亡くなった後、改めて検査したところ感染確認できたという患者さんなのかなぁ。

確定日(報道提供日)分析

続いて、確定日基準で推移を見ていきます。

お茶太郎
発症日が確定している感染者と不明な感染者がいるから、色分けておいたぞ。
青が確定者、オレンジが不明者だ。
不明者は、緊急事態宣言後にかなりいることがわかるな。
感染者が増えすぎたことで管理しきれなくなったのか、それとも感染者自身がいつ発症したのか本当にわからなかったのか。。。
特に、4月18日に45人、4月20日に43人とかなりの人数いることがわかる。

全体的な傾向では、4月9日とその後15日、18日、20日に山があるように見えるな。

発症日分析(発症日不明者除外)

続いて、発症日ベースと推定感染日ベースで感染者の推移を見ていこう。
推定感染日は、大阪の専門家会議で発表されている定義を使用します。会では発症日の6日前としています。

お茶太郎
会議動画の中(5:00~)で、「4月1日、3日あたりが発症日のピーク」と報告しているからな。
ここから推測するに、この会議では発症日不明の感染者を考慮してねーんだわ。

お茶太郎
同じく動画の中(5:30~)で、発症日から6日前を感染した日と仮定した推定感染日のピークは「3月26日、もしくは3月28日」と報告しているからな。
忘れるなよ。4月の後半に確定した感染者のうち、それなりの数がいる発症日不明者を除外した人数のピークだからな。
お茶太郎
まあ、上の二つのグラフは、単純に発症日から6日前の日付でグラフを描画しただけだから日付がずれているだけで全く同じ波形のグラフになるわな。
大事な話だから、もう一度言うぞ。
ここのグラフは、データに発症日が記載されているレコードだけで描画したものだから、発症日が不明の人(全体の約2割、338人)が含まれていねーからな。
ニガウリくん
確定日のグラフにある、オレンジ色の人のデータが漏れているってことですね。
お茶太郎
このグラフの波形な、読売新聞の電子版に掲載されたグラフに酷似していると思うんだ。
ここからも、発症日が不明な人のデータは含まれていない同じデータじゃねーかなって推測できるな。


発症日分析(発症日不明者調整)

では、発症日不明者を含めて、推定感染日のグラフを描画するとどうなるでしょう?

お茶太郎
発症日不明者の発症日をいつにするかで、その人の推定感染日がきまる。
じゃあ、不明者の発症日をいつにするか。。。

今回は、「発生から確定までの日数分布」のグラフで確認した最頻値5日を仮定のタイムラグと定めて推移を見ていくことにするぞ。

補足
今までに出てきた日付ですが、改めて確認しておきます。

推定感染日:大阪の専門家会議で定義された日で、発症日の6日前と推定したもの。
発症日:コロナの症状が発症した日。公開データに記載があるものはその日付、無いものは報道提供日の5日前(最頻値の5日を採用)とした。
報道提供日:恐らく報道機関に公開された日。私の勘違いで、このブログ内で確定日としていることあり。データに記載されたものをそのまま採用。

お茶太郎
発症日不明の感染者も含めてみてみると、3月28日のピークよりも大きなピークが4月7日にあることがわかるな。
確定日基準でみたときの不明者が多かった部分、4月18日に45人、4月20日に43人が、『タイムラグ5日+感染日までの6日』で11日ずれるため、4月7日、9日の感染者が特に増えることが見てわかるだろう。
ニガウリくん
ニュースで言っている、「感染が最も広がったのは3月28日ごろだった」という話は?
お茶太郎
ここまでで見てきたデータからすれば、発症日が不明な感染者を除外してデータを分析していたから、3月28日がピークと判断したんじゃねーか?
だけど、不明者を加味すれば、ピークは4月7日だったといえるな。
注意
今回は意図的に発症日がわからない感染者の発症日を確定日から(最頻値の)5日遡った日としました。
そのため、理想的な日付の4月7日(緊急事態発令日)がピークとだったという結果になりました。
このタイムラグ5日を何日と定義するかによって、多少ピークが変動します。
ただ、大きなずれはなく、4月の上旬に感染のピークがあったという推測結果は変わらないでしょう。
あれだけ偏りがある、発症日不明者のデータを一律除外する処理は問題があることがわかります。

専門家会議のコメントで、データを週単位でみているような発言もありましたので、週のグラフも見ておきましょう。

大きな山がひとつとなり、ピークは3月29日週となります。
ただ、このグラフの山が緊急事態宣言発令された4月7日の週も含むため、「緊急事態宣言後の自粛は無意味だった」という判断はできないと思います。

感染者推移の傾向

日々の感染者でデータを見てしまうと、多少の増減があり、傾向がわからない。
そこで、傾向確認のために前後3日で平均した移動平均のグラフ(青線)を作ってみます。

お茶太郎
3月28日に山があるな。
どうやら、この時大阪府から独自の外出自粛要請があったらしいんだわ。
これが功を奏したんだろうな。いったん減少傾向を示すんだわ。
でも、この後4月3日を谷として、また増加に転じる。
ニガウリくん
本当ですね。
「家でじっとなんかしてられっか~~~」って感じで、暴走してしまったんでしょうかね?
お茶太郎
まあ、確かにそうかもな。自粛ストレスたまるもんな。
でも、この増加は4月7日を最後のピークとして、一気に、かつ継続して減少に転じている。
ニガウリくん
お茶太郎さんがまとめたこのグラフからだと、【緊急事態宣言後の自粛は大成功だった】ということですか?
お茶太郎
成功といえるよな。
宣言前に、いったん上昇傾向に転じたのもの下降したからな。
宣言がなかったら、どこまで上昇したかわからねーよな。だから、大成功だったという結論になると思うぞ。

この動画のシーン(1:05:40~)だけどな、まず会の共通認識の3月28日からピークアウトってのが間違ってるかもしれないんだ。
この動画のシーン(1:08:08~)だけどな、「欧米から入ってきた瞬間にてっぺんの山の運命は日本では決まっていた」ってやりとりな、モデルの再検証がひつようになるかもしれない。
この動画のシーン(1:09:10~)だけどな、「緊急事態宣言も、影響の自粛も全く効果がなかった」ってやりとりも、話が変わってくるってことだぞ。

大丈夫かな?

ニガウリくん
あとは、おめーのデータを信用していいかどうかだなぁ。。。

追加情報:会議資料

会議資料が下記サイトで公開されていました。
サイトURL:http://www.pref.osaka.lg.jp/iryo/2019ncov/sennmonnka2.html
配布資料:http://www.pref.osaka.lg.jp/attach/37375/00366407/05%20siryou1-1.pptx


不明者がいることを把握した上で、除外していますね。
このデータを除外する影響の大きさを検証せずに、除外したんでしょうね?

追加情報:第三回会議

感染者ピークの話は、第二回会議でのやりとりでした。
そのあと、6月22日に行われた第三回会議はどのような内容だったのでしょう?

ここで、「3月28日ピーク」「緊急事態宣言後の自粛は無意味だった」という前提で第二波対策を検討されているのであれば、問題だと思います。

サイトURL:http://www.pref.osaka.lg.jp/iryo/2019ncov/sennmonnka3.html
配布資料:http://www.pref.osaka.lg.jp/attach/37375/00366623/05%20siryou1.docx
動画:https://www.youtube.com/watch?v=ijakgHeXN6Y

動画の10:45からのシーン

3月28日にピークアウトしているというのは共通概念であり、なぜこれが起こったかを議論する必要がある。
緊急事態宣言とそれに伴う自粛要請が、全く効果がなかったとは一概に言えない。自然減という考え方に頼ると、今後有効な手段が打てなくなる。
波の原因を分析し、有効な手段について様々な人の意見を聞いて政策決定すべき。
 ⇒ 発症日不明者がこの後多数発生。これを一律これを除外したため、ピークアウトしたように見えている。

K値モデルでは、他国のロックダウン後の収束スピードが変わり、施策効果が見られるが、日本の収束スピードは一定で、緊急事態宣言の効果は極めて限定的。3月中旬頃までに実施された対策・府民の行動変容は効果があった可能性があるが、その後の収束スピードに変化がないため、3月後半の対策の効果は限定的ではないか。
 ⇒ 最も多く発症日不明者が出た日は、感染日が緊急事態宣言前後の日となる可能性あり。ここから、減少に転じることから、緊急事態宣言は絶大な効果があったと考えられる。

「3月28日ピーク」「緊急事態宣言後の自粛は無意味だった」という前提で会議を進めているし、「※今後、緊急事態宣言と休業要請等の取組みによる感染拡大抑制の効果検証を国に求めていく。」という話もある。
話が大きくならないうちに、再検証した方が良い!!!

まとめ・考察

最後に、まとめ・考察をしていきたいと思います。

まとめ
  • 専門家会議で考察・分析に使っているデータは、発症日不明者を加味していないデータだと思われる。
  • 発症日不明者を含まなければ、感染者のピークは3月28日となる。
  • ただし、発症日不明者は、緊急事態宣言後の4月後半に相当数発生している。
    これは、緊急事態宣言前後に感染した可能性がある。
  • 一定のルールのもと発症日不明者の発症日・感染日を推定すると、大阪府の感染者のピークは緊急事態先月発令日の4月7日だった可能性がある。
  • 感染のピークが3月28日とし、『大阪府が独自に行った対策で十分効果が得られた』という結論に至っていたが、実際は『接触率を8割減らす』ための全国的な自粛によって感染者は減ったのではないかと推察できる。
  • 動画の1:07:20~のシーンのコメント、欧米などでは施策を講じるとk値に変化が生じるが、3月26日、27日にk値に変化がなかった。しかし、、、、ここにはそもそもピークはない。
  • 検証は大切。必ず検証しましょう!
  • データから判断したことは再度見直そう。特に他人をターゲットとし、攻撃するような事態になりそうであれば、徹底的にそれが正しい主張であることを再検証しよう!!

重要
3月28日が感染のピークだったという結論、再検証を望みます。

 

最後に

たまたま、tableauの勉強を始めたため、手元に環境がそろっていた。

そこで、疑問に思っていた「大阪のコロナウイルス感染者ピーク3月28日」「国の緊急事態宣言後の自粛は意味がなかった」件についての検証を行った。

データの不適切な処理があったのではないかと結論に至ったが。。。
間違っていたらすいません。

私の推察では、『ピークは4月7日、自粛の効果は絶大』と大阪府の判断と真逆のものとなった。
今後の対策を検討する上で、重要な結果だと思う。
是非、再確認をしていただきたい。

データを元に正しい判断をするためには、正しいデータと適切な可視化が必要不可欠。
BIツールの普及とデータハンドリングの意識向上に繋がれば、幸いです。
お茶太郎
tableau、便利だぜ!!