remcat: 研究資料集

(TANAKA Sigeto)

第2波と第3波はどこがちがうのか: 「クラスター」の規模を比較する

前回の記事でつぎのように書いた:

新型コロナウイルス感染症対策分科会の資料 (第21回会議、1月8日) をみてみたところ、

  • グラフではなく表のかたちで記述されている
  • PDFファイルからテキストがコピーできる
  • クラスター数だけでなく感染者数がわかる
  • こまかい分類にわかれており、解釈上の注意事項が書いてある

ものであった。

このようなまともな品質のデータが入手可能になったのは、日本のCOVID-19「クラスター対策」史上はじめてのことである。

これは決して誇張ではない。各種クラスターで何人の感染が生じたのかが正確にわかる状態で情報が出てきた例は、未だかつて一度もなかった。これまで公開されたデータで最良のものは、アメリカCDCの雑誌に掲載された報告 http://doi.org/10.3201/eid2609.202272 だが、これは正確な感染者数がわからず、クラスターの人数分布の大雑把なグラフから推測 するしかなかった。クラスターの感染者数のデータが出た過去の例は 7月の第4回分科会資料の表 だけであるが、これはクラスターの全部を網羅しておらず、クラスターの定義も不明であった (たぶん「2人以上の集団感染」だと思うが、資料にはそうは書いていない)。
―――――
田中重人 (2021-01-09)「データに基づいて「クラスター対策」を評価する」

https://remcat.hatenadiary.jp/entry/20210109/december-clusters

いろいろと不十分ではあるのだが、7月と12月については、クラスターの種類別に感染者数がわかるデータがいちおう出たことになる。これらの期間は、それぞれいわゆる「第2波」「第3波」の感染拡大局面にあたっている。これらのデータによってクラスターの動向を比較すれば、第2波と第3波の性質のちがいや、それに対してとるべきであった対策について考察する材料になるだろう。

日本におけるCOVID-19感染者数の推移 (厚生労働省オープンデータ https://www.mhlw.go.jp/content/pcr_positive_daily.csv 2021-01-11ダウンロードしたファイルから作成)

データ

第2波 (7月) のデータ

第2波 (7月) のデータは、 新型コロナウイルス感染症対策分科会第4回会議 (7月31日) 資料 にある (PDFファイルの60枚目、7月1~28日のデータ)。


―――――
新型コロナウイルス感染症対策分科会 (2020-07-31) 第4回会議資料より「7月のクラスター等発生状況について」(参考資料3) p. 60

https://www.cas.go.jp/jp/seisaku/ful/bunkakai/corona4.pdf

「クラスター等」というのが何を指すかは、同資料には説明がないのだが、その後の報道等から、おそらく、1か所で2人以上の感染者がみつかった事例を指していると判断できる。 (https://remcat.hatenadiary.jp/entry/20210103/vs#july 参照。同記事で、表の形式で数値を再利用可能にしたものも公開している。) 以下では、この解釈にしたがって議論を進める。

第3波 (12月) のデータ

第3波 (12月) のデータは、新型コロナウイルス感染症対策分科会の第21回会議 (1月8日) 資料 https://www.cas.go.jp/jp/seisaku/ful/bunkakai/corona21.pdf にある (PDFファイルの39-44枚目)。他の情報も加えて表形式にしたものは https://remcat.hatenadiary.jp/entry/20210109/december-clusters#data 参照。また、もとの資料の当該部分をテキストにしたものを http://tsigeto.info/covid19/bunkakai21-p39-44.txt に置いてある。

このデータが示しているものは、「報道情報に基づくクラスターの情報をデータベース化したもの」から「令和2年12月以降に報告があったクラスター人数が5人以上のもの」を抽出した数値である。

比較可能部分

7月のデータはクラスターを網羅していない。また、12月のデータとは、分類も「クラスター」の定義もちがう。

まず、分類のどことどこが比較可能であるかを考えよう。7月データのクラスターの分類はつぎの4つである:

  • 接待を伴う飲食店
  • 会食
  • 職場
  • 学校・教育施設等

「接待を伴う飲食店」については、12月データにもおなじ項目がある。「職場」「学校・教育施設等」については、12月データにそれぞれ「職場関連」「教育施設」がある。これらの分類は対応しているものと考えることにしよう。

問題は「会食」である。

12月データにも「会食」という項目はあるから、外形的にはこれらがおなじものを指していると考えることはできる。

一方で、12月データではそれ以外に「飲食店」「カラオケ」「ホームパーティ」があり、それに「接待を伴う飲食店」をあわせて「飲食関連」となっている。7月のデータで「会食」といっていたものが「飲食店」での会合をふくまないとは考えにくいので、これら飲食関連のもの (から「接待を伴う飲食店」を除いたもの) が「会食」に相当すると考えたほうがいいかもしれない。

以下では、両方の可能性をあわせて検討することにする。

平均規模の比較

7月と12月のデータを対応させて、平均規模を記入してみた。

表1: クラスター平均規模の変化

7月分類 12月分類 7月平均規模(M) 12月平均規模(L)
接待を伴う飲食店 接待を伴う飲食店 14.3 11.8
会食 会食 4.0 8.4
会食 飲食店+カラオケ+会食+ホームパーティ 4.0 9.6
職場 職場関連 4.0 11.6
学校・教育施設等 教育施設 6.7 14.3

ここで、7月データと12月データで「クラスター」の定義がちがうことが問題になる。7月データでは1か所で2人以上の感染者が出た場合 (たぶん)、12月データでは5人以上の場合なので、後者では、相対的に規模の大きいクラスターしかふくんでいないわけである。このため、通常は、後者のほうが平均規模は大きくなるはず。

「接待を伴う飲食店」クラスターの規模縮小

ところが、表1をみると、「接待を伴う飲食店」クラスターの平均規模は、7月では14.3人だったのに対し、12月には11.8人に減っている。もし規模別にみたクラスターの数がおなじ分布をしていれば、7月データに入っていた2-4人の小規模なクラスターが12月データでは入っていないのから、平均規模は拡大するはずである。にもかかわらず平均規模が減っているのだから、これは、7月と12月ではクラスターの規模の分布が異なり、大きなクラスターの割合が減って小さなクラスターの割合が増えていたことを示す。

このように規模が縮小したと同時に、「接待を伴う飲食店」クラスターの全感染者に占めるシェアも減っている。上の画像でみたように、7月1-28日の「接待を伴う飲食店」クラスターの人数は499人。この期間の日本全体の総感染者数は13254人なので、3.765%がこの種類のクラスターに属していたことになる。一方で、12月の同種クラスターの感染者は907人。12月の総感染者数は85891人なので、その1.056%である。7月にくらべて、12月のほうが、「接待を伴う飲食店」クラスターのシェアは小さい。

表2: 全感染者中に占める「クラスター」のシェア (%)

分類 7月(m) 12月(l) m/l
接待を伴う飲食店 3.765 1.056 3.565
会食 (会食) 0.943 0.156 6.044
会食 (飲食店+カラオケ+会食+ホームパーティ) 0.943 0.881 1.070
職場 (職場関連) 1.607 1.284 1.251
教育施設 (学校・教育施設等) 1.781 2.042 0.872


「接待を伴う飲食店」の流行への寄与は、第2波と第3波でずいぶんちがっている。このことは、分科会の第19回会議 (12月23日) 付属資料「現在直面する3つの課題」からも読みとれる。


―――――
新型コロナウイルス感染症対策分科会 (2020-12-23) 第19回会議資料 「現在直面する3つの課題」
p. 7

https://www.cas.go.jp/jp/seisaku/ful/bunkakai/cyokumen_3tsunokadai.pdf

この画像は、縦横に並列されたグラフから一部を切り取ったものである。斜めの赤線2本は、図の全体に書き込まれた矢印の一部であるが、無視して見ていただきたい。なお、縦軸 (人数) の目盛りのちがいに注意。

画像いちばん上のグラフは、広く「歓楽街」での感染を数えたもののようで、「接待を伴う飲食店」は大部分ここにカウントされる (それ以外のさまざまな業種もふくむ) のだろう。その下に、「孤発」(たぶん感染源が不明という意味) や「家族内感染」のグラフがある。

5月後半以降の「第2波」では、歓楽街での感染数が多く、また早くから増加していて、早くピークに到達していた (7月はじめ) ことがわかる。「孤発」「家族内感染」はそれにくらべて増加が遅く、7月に入っても増加して、7月末から8月はじめにピークに達している。

これに対して10月以降の「第3波」では、歓楽街での感染数は第2波よりずっとすくなく、明瞭な「山」のかたちもなしていない。あえていえば10月後半から11月はじめにかけてすこし盛り上がってみえなくもないが、同時期に「孤発」「家族内感染」は急激に増えており、11月半ばまで増えつづけている。

第2波においては、「接待を伴う飲食店」あるいは「歓楽街」での感染者数の増加は、全体的な感染者の動向に先んじて起こり、また全感染者中に占める割合も高かった。クラスターの規模も大きく、発生した数も多かったようである。一方、第3波においては、「接待を伴う飲食店」クラスターは規模が小さくなっている。クラスター数は7月よりも12月のほうが多いが、全体的な感染者数が大きく伸びているのに比較すれば増加率は低く、総感染者にしめる割合が低下している。広く「歓楽街」での感染をとらえると、第2波よりもその規模が縮小しており、全体での感染者の増加への影響もみられない。

2-4人規模と5人以上規模の比率

7月と12月の「クラスター」のデータに戻ろう。「接待を伴う飲食店」以外は、7月よりも12月のほうがクラスターの平均規模が大きい。これは、7月のデータでは「2人以上」の規模の集団感染を数えているのに対し、12月のデータでは「5人以上」に絞っているためであろう。

クラスター認定の基準を「5人以上」に引き上げてきびしくしたのであるから、この変更は、クラスターにふくまれる感染者を減少させる効果を持つはずである。ところが、表2でみたとおり、「教育施設」クラスターにおいては、基準がきびしくなった12月のほうが、全感染者に占めるシェアが大きい (7月に1.781%だったものが12月には2.042%)。これは、「教育施設」で発見されるクラスターが、全感染者の増加よりも速く増加してきたことを示している。

これに対して、「会食」「職場」のクラスターにおいては、12月のほうが7月よりも全感染者に占めるシェアが減少している (かつ、クラスターの平均規模は増加している)。これらがクラスター定義の変更によるものなのか、それとも実態としてこれらのクラスターのシェアが変化したのかが問題である。

2-4人規模の集団感染を「小規模クラスター」、5人以上規模の集団感染を「大規模クラスター」と呼ぶことにしよう。それぞれの平均規模をそれぞれ S と L であらわす。これらの両方をあわせたときの平均規模を M とする。

たとえば、表1の「職場」(職場関連) クラスターのデータでは、

  • 大規模クラスターの平均規模は L=11.6 (12月データより)
  • 大規模・小規模のクラスターを合計した全クラスター平均規模は M=4.0 (7月データより)

である。小規模クラスターの平均規模 S は不明だが、個別の規模は2,3,4のどれかであり、また感染は小規模なほうがより起こりやすいと考えると、規模4のクラスターより規模2のクラスターのほうが多いはずである。そうすると、平均Sは2から3の間の値をとる。

ためしに、小規模クラスターの平均規模を S=2.4 としてみよう。もし大規模クラスターと小規模クラスターの数がおなじであれば、全クラスター平均規模は M = (11.6+2.4)/2 = 7 となる。実際にはこの値は M=4 なので、小規模クラスターのほうが数が多い (ので全クラスター平均規模はそちらに引っ張られている) と考えるべきである。大規模クラスターがa個、小規模クラスターがb個あるとすると、全クラスター平均規模は (a×11.6 + b×2.4) / (a+b) なので、これが4となるようにa:bの比を求めればよい。答えは、a:b = 1:4.75 である。小規模のクラスターの数が大規模クラスターの4.75倍ある場合、全クラスター平均規模が4となる。

この場合、個数は小規模クラスターのほうが多いのだが、それらにふくまれる感染者数は平均的にすくないから、感染者数で比を考えるなら、大規模クラスターの比率はこれより大きくなるはずである。上記の「職場」クラスターの例では、大規模クラスターと小規模クラスターの感染者数の比は、1×11.6 : 4.75×2.4 すなわち11.6:11.4となる。感染者数でいうと、大規模クラスターのほうがすこし上回る計算になる。

一般的に書くと、クラスターの個数についての比は

b / a = (L-M) / (M-S)

それらにふくまれる感染者数の比は

bS/aL = S(L-M) / (LM-LS)

となる。2 ≤ S < M < L だから、この比 bS/aL は、S が大きいほど大きくなる。つまり、S=2のときに最小値をとり、Sが増えるにつれて大きくなる。

このような計算をおこなうRスクリプトを下記に示す。実際のデータで報告される数値にあわせて、全クラスターの感染者数 bS+aL が大規模クラスターの感染者数 aL の何倍か、すなわち 1 + bS/aL を計算している。小規模クラスターの平均規模 S の値は2と3を投入して、下限と上限を求めることにする。

# 2-4人規模クラスターの数は5人以上規模のクラスターの数の何倍か
#   引数: mean.small: 2-4人規模クラスターの平均規模
#          mean.large: 5人以上規模クラスターの平均規模
#          mean.all: 2人以上規模クラスターの平均規模
ratio.cluster <- function( mean.small, mean.large, mean.all ) {
  return( ( mean.large - mean.all ) / ( mean.all - mean.small )  );
}

# 2-4人規模クラスターでの感染者数は5人以上規模のクラスターの感染者数の何倍か
ratio.case <- function( mean.small, mean.large, mean.all ) {
  return( ratio.cluster( mean.small, mean.large, mean.all ) * mean.small / mean.large  );
}

# 接待を伴う飲食店
1 + ratio.case( 2, 11.8, 14.3  ) 
1 + ratio.case( 3, 11.8, 14.3  ) 

# 会食 = 会食
1 + ratio.case( 2, 8.4, 4.0 )
1 + ratio.case( 3, 8.4, 4.0 )

# 会食 = 飲食店+カラオケ+会食+ホームパーティ 
1 + ratio.case( 2, 9.6, 4.0 )
1 + ratio.case( 3, 9.6, 4.0 )

# 職場 = 職場関連
1 + ratio.case( 2, 11.6, 4.0 )
1 + ratio.case( 3, 11.6, 4.0 )

# 学校・教育施設等 = 教育施設
1 + ratio.case( 2, 14.3, 6.7 )
1 + ratio.case( 3, 14.3, 6.7 )

この方法で、クラスターの規模の分布に変化はないと仮定したときに、大規模クラスター (5人以上) の感染者数を何倍すると全クラスター (2人以上) の感染者数になるか計算した結果が、つぎの表3である。表1で検討したように、「接待を伴う飲食店」では規模の分布が7月と12月で変化しているのでこの推定は無意味であるが、いちおうおなじ式で計算したものを表示している (上限と下限が入れ替わっている)。

表3: 全クラスター感染者数/大規模クラスター感染者数の推定

分類 下限 上限
接待を伴う飲食店 0.944 0.966
会食 (会食) 1.524 2.571
会食 (飲食店+カラオケ+会食+ホームパーティ) 1.583 2.750
職場 (職場関連) 1.655 2.966
教育施設 (学校・教育施設等) 1.226 1.431


表2でみたように、感染者に占めるシェアの比を7月 (全クラスターに該当) と12月 (大規模クラスターに該当) の間で求めると、「職場」クラスターでは1.251であった。これは表3で推定した区間 (1.655, 2.966) にはおさまっていない。「職場」のシェアは、「クラスター」定義の変更によって説明できる範囲まで低下していないので、実態としては増加していたのだと考えないと説明がつかない。何も変化がなければ1.655以上の比となるはずのところ、実際には1.251だったのだから、この期間にすくなくとも1.323倍にシェアが拡大していたことになる。

「教育施設」クラスターでは、7月の感染者に占めるシェアは12月の0.872倍であった。7月のほうが小規模なクラスターまで広く数えていたにもかかわらず、12月よりも感染者シェアが低かったのである。もし感染者シェアに実態として変化がなかったとしたら、この効果は、すくなくとも1.226程度はあったはずである。7月から12月までの間に、「教育施設」クラスターのシェアは、実態としては1.406倍以上に増えていた計算になる。

「会食」については、7月と12月の「会食」カテゴリーが対応しているものと考えた場合、感染者シェアは7月の0.943%から12月の0.156%へと大きく下げており、その比は6.044であった (表2)。これは、表3で推定した区間 (1.524, 2.571) よりずっと大きい。この値を採用するなら、「会食」クラスターの7月から12月の間での低下は、「クラスター」定義を変更したために小さめに出たものではなく、本当に大きく低下していたことになる。

一方、7月の「会食」は12月の「飲食店」「カラオケ」「会食」「ホームパーティ」の合計に相当すると仮定した場合には、推定される区間が (1.583, 2.750) になる (表3)。この期間のシェアの比は1.070であった (表2) ので、下限を下回っている。シェアに変化がなければ1/1.583倍かそれ以下に減るはずのところ、実際には1/1.070倍にしか減らなかったのだから、この期間に1.479倍以上シェアが拡大していたことになる。

第2波と第3波のちがい

第2波の増加局面においては、歓楽街における感染の増加が先行しており、その一部が「接待を伴う飲食店」におけるクラスターだったとみることができる。7月のデータではこのクラスター (2人以上規模のもの) は全感染者数の3.765%を占めていた。

これに対して第3波では、「接待を伴う飲食店」クラスターは小さく、全感染者に占めるシェアも小さい (12月データで1.056%)。歓楽街における感染も第2波より小さく、時間的に全体の感染増加に先んじて増えたわけでもない。第3波では、すくなくとも第2波とおなじようには、歓楽街や「接待を伴う飲食店」での感染が流行に寄与していたわけではなさそうである。

かわりに増えたのは、「職場」と「教育施設」である。これらのクラスターが感染者数に占める割合は、7月データではそれぞれ1.607%と1.781%であり、「接待を伴う飲食店」クラスターの半分以下のシェアしか持っていなかった。しかし、これらは12月にはそれぞれ1.284%と2.042%のシェアである。大きくシェアを減らした「接待を伴う飲食店」の1.056%を上回っている。

「会食」については、カテゴリーの対応関係に不明なところがあるため、複数の推定をおこなった。その結果からは、7月と12月の間でシェアが大きく低下したか、逆に増大したかのいずれかといえる。増大している場合には、その程度は「職場」「教育施設」と同等かそれ以上である。ただし、感染者に占めるシェアそのものは、1%未満と小さい。

以上のように、分科会資料として公開された7月と12月のクラスターのデータからいえる、「第2波」と比較した「第3波」の特徴は、

  • 「接待を伴う飲食店」クラスターの寄与の低下
  • 「職場」「教育施設」クラスターの寄与の上昇

ということになろう。「会食」についてはカテゴリーの対応関係次第で結果が変わるが、寄与が「職場」「教育施設」同様に上昇していた可能性はある。

留保事項

もっとも、この比較で本当に「第3波」の特徴をとらえられているかについては心許ない。というのは、7月、12月データのどちらも、「クラスター」として報告されているものは全感染者のごく一部にすぎないからである。1人だけの感染は報告されていないし、感染経路不明のケースも多い。また、報道資料からつくられているので、そもそも報道されていないケースはひろえていないことになる。たとえば、沖縄県でいくつかのクラスターが非公表になっていたことが1月になって報道されている。

沖縄県が新型コロナウイルスのクラスター(感染者集団)の一部を公表していなかった問題で、県は8日、昨年4月から発生した全てのクラスター86件を発表した。非公表だった37件は昨年7月から今年1月までに発生し、飲食関係が約半数の16件と最多で、職場、家庭と続いた。県は今後も、プライバシーへの配慮などを理由に一定期間は非公表にする場合があるとの考えを示す一方、基準はこれから議論するとした。

資料は6日現在。全クラスター86件で陽性者は990人。そのうち非公表37件の陽性者数は241人で、クラスターによる全陽性者数の4分の1を占めた。公表した49件は749人だった。

 37件の内訳は、職場9件、社会福祉施設3件、家庭6件、教育機関1件、その他2件。発生時期(最初の感染確認日)は、7月5件、8月7件、9月5件、10月6件、11月10件、12月4件だった。
―――――
「沖縄で発生したクラスター86件を全て公表 県、公表の基準を議論へ」沖縄タイムス+プラス 2021年1月9日 08:36

https://www.okinawatimes.co.jp/articles/-/690135

https://remcat.hatenadiary.jp/entry/20210103/vs#diss などで議論してきたように、「クラスター」という概念は定義が錯綜しており、統一的な理解がない。自治体等に公表の義務はなく、公表する場合にもどのような情報をどこまで公表するかも決まっていない。公表した情報が報道されるかどうかは各メディアの判断による。このような状況では、一貫した基準でデータがつくられているとはいえないし、数え落としている「クラスター」がたくさんあるものと考えておくべきであろう。実際、分科会資料にあらわれた「クラスター」の分類も一貫していたわけではなく、おなじ時期の同じカテゴリーのクラスターの数が、資料によってまったくちがう動きを示していたりする (https://remcat.hatenadiary.jp/entry/20210106/eat 参照)。

しかし、現在のところ、「クラスター」の感染者の推移について、これ以上のデータはないわけである。わずかに見える氷山の一角から、水面下の氷の大きさを推し量るしかない。そこからみえてくる「第3波」の特徴は、以上のようなものになる。