DB研究-基礎-

保険者データベースで有病率を算出するには?「推定・設計・報告」の重要ポイントを徹底解説

この記事は約9分で読めます。

はじめに

日本国内における疾患負荷(Disease Burden)の定量化は、メディカル戦略の立案やアンメットメディカルニーズの把握において不可欠なプロセスです。疾患負荷にはDALYsや医療費など複数の指標がありますが、その指標の一つが有病率です。従来はアンケートや検診などの調査結果が主な情報源でしたが、近年ではJMDCやDeSCといった保険者データベース(DB)を活用し、ICD-10コードに基づいた「期間有病率」を算出する機会が増えています。大規模なリアルワールドデータから得られる数字は説得力がある一方で、レセプトデータ特有の限界(Limitations)も多く、算出・解釈において慎重な判断が求められます。 本記事では、年齢・性別調整を行わない粗有病率について、実際の論文事例(Okada & Yasunagaら)を交えながら推定のプロセスを「推定前(集団特性の把握)」「推定時(設計判断)」「報告時(前提条件の明示)」という3つの段階に分けて解説します。

論文の紹介

Okada & Yasunagaは、国保・後期高齢者由来レセプトデータベースを用いて、13疾患の非感染性疾患(Non-Communicable Diseases, NCDs)の期間有病率を推定しました¹⁾。対象期間は2019年12月から2020年11月の1年間です。その結果、糖尿病12.2%、高血圧20.9%などNCDについて有病率が得られました。この保険者DBから算出された「有病率」は、データベースにおける有病率の推定のプロセスを理解したうえで解釈する必要があります。

有病率推定のプロセス

ポイント① 推定前に確認すべきこと ― データベースの集団特性を把握する

年齢範囲、保険者の種類、加入者の社会経済的背景はデータベースによって異なるため、有病率を推定する前に使用するデータベースがどのような集団を収載しているかを確認する必要があります。 例えば、健康保険組合由来レセプトデータベースでは、対象年齢は0〜74歳に限定されます²⁾³⁾。75歳以上のデータは含まれていないため、高齢者に多い疾患では有病率を過小推定するリスクがあります。一方、国保・後期高齢者由来レセプトデータベースでは、全年齢のデータを含んでいるデータベースもあります¹⁾。年齢分布は全国推計に近くなりますが、65〜74歳における国保加入者の割合が全国平均より高いという偏りがあるため、注意が必要です。 年齢構成や性別構成、地域などが日本の一般人口と異なる場合、日本の一般人口における有病率と異なる有病率になる可能性があります。日本の一般集団に外挿することを目的とする場合は、自分が使うデータベースに登録される集団が「日本の一般人口」をどの程度代表しているかを、事前に把握しておくことが重要となります。

ポイント② 推定時に設計すべきこと ― 分子定義・分母定義を一体で決める

期間有病率(period prevalence)とは、ある一定期間において、対象集団の中で当該疾患を有している者の割合です。したがって、推定にあたっては「分子(どのような者を患者とするか)」と「分母(どのような集団を対象とするか)」の2つを明確に定義する必要があります。Okada & Yasunaga論文を具体例として、それぞれの設計判断を見ていきます。

分子の定義

分子は「評価期間中に疾患定義を満たした者の数」です。ここでは疾患定義と評価期間の2つの要素が関わります。 Okada & Yasunagaらの論文では、糖尿病をICD-10コード(E10-14)のみで定義しており、処方や検査値との組み合わせは用いていません¹⁾。この方法はシンプルで再現性が高い一方、レセプト上の診断名には「請求上の便宜的な記録」が含まれるため、誤分類(misclassification)が生じる可能性があります。 有病率推定において、この誤分類は2つの方向に作用します。感度(sensitivity)が低い定義 ― つまり真の患者を取りこぼしやすい定義 ― では過小推定に、特異度(specificity)が低い定義 ― 非患者を誤って含めやすい定義 ― では過大推定になります。Okada & Yasunagaらの論文のようにICD-10コードのみで患者を定義する場合、コードが付与されていれば患者として捕捉するため取りこぼしは少なくなります。しかし、レセプトには疑い病名や保険請求上の便宜的な記録も含まれるため、真の患者ではない者も分子に含まれやすくなります¹⁾。一方で、診断コードに処方や診療行為コードを組み合わせると特異度は向上しますが、条件を満たさない真の患者が除外され感度は下がる可能性が高いです。

分母の定義

Okada & Yasunagaらの論文では、データベースの全登録者2,220,702人のうち、評価期間中に保険加入を開始した者と期間中に資格を喪失した者を除外し、1,932,021人を分母としています¹⁾。つまり、1年間の連続加入を要件としており、約29万人(約13%)が除外されています。保険者データベースでは加入・脱退が日常的に発生するため、加入要件を設定しなければ、分母となる集団は常に変動します。連続加入を要件とすることで有病率の評価期間(分子を数える期間)と、リスクにさらされている期間(分母として観察可能な期間)を一致させることができます。 評価期間も有病率の推定に直接影響します。本論文では2019年12月から2020年11月の1年間を評価期間とし、その期間中に1回でも当該診断コードが記録された者を患者としています¹⁾。分母を「データベースの全登録者」として固定して解析する場合、この評価期間を短く設定すると、その期間中に受診しなかった患者の病気は捕捉できず、過小推定になりやすくなります。一方、期間を長くすると受診機会が増えて有病の捕捉率は上がりますが、過大推定のリスクも高まります。有病率はある時点において疾患を有している者の割合を示す指標です。評価期間を長くすると、評価開始時点では有病でなかった者が期間中に新たに発症(incidence)し、有病者として捕捉されることになります。つまり、本来は罹患(新規発生)として区別すべき症例が分子に含まれるため、ある時点の有病率よりも過大な推定値となる可能性があります。そのため、評価期間の設定は受診頻度を考慮して設定する必要があります。

ポイント③ 報告時に明記すべきこと ― 推定の前提条件と限界を示す

有病率の推定値を報告する際には、その数値がどのような前提条件のもとで成り立っているかを明示することが不可欠です。具体的には以下の項目を記載します。
  • どのデータベースの、どのような集団を分母としたか
  • どのような患者定義を用いたか
  • どの評価期間で算出したか
  • その集団・定義にどのような偏りや限界があるか
これらの情報がなければ、推定値の解釈が読み手によって異なるリスクがあります。「この有病率はどのような前提条件のもとで算出されたのか?」に対して、上記の項目で回答できる状態にしておくことが重要です。

さいごに

本記事では、Okada & Yasunaga論文をもとに、保険者データベースを用いた有病率推定で押さえるべき3つの段階を整理しました。保険者データベースを用いた有病率推定は、推定値がどの集団を対象とし、どのような設計判断のもとで成り立っているのかを明確にしたうえで解釈することが求められます。本記事がその参考になれば幸いです。 研究目的に応じた指標設計・解析についてお困りの際は、ぜひ一度データックへご相談ください(ご相談・お問い合わせはこちら)。

参考論文

  1. Okada A, Yasunaga H. Prevalence of Noncommunicable Diseases in Japan Using a Newly Developed Administrative Claims Database Covering Young, Middle-aged, and Elderly People. JMA J. 2022;5(2):190-198. DOI: 10.31662/jmaj.2021-0189
  2. Nagai K, Tanaka T, Kodaira N, Kimura S, Takahashi Y, Nakayama T. Data resource profile: JMDC claims database sourced from health insurance societies. J Gen Fam Med. 2021;22(3):118-127. DOI: 10.1002/jgf2.422
  3. Laurent T, Simeone J, Kuwatsuru R, Hirano T, Graham S, Wakabayashi R, Phillips R, Isomura T. Context and Considerations for Use of Two Japanese Real-World Databases in Japan: Medical Data Vision and Japanese Medical Data Center. Drugs Real World Outcomes. 2022;9(2):175-187. DOI: 10.1007/s40801-022-00296-5
この記事は参考になりましたか? ご評価いただけると、今後の記事制作の励みになります。
株式会社 データック

RWD Navi(リアルワールドデータ・ナビ)はリアルワールドデータの価値を最大化することを目的としたメディアです。運営者である株式会社データックは「医学の知の創出を加速する」をビジョンに掲げ、臨床家と疫学者による研究提案で最適な意思決定を支援します。

※本メディアでは、特定の薬剤を含む臨床データを客観的に分析した記事を掲載することがあります。これらはすべて学術的・研究的な目的に基づいたものであり、特定の製品や企業を評価・批判する意図は一切ありません。

株式会社 データックをフォローする
シェアする
株式会社 データックをフォローする
RWD Navi
株式会社 データック
RWD Navi 運営者情報

RWD Navi(リアルワールドデータ・ナビ)はリアルワールドデータの価値を最大化することを目的としたメディアです。運営者である株式会社データックは「医学の知の創出を加速する」をビジョンに掲げ、臨床家と疫学者による研究提案で最適な意思決定を支援します。

※本メディアでは、特定の薬剤を含む臨床データを客観的に分析した記事を掲載することがあります。これらはすべて学術的・研究的な目的に基づいたものであり、特定の製品や企業を評価・批判する意図は一切ありません。

DATACKコーポレートサイトを見る

タイトルとURLをコピーしました