バリデーション研究

日本におけるバリデーション研究の紹介

この記事は約16分で読めます。

はじめに

RWDは、本来は診療報酬請求などの目的で収集された情報を二次利用するため、研究を行ううえで重要な情報が記録されていないことがあります。さらに、情報が記録されてる場合でも、それが正確なのか、研究でイメージしている状態と本当に一致しているのかが懸念事項としてあげられます。

そのため、RWDを研究に用いる場合には、記録された情報の妥当性(validity)の担保が求められます。

本記事では、情報の妥当性を担保するためのバリデーション研究について、基礎知識や日本におけるバリデーション研究の一覧をまとめました。

本記事がRWDを用いた研究を実施する際の参考になればと思っています。

なぜバリデーション研究が必要なのか

データベースに記録された情報が正確であることに越したことはありません。しかしながら、データベース研究に100%の正確性を求めるのも非現実的です。

そのため、データベースを用いる研究者は、妥当性を向上させるためにさまざまな工夫をしています。例えば、レセプト病名だけでは不正確だと考えられる場合には、薬剤や処置を組み合わせて妥当性を担保します。

このように「リアルワールドデータ」がどの程度「リアル」なのか、仮に歪んでいるとしたら結果への影響はどの程度なのかを検討・解釈するために、バリデーション研究が必要となります。

バリデーション研究の基礎知識

ゴールドスタンダード(gold standard)

日本薬剤疫学会のタスクフォースでは、「より真に近いと考えられる情報と比べて妥当性を確認すること」をバリデーション研究(validation study)と定義しています。1)

この「より真に近いと考えられる情報」のことを至適基準(ゴールドスタンダード)といいます。

例えば、保険データベースに記録された病名に対して、ゴールドスタンダードは「一定の基準に基づいて病院で診断された診断名」となります。未診断のごく早期のがんの存在のように、臨床上でも気づかれないようなものを基準にするのは非現実的です。

ゴールドスタンダードの設定はカルテレビューによるものが大半です。それ以外は疾患レジストリーや検査結果を用いることがありますが、比較的稀です。

それぞれのゴールドスタンダード設定における注意点は以下の通りです。1)

カルテレビュー

  • 適切な診断基準に沿って判定が可能となるような調査票を設計する必要があります。もしも明確な診断基準がない場合には、その研究でどのような基準を用いたかを明示する必要があります。そして、可能な限り複数の評価者が独立に評価し、その一致度(カッパ係数)を報告することも求められています。

疾患レジストリー

  • 疾患レジストリーがそもそも高い妥当性を持ち合わせているかを確認しておく必要があります。まだ開設されたばかりで網羅的に症例が登録されていない、あるいは疾患の正確性が十分確認されていない症例が多く混ざっているような疾患レジストリーはゴールドスタンダードとして使うことはできません。

検査結果

  • 検体が正確に測定・標準化(例:尿蛋白の±、+、2+の分類)・記録されているか、また、病理診断や画像診断の場合は診断結果が標準化・電子化されているかを確認しておく必要があります。もしも標準化・電子化されていない場合は、標準化・電子化の作業を実施するか、実質的に医療機関に戻って行うカルテレビューと同じ方法でバリデーション研究を実施しなければなりません。

妥当性の指標

妥当性の指標として、主に用いられるのは感度(sensitivity)特異度(spesificity)陽性的中率(positive predictive value: PPV)陰性的中率(negative  predictive value: PPV)です。

ゴールドスタンダードをカルテ記録とした場合のデータベースで考えると、これらの指標は以下のように算出されます。

  • 感度(sensitivity):カルテ上、ある疾患が記録されている人のうち、データベース上の病名でもその疾患の記録がある人の割合
  • 特異度(spesificity):カルテ上、ある疾患が記録されていない人のうち、データベース上の病名でもその疾患の記録がない人の割合
  • 陽性的中率(positive predictive value: PPV):データベース上、ある疾患の病名がある人のうち、カルテ上でもその疾患が記録されている人(実際に疾患がある人)
  • 陰性的中率(negative  predictive value: NPV):データベース上、ある疾患の病名がない人のうち、カルテ上でもその疾患が記録されていない人(実際に疾患がない人)

※ その他の指標として以下を使用することもあります。

  • 陽性尤度比(positive likelihood ratio: PLR):感度/(1-特異度)
  • 陰性尤度比(negative likelihood ratio: NLR):(1-感度)/特異度
  ゴールドスタンダードの定義を満たすか
(真のケースか否か)例:カルテ上の脳梗塞の記録
あり なし  
アウトカムの定義を満たすか
(陽性のケースか否か)
例:データベース上の脳梗塞の記録
あり 真の陽性 a 偽陽性 b 陽性的中率=a/(a+b)
なし 偽陰性 c 真の陰性 d 陰性的中率=d/(c+d)
  感度=a/(a+c) 特異度=d/(b+d)  

これらの指標は以下のように解釈されます。

【バリデーション研究における結果の解釈】

  • 感度が高い病名が入力されていない → 実際に疾患はないだろう
  • 特異度が高い病名が入力されていない → 実際に疾患があるのだろう
  • データベースで抽出されてきた症例に本当に疾患があるかどうかは、病名の感度・特異度と有病率による

これらは臨床診断における解釈と同じといえます。

【臨床診断の解釈】

  • 感度が高い検査は陰性所見を持って除外診断に用いる
  • 特異度が高い検査は陽性所見を持って確定診断に用いる
  • 検査の感度、特異度は検査固有のものであるが、陽性的中率・陰性的中率は有病率による

日本におけるバリデーション研究一覧

日本におけるバリデーション研究の一覧を以下にまとめました(PDFダウンロードはこちら)。

文献対象疾患データベースアウトカムの定義ゴールドスタンダードサンプリング方法とサンプルサイズ妥当性を測定する指標主な結果
(カッコ内は95%信頼区間)
Validity of diagnoses,
procedures, and laboratory
data in Japanese
administrative data
DPCデータの 16 の
疾患、10 の診療
行為、SS-MIX データの
13 の臨床検査結果
DPC、SS-MIX
標準化ストレージ
ICD-10コード、
処置コード、検査値
カルテレビューDPC 病院でランダムサンプル
した 315 人の患者
PPV/NPV/Sensitivity/
Specificity
DPCデータの診断の特異度は96%を
超えているが、感度は7つの疾患で50%を
下回り、疾患によって差があった。
Validity of claims-based
algorithms for selected
cancers in Japan: Results
from the VALIDATE-J
study
がんclaims dataICD-10コード、
薬剤、処置コード
院内がん登録外来、入院で診療を受けた
アルゴリズムに合致する
がん患者 25,934人
PPV/Sensitivity/
Specificity
Any malignancy:PPV 78.95% (78.41–
79.49)、特異度 98.33% (98.28–
98.38)、感度 67.30% (66.73–67.87)
Validity of initial cancer
diagnoses in the Diagnosis
Procedure Combination
data in Japan
がん(病名だけでなく、
TNM分類についても
調査)
DPCICD-10コード院内がん登録院内がん登録に登録され、データ
のリンケージが達成できた
29,180人
PPV/Concordance
(DPCデータに記録されて
いる各がん種の数を、がん
登録に登録されている
各がん種の総数で割って算出)
調査した15種類のがんのPPVは86.8-
100.0%であった
The accuracy of Japanese
claims data in identifying
breast cancer cases
乳がんDPCICD10コード、
処置コード
医療機関内のがん
登録レジストリ
院内がん登録の患者50,056人の
なかから、乳癌患者 633人を
抽出
PPV/NPV/Sensitivity/
Specificity
12の定義は90%以上の高い感度を示した
が、その他の定義は40%以下の低い感度
を示した。すべての定義の特異度は高く
(99%以上)、PPVは65.8~90.7%であった。
Accuracy of using
Diagnosis Procedure
Combination
administrative claims data
for estimating the amount
of opioid consumption
among cancer patients in
Japan
がん患者のオピ
オイド消費量
DPC薬剤(レセプト
コード)
カルテレビュー院内がん登録の患者のうち、
少なくとも1回はオピオイドが
処方された患者1,158人
DPCデータから得られた
オピオイド総消費量の推定値
と電子カルテから得られた
推定値を比較し、各月の2つの
推定値の差の割合を薬の種類別
に計算
調査期間中の電子カルテとDPCデータの
差は、電子カルテをベースラインとした
場合、-0.1%(4721mg/年/病院)であった。
差異の半分は、データ入力時のエラーが
原因であった。
Performance evaluation of
case definitions of type 1
diabetes for health
insurance claims data in
Japan
1型糖尿病claims dataICD-10コード、
薬剤、処置コード
カルテレビュー1回以上受診した1型糖尿病患者
・・ケース:296人、
コントロール:69,023人
PPV/sensitivity確定病名の感度は32.9%(28.4-37.2)、
PPVは33.3(95%CI:38.0、38.4)であった。
「1型糖尿病の確定病名+2つのインスリン
治療法(CSII用シリンジポンプとインスリン
針)のいずれか一方」で定義すると、
PPVは90.2(85.2-94.4)に向上した。
Validation study on
diabetes definitions using
Japanese Diagnosis
Procedure Combination
data among hospitalized
patients. 
糖尿病DPCICD-10、薬剤カルテレビューJPFC-NEXT Studyの対象患者
15,334人のうち、500人をランダムに
抽出。データの揃っている72人を
対象に検討。
PPV/NPV/Sensitivity/
Specificity
病名のみ:感度89.5(66.9-98.7)、特異度
96.2(87.0-99.5)病名または糖尿病薬:感度
89.5(66.9-98.7)、特異度94.3(84.3-98.8)病名
と糖尿病薬:感度68.4(43.4-87.4)、特異度
100(93.3-100)
Appropriate definition of
diabetes using an
administrative database: a
cross- sectional cohort
validation study. 
糖尿病JMDC Claims
Database
ICD-10、薬剤、
検査歴
特定健診の結果
(空腹時血糖、
HbA1c、抗糖尿病
薬の使用、眼底
検査)から糖尿病
の有無を判断
特定健診データのある2,999,152人PPV/NPV/Sensitivity/
Specificity
「糖尿病の診断名+抗糖尿病薬の処方+
診断と抗糖尿病薬の使用が同日」
→感度74.6%、PPV88.4%
Validity of Claims
Diagnosis Codes for
Cardiovascular Diseases
in Diabetes Patients in
Japanese Administrative
Database.
糖尿病患者における
心血管イベント、腎不全、
死亡
DPC(株式会社
リアルワールド
データ社)
ICD-10コード電子カルテ(入院
・外来を問わず、
医師の診断がフリー
テキストで入力され
ている場合でも、
RWD社がフリー
テキストの情報を
標準的な疾患コード
システムに変換
している)
電子カルテで2型糖尿病患者の
診断があり、claims dataでも
2型糖尿病の請求がある患者の
312,213人
PPV<PPV>
・うっ血性心不全:95.7(96.1-95.2)
・脳卒中:88.9(89.7-88.2)
・ESRD:67.4(68.9-65.9)
・心筋梗塞:78.7(80.6-76.8)
・死亡:80.3(81.0-79.5)
Association measures of
claims-based algorithms
for common chronic
conditions were assessed
using regularly collected
data in Japan
高血圧、糖尿病、脂質異常症JMDC Claims
Database
ICD-10コード、
薬剤
健診結果自己申告による薬の使用状況と
高血圧、糖尿病、脂質異常症に
関する検査結果のデータなどの
必要なデータが揃っている
445,810人
(高血圧:
286,139人、糖尿病:52,014人、
脂質異常症:277,707人)
PPV/NPV/Sensitivity/
Specificity/PLR/NLR
・高血圧:
  感度74.5%(74.2-74.8)
  特異度98.2%(98.2-98.3)
・糖尿病:
  感度78.6%(77.3-79.8)
  特異度99.6%(99.5-99.6)
・脂質異常症:
  感度34.5%(34.2-34.7)
  特異度97.2(97.2-97.3)
医療情報データベースを
用いた静脈血栓塞栓症発症、
出血性イベントのバリデー
ション研究
VTE(DVT, PEの複合イベント)、
出血
DPC(メディカル・
データ・ビジョン
株式会社)
傷病名コード、
ICD10 コード、
薬剤、処置コード
専門医の判断
(詳細不明)
データベースに登録された
5,044,743人のうち、下肢の整形
外科手術を受けた36,947人を
抽出
PPV・VTEイベント :PPV 75.0%
・出血イベント:PPV 73.3% 
Positive predictive value of
ICD-10 codes for acute
myocardial infarction in
Japan: a validation study
at a single center
急性心筋梗塞(AMI)DPCICD-10コードカルテレビュー急性心筋梗塞として請求があった
200名をランダムに抽出
PPVDPCの様式において、傷病名を入力する
ところのいずれかにAMIIが入っている:
PPV 89.3% (83.8–93.4)最も良い条件の
場合、PPV 93.8% (88.9–97.0)であった。
The validity of the
claims-based definition of
rheumatoid arthritis
evaluated in 64 hospitals
in Japan. BMC
Musculoskelet Disord
関節リウマチclaims data、臨床
データ(徳洲会
インフォメーション
システム株式会社)
ICD-10コード、
薬剤
カルテレビュー診療を受けた約160万人の患者
から、1万9734人を無作為に
抽出。うち、観察期間が365日
未満の患者は除外し、「関節リウ
マチの可能性がある症例」の定義
を満たした334人の患者を抽出
PPV/NPV/Sensitivity/
Specificity
最も良い条件では、感度 72.6%(62.4-
82.8)、PPV 80.3%(70.7-89.9)
Validity of administrative
database detection of
previously resolved
hepatitis B virus in Japan.
HBV再活性化のリスクがある
免疫抑制剤使用中の関節
リウマチ
claims data
(国立病院機構の
Medical Information
Analysis
databank)
ICD-10コード、
薬剤、検査歴
カルテレビュー定期的(年4回以上)にHBV-DNA
検査を受けた免疫抑制剤を使用
している関節リウマチ患者346人
PPVPPV 85.8%(81.7-89.3)
Validation of a novel
method to identify
healthcare-associated
infections
医療関連感染claims dataICD-10コード、
薬剤
カルテレビュー胃切除目的で入院した胃がん患者
584人
PPV/NPV/Sensitivity/
Specificity
感度 0.93(0.87-0.96)、特異度
0.91(0.89-0.94)、PPV 0.75(0.68~0.81)、
NPV 0.98(0.96-0.99)
Validation study of the
claims-based definition for
age-related macular
degeneration at a single
university hospital in
Japan.
加齢黄斑変性症(AMD)claims data傷病名コード、
薬剤、処置コード
カルテレビュー眼科外来受診で診断された加齢
黄斑変性症患者700人をランダム
に抽出
Sensitivity/Specificity/
PLR/NLR
診断名をAMDとした場合:感度 94.9%、
特異度 92.6%
Validity of congenital
malformation diagnoses in
healthcare claims from a
university hospital in
Japan. 
先天性奇形(CM)claims dataICD-10コードカルテレビュー先天性奇形と診断された乳児
227名
PPV・all CM:PPV 90.7%
・Major CM:PPV 91.5%
Validation Study of
Claims-based Definitions
of Suspected Atypical
Femoral Fractures Using
Clinical Information
非定型大腿骨折DPCICD-10コードカルテレビュー骨折(6types)のICD-10codeが
付与されていた2,535人(転子下
骨折9人、大腿骨骨幹部骨折
23人)
sensitivity/specificity/
PPV
・転子下骨折:
  感度 81.8%(48.2-97.7)
  特異度 100.0%(99.9-100.0)
・大腿骨骨幹部骨折:
  感度 82.1%(63.1-93.9)
  特異度 100.0%(99.9-100.0)
Claims-Based Definition of
Death in Japanese Claims
Database: Validity and
Implications
死亡JMDC Claims
Database
claims data上の
死亡、Charlson
comorbidity index
など(死亡の後に
請求がある状況を
ゾンビとした)
保険の資格喪失
理由の部分に書か
れている死亡
データベース内の195,193人
の保険受給者全員(20-74歳)
sensitivity/specificity/
PPV
最も良い条件で感度 61.6% (57.8−65.3)、
特異度 99.99% (99.98−99.99)、PPV
94.8% (92.3−96.7)であった。

最後に

RWDはRCTにはない利点があります(以前の記事:リアルワールドデータでできること・できないことのまとめ
しかしながら、その利点を生かすにはRWDの妥当性担保が必要となります。
今回紹介したように、日本におけるバリデーション研究は多くありません。

バリデーション研究は地道な作業であり、手間がかかることも要因の一つだと思います。2)

  • 自施設の入力間違いを探すような作業をするので、気分はよくない(病院代表者への丁寧な説明が必要)。
  • 協力施設のカルテ閲覧権限、端末・会議室の確保依頼
  • 通常業務に支障がないようにしなければならないよう予定時間内に終わらなければならない
  • 「項目の取り忘れ」、「終わらなかった」などの理由で再訪問することは困難

など

バリデーション研究を行う環境が整い、研究がより盛んになることを期待しています。

参考

  • 超絶解説 医学論文の難解な統計手法が手に取るようにわかる本, 金原出版 ,著者:康永 秀生, 山名 隼人, 岩上 将夫
  • 「日本における傷病名を中心とするレセプト情報から得られる指標のバリデーションに関するタスクフォース」報告書, 日本薬剤疫学会
    https://www.jspe.jp/committee/pdf/validationtrr120180528.pdf

引用

  1. 「日本における傷病名を中心とするレセプト情報から得られる指標のバリデーションに関するタスクフォース」報告書, 日本薬剤疫学会
    https://www.jspe.jp/committee/pdf/validationtrr120180528.pdf
  2. 超絶解説 医学論文の難解な統計手法が手に取るようにわかる本, 金原出版 ,著者:康永 秀生, 山名 隼人, 岩上 将夫
アバター画像

ラ・サール高校、東京大学医学部医学科卒業。脳神経外科を経て、株式会社メドレーにてオンライン病気事典及び遠隔診療に携わる。株式会社トライディアで、データサイエンティストとして企業向けデータ解析・AI開発に従事。2018年に株式会社データックを設立。様々な医療データ解析、脊椎外科PRO問診システムや医療言語処理案件を経験し、リアルワールドエビデンス事業を立ち上げた。「医療4.0」では日本の医療革新に関わる医師30人に選出。

二宮 英樹をフォローする
シェアする
二宮 英樹をフォローする
RWD Navi
株式会社データック
RWD Navi 運営者情報

RWD Navi(リアルワールドデータ・ナビ)はリアルワールドデータの価値を最大化することを目的としたメディアです。運営者である株式会社データックは「医学の知の創出を加速する」をビジョンに掲げ、臨床家と疫学者による研究提案で最適な意思決定を支援します。

DATACKコーポレートサイトを見る

タイトルとURLをコピーしました