JADADスコア:臨床試験の質を評価する5つの基準

JADADスコアを用いて科学的根拠の信頼性を見抜く方法を分かりやすく解説。ランダム化比較試験(RCT)の質を評価する5つの基準について詳しく説明します。

JADADスコア:臨床試験の質を評価する5つの基準

はじめに

「飲むだけで痩せる」「専門家も認めた驚きの効果」。私たちは日々、サプリメントや健康食品などの広告を目にしています。その効果の裏付けとして「科学的な研究結果」が示されていることも多いですが、その研究は本当に信頼できるものなのでしょうか?

実は、科学研究においても、その研究成果の質には大きな差があります。もちろん、適切にデザインされた信頼性の高い研究が多数報告されていますが、結論ありきで進められた研究も残念ながら存在します。玉石混交の情報の中から本物の科学的根拠を見抜くことは、医療専門家だけでなく、私たち消費者にとっても極めて重要です。

この「研究の質」を評価する上で、重要視されるのが「ランダム化比較試験(RCT)」と呼ばれる研究手法です。そして、そのRCTの質を簡便に評価するツールとして歴史的に広く用いられてきたのがJADADスコアです。

本記事では、JADADスコアを用いて、科学的根拠の信頼性を見抜くための基本的な考え方から、具体的な評価方法、そしてその限界までを分かりやすく解説します。

JADADスコアとは

JADADスコアは、1996年にAlejandro Jadadらによって開発された、臨床試験の方法論的質を評価するための採点システムです(Jadad et al., 1996External link)。正式には「Oxford Quality Scoring System」とも呼ばれ、3つの質問への回答及び回答を元にした加減点を行うことで、0~5点のスコアリングを行い、RCTの報告を定量評価することができます。

Jadad et al.,External linkは、25000以上の引用が行われ、10000以上の系統レビューで利用されています (参考: Google ScholarExternal link)。 このように、JADADスコアは、その簡便性から系統的レビューやメタ分析において、RCTを評価する際の標準的なツールの一つとなっています。

評価項目と採点方法

JADADスコアは以下の3つの主要な要素について評価を行います:

1. ランダム化(ランダム化)に関する評価 (0~2点)

  • 研究がランダム化されていると記載されている: +1点
  • ランダム化の方法が記載されており、適切である: +1点
  • ランダム化の方法が記載されていない、または不適切である:-1点

適切なランダム化の例:コンピュータによる乱数生成、乱数表の使用、コイントスなど 不適切なランダム化の例:誕生日による割り付け、来院順による割り付けなど

2. 盲検化(ブラインド化)に関する評価 (0~2点)

  • 研究が二重盲検であると記載されている:+1点
  • 盲検化の方法が適切に記載されている:+1点
  • 盲検化の方法が記載されていない、または不適切である:-1点

適切な盲検化の例:同一外観のプラセボ使用、味や匂いも同じにした薬剤の使用など 不適切な盲検化の例:明らかに異なる外観の薬剤使用、片方の群のみに副作用が出やすい治療など

3. 脱落者・除外者に関する評価 (0~1点)

  • 脱落者数と脱落理由が記載されている:+1点

この項目では、研究開始後に脱落した参加者の人数とその理由が明確に記載されているかを評価します。ITT(Intention-to-treat)解析の実施有無も重要な確認ポイントとなります。

スコアの解釈

一般的に、JADADスコアは以下のように解釈されます:

  • 0~2点:バイアスリスクが高い可能性があり、慎重に解釈する必要がある研究
  • 3~5点:信頼性の高い研究

多くの系統的レビューでは、JADADスコア3点以上を「信頼性の高い研究」として扱うことが一般的です。ただし、この閾値は研究分野や目的によって調整されることもあります。

JADADスコアによる論文の評価例

  • 論文: "The effect of vitamin D supplementation on pain: an analysis of data from the D-Health randomised controlled trial"
  • 著者: Rahman et al.
  • 掲載誌: The British Journal of Nutrition
  • 発表年: 2023年
  • 論文へのLinkExternal link

研究概要

D-Health Trialは、オーストラリアで実施された大規模なランダム化比較試験です。60-84歳の成人21,315名を対象に、月1回60,000 IUのビタミンD3またはプラセボを5年間投与し、痛みへの影響を評価しました。

JADADスコアの評価

総合評価

JADAD Quality Assessment
5
/ 5

評価詳細

ランダム化

2 / 2
研究がランダム化されていると記載されているか?
はい+1
根拠: 「21,315 participants (aged 60–84 years) were randomly allocated (1:1 ratio) to take a monthly oral dose of 60,000 IU of vitamin D3 or a matching placebo」と明記されています。
ランダム化の方法が適切に記載されているか?
はい+1
根拠: 「We used automated computer-generated permuted block randomisation, stratified by age (60–64, 65–69, 70–74, 75+), sex and state of residence」と記載されており、コンピュータによる層別置換ブロックランダム化が実施されています。

盲検化

2 / 2
研究が二重盲検であると記載されているか?
はい+1
根拠: 「The D-Health Trial is a randomised, double-blinded, placebo-controlled trial」と明記されています。
盲検化の方法が適切に記載されているか?
はい+1
根拠: 「Placebo gel capsules contained excipient only and were identical in appearance」(プラセボは外観が同一)• 「Staff and investigators did not have access to the allocation list」(スタッフと研究者は割付リストにアクセスできない)• 統計解析も盲検下で実施:「Statistical code was developed using a dataset in which the randomisation group and participant identifier variables had been removed」

脱落者・除外者

1 / 1
脱落者数と脱落理由が記載されているか?
はい+1
根拠: 「Of the 21,315 participants randomised, 5 requested that their details be deleted from the database」(5名がデータ削除を要求)• 「For the current analysis, we included 20,423 participants (∼96% of both study groups) for whom at least one PIQ-6 score was available」(96%が解析に含まれた)• Figure 1のフローチャートで脱落者の詳細が視覚的に示されている• 「Eighty-four percent of participants reported taking ≥80% of the study capsules up to the end of 5 years」(服薬遵守率も報告)

この研究は、JADADスコアで満点の5点を獲得しており、方法論的に質の高いRCTであることが示されています。

JADADスコアの利点

  1. 簡便性と迅速性:5つの質問で評価が完了するため、多数の論文を評価する際に効率的です。
  2. 高い普及率:国際的に広く認知されており、研究間の比較が容易です。

JADADスコアの限界

JADADスコアは便利なツールですが、以下のような限界があることも理解しておく必要があります。

評価項目の限定性

JADADスコアは、ランダム化、盲検化、脱落者の報告という3つの側面のみを評価します。以下のような重要な要素は評価対象外です:

  • 割付隠蔽 (allocation concealment)
  • サンプルサイズの計算の妥当性
  • 統計解析手法の適切性
  • アウトカム測定の妥当性
  • 研究プロトコルの事前登録
  • 利益相反の開示

報告の質と実施の質の混同

JADADスコアは主に「報告」を評価するため、実際の研究そのものの評価を行なっているわけではありません。あくまでも、論文に何が記載されているかに基づいています。そのため、実際には適切にランダム化が行われていても、その方法が論文に記載されていなければ減点されます。

研究デザインによる適用の限界

すべての臨床試験で盲検化が可能なわけではありません。外科手術の研究や理学療法、筋力トレーニングの研究など、介入の性質上、盲検化が困難または不可能な場合があります。

このような研究では、質が高くてもJADADスコアが低くなる傾向があります。

より包括的な評価ツール

JADADスコアの限界を補うため、近年ではより包括的な評価ツールも開発されています。

スコア名説明
GRADEエビデンスを4段階で評価し、推奨の強さも示す
Cochrane Risk of Bias Toolバイアスリスクを6つのドメインで評価
PEDro Scale理学療法分野で使用される11項目の評価尺度

これらのツールは、JADADスコアよりも詳細な評価が可能ですが、その分、評価に要する時間も増加します。

まとめ

JADADスコアは、臨床試験の質を迅速に評価できる有用なツールです。その簡便性から、特に多数の研究を扱う系統的レビューやメタ分析において重宝されています。しかし、評価項目が限定的であることや、報告と実施の評価の区別が難しいといった限界もあります。

科学的根拠に基づいた意思決定を行うためには、これらの評価ツールを適切に理解し、活用することが不可欠です。JADADスコアは、そのための第一歩として、重要な役割を果たしています。