診斷試驗(yàn)meta分析的方法學(xué)質(zhì)量評(píng)價(jià)工具:QUADAS-2,你了解嗎?

診斷性研究(診斷試驗(yàn))的質(zhì)量評(píng)價(jià)工具QUADAS?(Quality Assessment of Diagnostic Accuracy?Studies)自2003年正式推出以來,就得到了廣泛的應(yīng)用。在實(shí)踐過程中,一些個(gè)人經(jīng)驗(yàn)、零星報(bào)道及各種反饋都提出了該工具在使用過程中需要進(jìn)行改進(jìn)的一些問題。因此,為了進(jìn)一步完善該工具,研發(fā)小組于2011年推出了QUADAS-2。
相比QUADAS,QUADAS-2將一些易混淆的條目內(nèi)容進(jìn)行了刪除和完善,將評(píng)價(jià)的條目改為單獨(dú)評(píng)價(jià)的偏倚風(fēng)險(xiǎn)和臨床適用性兩個(gè)方面,并增加了標(biāo)志性問題進(jìn)行輔助判斷。
QUADAS-2由4個(gè)部分組成:病例的選擇、待評(píng)價(jià)試驗(yàn)、金標(biāo)準(zhǔn)、病例流程和進(jìn)展情況。
所有組成部分在偏倚風(fēng)險(xiǎn)方面都會(huì)被評(píng)估,前3部分也會(huì)在臨床適用性方面被評(píng)估。在偏倚風(fēng)險(xiǎn)判斷上納入了標(biāo)志性的問題,這些研究設(shè)計(jì)方面的標(biāo)識(shí)性問題與偏倚潛在性有關(guān),旨在幫助評(píng)價(jià)者判斷偏倚風(fēng)險(xiǎn);但臨床適用性的判斷未納入標(biāo)志性問題。完整版的QUADAS-2工具資源在QUADAS官方網(wǎng)站(www.bris.ac.uk/quadas)及附錄(www.annals.org)中可以獲得。
QUADAS-2的4個(gè)組成部分都要進(jìn)行偏倚風(fēng)險(xiǎn)評(píng)價(jià)。根據(jù)每部分納入的相關(guān)標(biāo)志性問題的回答“是”、“否”或“不確定”,可對(duì)應(yīng)將偏倚風(fēng)險(xiǎn)等級(jí)判定為“低”、“高”或“不確定”。
若一個(gè)范圍內(nèi)所有標(biāo)志性問題答案均為“是”,那么可以被評(píng)定為低偏倚風(fēng)險(xiǎn);若所有信息化問題答案有一個(gè)為“否”,那么偏倚有存在可能性,評(píng)價(jià)作者接著就必須根據(jù)制定的指南判斷偏倚風(fēng)險(xiǎn)?!安淮_定”分級(jí)指的是文獻(xiàn)中沒有提供詳細(xì)的內(nèi)容以致評(píng)價(jià)者難以做出判斷,此類只有在報(bào)道的數(shù)據(jù)不充足的情況下才可以使用。偏倚風(fēng)險(xiǎn)評(píng)價(jià)的具體條目如下。
1 病例選擇: 選擇的病例是否會(huì)產(chǎn)生偏倚?
問題1:是否納入了連續(xù)或隨機(jī)的病例?
Was a consecutive or random sample of patients enrolled?
一個(gè)理想的研究應(yīng)該連續(xù)或隨機(jī)納入帶有疑似疾病的符合要求的患者,以避免潛在偏倚發(fā)生。如果文獻(xiàn)中描述了病例的納入是連續(xù)性的且是有時(shí)間范疇的,就評(píng)為“是”; 若什么都沒介紹,就評(píng)為“否”; 若有納入的時(shí)間界限,而沒有指明是不是連續(xù)性的,就評(píng)為“不清楚”。
問題2:是否避免了病例-對(duì)照類研究設(shè)計(jì)?
Was a case-control design avoided?
在納入的病例中,至少有一例診斷為不明確,就評(píng)為“是”; 若其中一組可以直接診斷,而另一組為疑似病例,那么就評(píng)定為“否”; 若提供的資料不足以判斷的,就判定為“不清楚”。例如: 腮腺區(qū)良性腫瘤的診斷如果納入的病例其中一組直接是考慮良性腫瘤的,而另一組考慮是良性肥大的,就評(píng)定為“否”; 若提供的資料不足以判斷的,即為“不清楚”。
問題3: 研究是否避免了不恰當(dāng)?shù)呐懦?
Did the study avoid inappropriate exclusions?
作出不恰當(dāng)研究排除( 如: 沒有納入“難以診斷”的患者) 的研究可能導(dǎo)致診斷準(zhǔn)確性評(píng)價(jià)過高,研究納入的已知的疾病和不符條件的對(duì)照組同樣可以夸大診斷準(zhǔn)確率; 相反,排除易診斷的患者就可能會(huì)導(dǎo)致診斷準(zhǔn)確性過低。在納入的病例中,若診斷不明確的病例占20%以上就可以評(píng)價(jià)為“是”; 如果都能較明確診斷,也就是沒有包含他們?cè)\斷不明確的病例,就應(yīng)評(píng)為“否”; 當(dāng)納入的病例中,診斷不明確的所占比例少于20%,就認(rèn)為是“不清楚”。
2 待評(píng)價(jià)試驗(yàn): 待評(píng)價(jià)試驗(yàn)的實(shí)施或解釋是否會(huì)產(chǎn)生偏倚?
問題1:待評(píng)價(jià)試驗(yàn)的結(jié)果判讀是否是在不知曉金標(biāo)準(zhǔn)試驗(yàn)結(jié)果的情況下進(jìn)行的?
Were the index test results interpreted without knowledge of the results of thereference standard?
判定待評(píng)價(jià)試驗(yàn)結(jié)果應(yīng)該遵守盲法,因?yàn)榻饦?biāo)準(zhǔn)的信息可能會(huì)影響待評(píng)價(jià)試驗(yàn)的解釋,所以評(píng)價(jià)者在判定試驗(yàn)結(jié)果時(shí)應(yīng)該不知道病理結(jié)果。如果待評(píng)價(jià)試驗(yàn)始終是在金標(biāo)準(zhǔn)制定之前實(shí)施和解釋,那么該條目就可以評(píng)定為“是”,相反則為“否”; 如果沒有介紹的就評(píng)定“不清楚”。
問題2:若使用了閾值,那么它是否是事先確定的?
If a threshold was used, was it pre-specified?
選擇測試閾值優(yōu)化靈敏度和/或特異度可能會(huì)導(dǎo)致診斷效能的提高; 在獨(dú)立的樣本中,對(duì)患者使用相同的閾值,診斷效能可能變差。如果使用的閾值是在評(píng)判前確定的,就判定為“是”,相反即為“否”,信息不足以判斷即為“不清楚”。
3 金標(biāo)準(zhǔn): 金標(biāo)準(zhǔn)的實(shí)施及解釋是否會(huì)產(chǎn)生偏倚?
問題1:金標(biāo)準(zhǔn)是否可以正確地區(qū)分目標(biāo)疾病狀態(tài)?
Is the reference standard likely to correctly classify the target condition?
從理論上講,選擇恰當(dāng)?shù)慕饦?biāo)準(zhǔn)很關(guān)鍵,它是決定診斷性試驗(yàn)的一個(gè)重要因素。金標(biāo)準(zhǔn)可以正確區(qū)分目標(biāo)疾病或已是現(xiàn)有最佳方法就判定為“是”,不能準(zhǔn)確區(qū)分即為“否”,判斷依據(jù)不足就認(rèn)為是“不清楚”。
問題2: 金標(biāo)準(zhǔn)的解釋是否在所選用化驗(yàn)方法結(jié)果不知情的情況下做出的?
Were the reference standard resultsinterpreted without knowledge of the results of the index test?
該項(xiàng)與待檢測試驗(yàn)的標(biāo)志性問題類似,就是金標(biāo)準(zhǔn)結(jié)果判讀是否使用了盲法,偏倚的產(chǎn)生與之前金標(biāo)準(zhǔn)的解釋有關(guān)。若金標(biāo)準(zhǔn)結(jié)果的判讀是在不了解待評(píng)價(jià)試驗(yàn)結(jié)果下進(jìn)行的即評(píng)價(jià)為“是”,相反則為“否”,難以判斷即認(rèn)為“不清楚”。
4 病例流程和進(jìn)展情況: 病例的流程是否會(huì)產(chǎn)生偏倚?
問題1:待評(píng)價(jià)試驗(yàn)和金標(biāo)準(zhǔn)之間是否有恰當(dāng)?shù)臅r(shí)間間隔?
Was there an appropriate interval between index test(s) and reference standard?
在相同時(shí)間對(duì)同一患者進(jìn)行待評(píng)價(jià)試驗(yàn)和金標(biāo)準(zhǔn)得到結(jié)果是最理想的。導(dǎo)致高風(fēng)險(xiǎn)偏倚的時(shí)間間隔隨疾病狀態(tài)條件的不同而不同,對(duì)慢性疾病患者來說短期的延誤可能不會(huì)產(chǎn)生問題,但對(duì)急性感染性疾病患者而言,它就可能產(chǎn)生問題。因此,此問題判定的關(guān)鍵取決于目標(biāo)疾病。一般而言,對(duì)于急性疾病,時(shí)間間隔若非常短則評(píng)價(jià)為“是”,而慢性疾病,檢測時(shí)間間隔即使比較長也應(yīng)該評(píng)價(jià)為“是”;若對(duì)于某疾病而言,金標(biāo)準(zhǔn)和待評(píng)價(jià)試驗(yàn)的檢測時(shí)間間隔過長,目標(biāo)疾病可能已經(jīng)發(fā)生變化,那么就評(píng)價(jià)為“否”;信息不足則為“不清楚”。因此結(jié)合疾病種類對(duì)“恰當(dāng)?shù)臅r(shí)間間隔”的判定是關(guān)鍵。
問題2:所有的患者是否只接受了一個(gè)相同的標(biāo)準(zhǔn)?
Did all patients receive a reference standard?
問題3: 所有的患者是否只接受了一個(gè)相同的金標(biāo)準(zhǔn)?
Did patients receive the same reference standard?
問題2和問題3大致表示的意思是一致的,也就是患者是否接受一個(gè)相同的金標(biāo)準(zhǔn)。若只有一定比例的研究組接受了金標(biāo)準(zhǔn),或者一些患者接受不同的金標(biāo)準(zhǔn),那么就會(huì)發(fā)生驗(yàn)證偏倚。如果待評(píng)價(jià)試驗(yàn)的結(jié)果影響了是否執(zhí)行金標(biāo)準(zhǔn)或使用哪個(gè)金標(biāo)準(zhǔn)的判斷,那么評(píng)價(jià)診斷的準(zhǔn)確性就可能存在偏倚。若可以清晰地判斷所有的患者均通過了金標(biāo)準(zhǔn)驗(yàn)證其疾病狀態(tài),那么就判定為“是”,相反則為“否”,若研究未報(bào)告該信息則評(píng)價(jià)為“不清楚”。
問題4:是否所有的病例都納入了分析?
Were all patients included in the analysis?
存在偏差,那么就存在潛在偏倚,也就是說所有納入研究的病例都應(yīng)該包含在分析內(nèi),不應(yīng)有遺漏,因?yàn)槭гL的患者與那些留下的患者會(huì)系統(tǒng)性地產(chǎn)生差異。判斷標(biāo)準(zhǔn)是所有病例都納入研究及評(píng)價(jià)為“是”; 有病例遺漏為“否”; 未說明無法判斷即為“不確定”
臨床適用性評(píng)價(jià)僅針對(duì)3 個(gè)部分( 病例選擇、待評(píng)價(jià)試驗(yàn)、金標(biāo)準(zhǔn)),其判定方法與偏倚風(fēng)險(xiǎn)的原理相同,主要是根據(jù)其與評(píng)價(jià)問題的匹配程度,也按“高”、“低”、“不清楚”判定等級(jí),只是此部分沒有標(biāo)志性的問題。具體的條目如下。
域1 病例選擇: 相關(guān)納入的病患和背景與評(píng)價(jià)問題匹配情況。納入研究的患者與評(píng)價(jià)問題所針對(duì)的目標(biāo)疾病狀態(tài)的患病程度,人口統(tǒng)計(jì)學(xué)特征,研究背景,及以前的測試報(bào)告等存在差異,那么就要考慮適用性問題。
域2 待評(píng)價(jià)試驗(yàn): 待評(píng)價(jià)試驗(yàn)的實(shí)施和解釋與評(píng)價(jià)問題的匹配情況評(píng)價(jià)。一些因素( 如: 執(zhí)行方案、檢測技術(shù)) 的變化可能影響診斷準(zhǔn)確性評(píng)價(jià)。如果待評(píng)價(jià)試驗(yàn)方法與評(píng)價(jià)問題不同,那么就可能要考慮其適用性。
域3 金標(biāo)準(zhǔn): 金標(biāo)準(zhǔn)的適用性評(píng)價(jià)。金標(biāo)準(zhǔn)是可以避免發(fā)生偏倚的,但是,目標(biāo)疾病所規(guī)定的條件可能會(huì)與評(píng)價(jià)問題中的特定目標(biāo)條件有所不同。因此若金標(biāo)準(zhǔn)不是很容易區(qū)分目標(biāo)疾病就要考慮其適用性。
今天的分享就到這了,如你有meta分析的問題,歡迎留言或加好友交流。
