1 拼音
kàng zhǒng liú yào wù lín chuáng shì yàn zhōng diǎn jì shù zhǐ dǎo yuán zé
《抗腫瘤藥物臨牀試驗終點技術指導原則》由國家食品藥品監督管理局於2012年5月15日國食藥監注[2012]122號印發。
2 一、概述
臨牀試驗終點(End Point)服務於不同的研究目的。在傳統的腫瘤藥物的研發中,早期的臨牀試驗目的是評價安全性以及藥物的生物活性,如腫瘤縮小。後期的有效性研究通常評價藥物是否能提供臨牀獲益,例如生存期延長或症狀改善等。
用於支持藥物批准的臨牀試驗終點通常應當是反映臨牀獲益的指標。在腫瘤領域,生存期改善被認爲是評估某種藥物臨牀獲益的合理標準。在20世紀70年代,通常以影像檢查或體檢等腫瘤評估方法測得的客觀緩解率(Objective Response Rate ,ORR)爲依據批准抗腫瘤藥物上市。在隨後的數十年裏,逐漸認識到抗腫瘤藥物的審批應該基於更直接的臨牀獲益證據,如生存期改善、患者生活質量提高、體力狀況或腫瘤相關症狀減輕等。這些臨牀獲益很多時候並不能通過客觀緩解率或與其相關的指標進行預測。
當某種藥物用於治療嚴重或威脅生命的疾病、對現有治療有明顯改進、或填補治療空白時,在一定條件下可採用替代終點(Surrogate End Point)支持該藥物的上市申請。這些替代終點可能不像血壓或血清膽固醇這類經過充分驗證的指標,但可能能合理預測臨牀獲益。此種情況下,申請人必須承諾進行上市後臨牀試驗以確證該藥物的實際臨牀獲益。如果上市後研究不能證明該藥的臨牀獲益,或者申請人未按要求進行承諾的上市後研究,則國家食品藥品監督管理局(以下簡稱SFDA)可將該藥物從市場中撤出。
本指導原則的目的是爲申請人開展抗腫瘤藥物臨牀試驗終點指標的選擇提供參考,以使其符合某種藥物上市申請的有效性評價要求。本指導原則主要適用於國內、外均未上市的抗腫瘤新化合物的臨牀試驗研究,新生物製品也可參考部分內容。本指導原則中僅討論用於治療腫瘤患者的藥物的終點,未討論用於預防或降低腫瘤發生率的藥物的終點。
3 二、關於臨牀試驗終點的一般性考慮
本節回顧了抗腫瘤藥物研發中的一般性問題。對常用的抗腫瘤藥物臨牀試驗終點進行了探討,並對採用了這些終點的腫瘤臨牀試驗設計中的相關問題進行了討論。本節中將討論的臨牀試驗終點包括總生存期(Overall Survival ,OS)、基於腫瘤測量的終點如無病生存期(Disease-Free Survival ,DFS)、ORR、完全緩解(Complete Response, CR)、疾病進展時間(Time toProgression ,TTP)、無進展生存期(Progression-Free Survival,PFS)和基於症狀評價的終點。抗腫瘤藥物審批所用的重要臨牀試驗終點比較見下表。
終點 | 研究設計 | 優點 | 缺點 |
OS | ? 需隨機研究 ? 盲法不是必須的 | ? 廣爲接受的臨牀獲益直接衡量方法 ? 易於測量 ? 可精確測量 | ? 可能需要大型研究 ? 易受交叉治療和後續治療的影響 ? 包括非癌症死亡 |
症狀終點 | ? 隨機盲法研究 | ? 患者臨牀獲益的直接感受 | 盲法通常難以進行 數據缺失和不完整情況較普遍 小變化的臨牀意義不清楚 多元分析 |
DFS | ? 需隨機研究 ? 首選盲法研究 ? 推薦進行盲態審查 | ? 與生存研究相比所需病例少並且所需的隨訪時間短 | ? 不同研究存在不同定義 |
ORR | ? 可用單臂或隨機研究 ? 比較性研究中首選盲法 ? 推薦進行盲態審查 | ? 可在單臂研究中評價 ? 與生存研究相比,可較早並且在研究規模較小的研究中評價 | ? 不是臨牀獲益的直接測量 ? 受益僅侷限於患者亞組 |
? 可用於單臂或隨機研究 ? 比較性研究中首選盲法 ? 推薦進行盲態審查 | ? 可在單臂研究中評價 ? 持續完全緩解可表明臨牀獲益 ? 與生存研究相比,可較早並且在研究規模較小的研究中評價 | ? 並非全部病例獲益的直接測量 ? 受益僅侷限於患者亞組 | |
PFS(包括全部死亡病例),或TTP(進展之前發生死亡病例被“刪失(censor- ed)”) | ? 隨機研究 ? 首選盲法 ? 推薦進行盲態審查 | ? 與生存研究相比所需病例少並且所需的隨訪時間短 ? 包括對穩定疾病的測定 ? 不受交叉治療和後續治療的影響 ? 通常基於客觀、定量評估 | ? 在不同研究中存在不同定義 |
3.1 (一)總生存期
總生存期定義爲從隨機化開始到因各種原因導致病人死亡之間的時間,且是按意向治療人羣(ITT)計算。這個終點精確可測,並有死亡日期提供依據。在終點評估時不會出現偏倚。生存期是迄今爲止評價抗腫瘤藥物最可靠的臨牀試驗終點,當研究能充分評價生存期時,它通常是首選終點。
總生存期應在隨機對照研究中評價。對於這類時間依賴性終點(例如OS、PFS)的歷史研究中的數據極少可信。歷史研究中對照組和目前治療組間除使用藥物治療不同外,其他因素的差異還包括病例的選擇、影像技術或支持治療的改善,都將導致結果出現顯著差別。隨機化研究通過進行直接結果的比較,可將這些差別最小化。如果藥物的毒性可以接受,總生存期顯著的改善可視爲有臨牀意義,通常能支持新藥的上市批准。
生存期研究實施和分析中存在的困難包括大型試驗隨訪期較長,以及隨後的抗腫瘤治療可能會混淆生存期的分析。
3.2 (二)基於腫瘤測量的臨牀試驗終點
在本節,將討論幾種基於腫瘤測量的臨牀試驗終點。這些終點包括無病生存期(DFS)、客觀緩解率(ORR)、疾病進展時間(TTP)、無進展生存期(PFS)和治療失敗時間(TTF)。所有時間依賴性終點的數據收集和處理均基於間接的評價、計算或估算(如腫瘤的測量)。關於無進展生存期數據收集和分析的討論見附3。
當選擇基於腫瘤測量的臨牀試驗終點時,應針對該終點在抗腫瘤藥物臨牀獲益評價中的不確定性和偏倚進行評估。在不同的腫瘤試驗中,研究者對腫瘤測量的精確性相差甚遠。此外,如果腫瘤沒有明確邊界(例如惡性間皮瘤、胰腺癌和腦瘤),使用腫瘤測量方法獲得的緩解率可能是不精確的。藥物上市申請時如果採用基於腫瘤測量的臨牀試驗終點作爲有效性的唯一證據,那麼通常應提供來自第二個試驗得到的確鑿證據。
如果主要研究終點是選擇基於腫瘤測量的終點指標(如PFS或ORR),通常應由對研究治療分配處於盲態的獨立終點審查委員會驗證該終點指標的評價(見附4)。如果試驗本身未設盲時,這種由獨立的第三方進行的盲態下的測量特別重要。SFDA可能會抽查部分資料進行監察以覈實獨立終點審查委員會的審閱程序。其他關於資料收集的細節見附件1。當隨機研究採用盲法(除非發生不良事件使得研究實際上已被揭盲)或者在大型隨機研究中效應值是穩健的,並且敏感性分析證明未發現觀察者的偏倚(尤其是針對DFS),基於腫瘤測量的終點指標評價(尤其是PFS或DFS)可不需要進行集中獨立審覈。
3.2.1 1.無病生存期
無病生存期(DFS)通常定義爲患者從隨機分組開始到出現腫瘤復發或由任何原因引起死亡之間的時間。該終點最常用於根治性手術或放療後的輔助治療的研究。如果某些疾病(例如血液腫瘤)在大部分患者化療後達到完全緩解時,DFS也可以作爲一個重要終點。儘管在大多數輔助治療的情況下,總生存期仍然是一個傳統的終點指標,但是當生存期延長而使得選擇生存期爲臨牀試驗終點不現實的時候,DFS可以作爲一個重要的終點指標。目前DFS已經成爲乳腺癌輔助性激素治療、結腸癌輔助治療、以及乳腺癌的輔助性細胞毒治療的主要審批基礎。無疾病生存期可以是臨牀獲益的替代終點或者可以爲臨牀獲益提供直接證據。這一決定取決於療效大小、風險-效益關係以及疾病情況。
如果將DFS作爲一個可能終點,需要考慮的重要問題包括估計的療效大小和已經證明的標準治療方法的獲益。試驗方案應詳細說明DFS的定義以及隨訪研究和隨訪的時間安排。許多原因可能導致計劃外評價,各試驗組之間計劃外評價的頻率、時間和原因存在差異,而這些差異可能會導致偏倚。如果可行,可通過研究者和患者的雙盲操作,使這種潛在的偏倚最小化。可以通過對隨訪期間事件發生的總數(不管事件發生的時間)進行比較分析,從而評估由於計劃外的評價而產生的可能偏倚影響。
無病生存期的定義可能比較複雜,尤其是當死亡發生而沒有預先對腫瘤進展情況進行記錄時。這些事件可記錄爲疾病復發,或作爲刪失的事件。儘管所有關於死亡的統計分析方法均有一定的侷限性,但將所有原因導致的死亡均認爲是由疾病復發所致可以將偏倚降至最低。這種定義的侷限性在於高估了DFS,尤其是對於長期失訪後死亡的患者。如果在各研究組中長期隨訪的頻率不一致或是因爲藥物毒性而產生的非隨機脫落,將會產生偏倚。某些分析將腫瘤相關死亡認爲是DFS事件,並刪失了非癌症死亡病例,這種方法可能在判斷死亡原因時產生偏倚。另外,任何刪失患者的方法(無論是針對死亡還是末次隨訪)都會認爲被刪失的患者與未被刪失的患者具有相同的復發風險。
3.2.2 2.疾病進展時間和無進展生存期
疾病進展時間(TTP)和無進展生存期(PFS),TTP定義爲從隨機分組開始至出現腫瘤客觀進展之間的時間;TTP不包括死亡。PFS定義爲從隨機分組開始至出現腫瘤客觀進展或死亡之間的時間。關於腫瘤進展的明確定義非常重要,應在方案中進行詳細描述。
2.1 TTP和PFS
與TTP相比,PFS是更常選用的替代終點。因爲PFS包括死亡,更好地反映了受試藥物的毒副作用,因此與總生存期有更好的相關性。在對TTP的分析中,無論是在死亡時還是相對較早的隨訪期間,死亡均被刪失(試驗中的非隨機脫落)。PFS可假設患者的死亡與腫瘤進展有着隨機的聯繫。然而,當大多數死亡與癌症不相關的情況下,TTP也可以是一個合適的終點指標。
2.2 PFS作爲支持藥物審批的終點
上表列出了用PFS作爲支持抗癌藥物審批終點的優點和缺點。PFS反映了腫瘤的生長,又可以在證實生存期獲益之前進行評價。不會受到後續治療的混淆。對於預定的樣本量,PFS受到的影響可大於總生存期受到的影響。然而對於許多不同種類的惡性腫瘤來說,正式確認PFS作爲生存期的替代終點是比較困難的。通常沒有足夠的數據對生存期和PFS的相關性進行評價。抗腫瘤藥物臨牀試驗規模通常較小,已有藥物的生存獲益通常比較小。在不同的抗腫瘤治療試驗中,用於支持審批的PFS終點所起的作用是不同的。無進展生存期的延長是否直接代表臨牀獲益或僅是臨牀獲益的替代終點,取決於這種新治療方法的療效大小以及與現有治療相比的風險-效益比。
2.3 PFS試驗設計問題
在試驗方案和統計分析計劃(SAP)中應詳細描述評價、測量和分析PFS的方法學。同樣,在試驗方案中仔細對腫瘤進展標準進行定義也很重要。現在還沒有法定標準對腫瘤進展作出定義,申請人可能使用不同的標準,包括RECIST標準。除了公認的PFS標準中列出的大綱,試驗方案和統計分析計劃應增加其他細節。在兩個試驗組中,隨訪和影像學評價必須是均衡的,以避免系統偏倚。研究應儘量採用盲法。如果將患者或研究者評價作爲進展終點的一個因素,則設盲顯得尤其重要。至少,應由處於盲態的獨立裁定小組(independent adjudication team,一般包括影像學家和臨牀醫師)進行評價。SFDA和申請人應在以下方面提前達成一致意見:
● 研究設計;
● 疾病進展的定義;
● 記錄在CRF表上的數據;
● 統計分析計劃(SAP);
● 缺失數據的處理辦法和數據刪失辦法;
● 如適用,獨立終點審覈委員會(IRC)的操作規程(見附件4)。
2.4 PFS的分析
由於有數據缺失等現象,PFS的分析變得比較困難。試驗方案中應針對每位患者對“一個充分的評價隨訪(即,在此次隨訪中完成了所有約定的腫瘤評價)”給予定義。分析計劃應總結比較各治療組的隨訪充分性。方案應詳細說明如何分析不完整和/或缺失的隨訪數據,以及數據刪失的方法。分析計劃應明確說明主要分析,以及一個或多個敏感性分析,以評價結果的可靠性。雖然所有含缺失數據的分析都存在一定問題,但只要敏感性分析和主要分析都支持結論,那麼結果就是正確的。評價中應該包括長期失訪患者的死亡人數。這類死亡會造成高估了隨訪較少的組的PFS,從而導致PFS的測定產生偏倚。
由於可以從多個時間、多種來源獲得病情進展數據(包含計劃外隨訪的身體檢查和各種類型的影像學掃描),因此每次評價隨訪進行的數據收集有必要在隨訪前後限定的較短時間內進行。在較長時間內收集數據時,難以確定事件日期和刪失日期。建議:如果之前不存在缺失的評價,將最早觀察到病情進展的時間標記爲進展日期,並將確定無進展的末次影像學評價日期確定爲截止日期。附件3提供了一套主要分析或敏感性分析中可用於PFS的表格,建議在Ⅱ期臨牀試驗結束後與SFDA討論PFS數據的收集和分析計劃,在專門的方案評估中進行覈實。
3.2.3 3.客觀緩解率
客觀緩解率(ORR)是指腫瘤體積縮小達到預先規定值並能維持最低時限要求的患者比例。緩解期通常是指從開始出現療效直至證實出現腫瘤進展的這段時間。一般定義客觀緩解率爲完全緩解加上部分緩解之和。客觀緩解率是一種直接衡量藥物抗腫瘤活性的指標,可以在單臂試驗中進行評價。疾病穩定不應該是客觀緩解率的組成部分。疾病穩定可以反映疾病的自然進程,而腫瘤縮小則是直接療效。同樣,疾病穩定可通過TTP或PFS分析進行更精確的評價。如果可能,應採用標準化的指標以確定療效,如RECIST標準。緩解標準應在試驗開始前的方案中提前定義。客觀緩解率的評估包括緩解程度、緩解持續時間以及完全緩解率(沒有可測量到的腫瘤)。
3.2.4 4.治療失敗時間
治療失敗時間(TTF)是一個複合的終點指標,即從隨機化開始到無論何種原因(包括疾病進展、治療毒性和死亡)導致治療終止之間的時間。一個合理的支持審批的終點指標應當能清楚地將有效性和藥物毒性、患者或醫師退出、或患者不耐受區分開,TTF不能將有效性與其他變量進行充分區分。因此,不建議將TTF作爲支持藥物批准的終點。
3.3 (三)基於症狀評估的臨牀試驗終點
症狀和體徵的改善通常被認爲是臨牀受益,如體重的增加、疼痛的減輕或止痛藥用量減少等。主要可用於盲法、多數患者有症狀、無有效治療藥物和較少做影像評估的試驗的療效評價指標。在非盲法試驗中則容易受到主觀因素的影響,導致結果偏倚。當以症狀和體徵的改善作爲支持抗腫瘤藥物審批的主要終點時,應當能夠區分是腫瘤相關症狀的改善還是藥物毒性的減小或缺失。
患者自評結果(Patient ReportedOutcome ,PRO)是直接來自患者的關於其健康狀況的報告,而非來自臨牀醫生或其他任何人,可作爲反映症狀獲益的恰當評價方法。但有一定侷限性,研究者和受試患者報告中可能存在很大差別,問卷信息收集的時間點也會有影響,語言因素也會導致不能準確評估。生活質量評分(Quality of Life, QOL)也可以用來評估與健康相關的生活質量。但應當注意,以QOL來衡量藥物的結果可能只能說明某種藥物相對其他藥物來說毒性較小,但並非其有效性更好。
設計適宜的詳細的評估量表是準確評估藥物作用的基礎,不應僅僅提供“出現或未出現”這樣的數據。用於抗腫瘤藥物臨牀試驗效果評價的量表必須經信度(reliabitlity)和效度(validity)分析,且是學術界認可的。量表中各項目的評價應儘可能採用定量或等級來反映觀察項目變化的程度,應儘可能避免採用“是或否”、“出現或未出現”這樣的二分類數據。
由於毒性或腫瘤進展而終止對受試者的評價,導致數據丟失,這種情況在抗腫瘤藥物臨牀試驗中較爲常見。數據的丟失會導致評價的困難。因此,在試驗方案中應有相應的措施儘可能避免或減少數據的缺失。
3.3.1 1.特定症狀終點
與“疾病進展時間(TTP)”相似,“癌症症狀進展時間(Time to progression of cancer symptoms)”是臨牀獲益的直接測量指標而不是替代終點。如上文所述,疾病進展測量中存在的問題(例如評估缺失)同樣存在於“症狀進展時間”的評估中。在非盲的試驗中可能導致評價偏倚。其次,腫瘤的發展和腫瘤相關症狀開始之間會出現間隔。往往在達到症狀終點前,治療就進行了調整,從而混淆了分析結果。此外,許多抗腫瘤藥物的試驗中採用的是腫瘤相關症狀很輕的患者。而且很難將腫瘤相關症狀和藥物毒性區分開。
複合症狀終點的中的某一症狀指標應當具有相似的臨牀重要性,並且其結果不應當僅僅歸因於一個指標。例如,基於複合終點批准用於治療腫瘤骨轉移患者的藥物,與骨骼相關的事件被定義爲病理性骨折、骨放射治療、骨外科手術和脊髓壓迫。
選擇恰當的研究人羣是證明症狀方面獲益的關鍵。對於在研究基線時即有症狀的患者,可利用分類的症狀緩解分析評價。對於在基線時無症狀的患者,應分析“首次發生症狀的時間”。即使患者終止使用研究藥物或開始使用一種新藥,如果隨訪持續到首次出現症狀,仍可評價症狀的進展。
3.3.2 2.症狀數據面臨的問題
數據缺失以及評價不充分可能使症狀數據的評價更復雜,特別是對於開放性研究而言。因藥物毒性或腫瘤進展而退出研究是症狀數據丟失的一個原因。理想的情況是,當患者停止治療時應該繼續收集可供分析的信息。基於多樣性考慮,應進行多種症狀的前瞻性數據收集,並且需要在SAP中詳細說明必要的統計學修正。
3.4 (四)生物標誌物 (Biomarker)
儘管目前許多生物標誌物已經作爲臨牀觀察腫瘤反應和進展的監測指標,比如CA-125用於卵巢癌,PSA用於前列腺癌的觀察,血液和尿液中異常蛋白水平用於骨髓瘤緩解評價。但尚需要做進一步的研究證實現有測試方法的可靠性,並確定生物標誌物改善是否能預測臨牀獲益。因此,目前生物標誌物不能單獨作爲上市批准的依據,SFDA可以接受腫瘤標誌物作爲複合終點的一個指標。例如在卵巢癌患者中,伴隨CA-125上升的某些特定臨牀事件(如體力狀況明顯下降或腸梗阻)可反映患者病情進展。此外,生物標誌物還用於確定預後因素、患者選擇,以及在試驗設計中需要考慮的分層因素。提倡保留腫瘤部分組織、體液或血清樣本等以進行相關標誌物的研究檢查。
4 三、臨牀試驗設計考慮
新藥上市必須基於“充分且良好對照的研究”的有效性證據支持。研究必須與一個對照組進行比較,必須就藥物的療效提供足夠充分的評價。用於證明有效性的最可靠的方法是,在盲法隨機對照試驗中,顯示出有統計學意義和臨牀意義終點指標的改善。下面我們將討論幾個關於支持藥物上市的抗腫瘤藥物臨牀試驗設計的問題。
4.1 (一)單臂試驗
在當前沒有其他治療方法的情況下,並且據推測腫瘤的明顯縮小可歸因於試驗藥物,SFDA有時會接受在單臂研究中所觀察到的客觀緩解率和緩解持續時間作爲支持審批的證據。例如在急性白血病等疾病中,可以使用緩解率作爲支持審批的終點指標,因爲在這些疾病中,完全緩解與輸血需求量減少、感染降低和生存期增加相關。因爲各種類型腫瘤的自然進程變異性很大,單臂試驗不能充分體現時間-事件終點,如生存期、TTP和PFS。因此如採用時間-事件終點指標時,需要進行隨機對照研究。
4.2 (二)非劣效性研究
非劣效性(Non-inferiority)試驗的目的是通過一個預先規定值(非劣效性界值)論證一個新藥的療效不低於標準治療藥物。非劣效性界值是指療效的降低必須在臨牀可接受的範圍內,且不得超出陽性對照藥的效果。標準治療藥物必須有明確的臨牀獲益(生存獲益)。如果一個新藥的療效低於陽性對照藥療效的程度超出了非劣效界值,則可推斷該新藥是無效的。
非劣效性試驗是基於外部(歷史性)數據確定陽性對照藥物的療效大小。在抗腫瘤藥物試驗中,通常沒有充分數據描述該療效。非劣效性試驗還依賴於一個恆定的假設。該假設包括:歷史研究和當前研究中陽性對照藥的療效是恆定的。陽性對照藥的有效性來源於歷史數據和當前試驗,這一假設包括兩者均具有同樣的患者人羣特點、支持治療方法、評價方法。陽性對照藥療效的估計值應基於對歷史研究進行全面的薈萃分析。這些研究應重新證實與安慰劑相比陽性對照藥的有效性。實施非劣效性試驗的困難包括如何評估陽性對照藥療效大小以及確定需要保留的效應值(非劣效界值)。與優效性試驗相比,非劣效性試驗通常需要更多的病例,並且涉及到臨牀試驗結果的重現性。此外,後續治療和交叉到陽性對照藥組可以干擾各種非劣效性分析。使用生存期之外的其他終點的非劣效性試驗,對結果的解釋是存有疑問的。
4.3 (三)放療保護劑和化療保護劑的試驗設計
放療保護劑和化療保護劑是專門用於減輕放療或化療毒性的藥物。這些藥物的試驗評價通常有兩個目標。一是評價保護劑是否達到預期減輕放療或化療毒性的目的。二是確定保護劑是否危及抗腫瘤療效。可採用替代終點檢驗第二個目的,如客觀緩解率(ORR)或者至腫瘤進展時間(TTP),而非總生存期。
5 四、結語
本指導原則的總體原則是幫助申請人選擇上市申請的終點,同時鼓勵申請人在申報支持新藥上市方案的之前和SFDA進行討論,以探討用於支持藥物上市申請的終點和方案設計的可行性。
最後,上市審批並不僅僅取決於臨牀試驗設計,還取決於藥物上市申請中所有研究結果和數據。
6 附1:腫瘤測量數據採集
? CRF表和電子數據記錄治療前基線隨訪時鑑定的靶病竈。這類病竈的回顧性鑑定是不可靠的。
? 腫瘤病竈可用指定的字母或數字標識。這樣的標識可區分同一解剖位置發生的多個腫瘤,並可對基線和隨訪期觀測的腫瘤作配對比較。
? 要有一套機制確保隨訪期間關鍵時間點的全部數據收集。CRF表應保證每次隨訪時對受試者所有靶病竈進行評估,並且在基線和隨訪期間採用同樣的影像學或測量方法完成所要求的全部檢測。
? CRF包括的數據應顯示每次隨訪中是否進行了影像學掃描檢查。
? 當病竈完全治癒時,應標記爲“0”。否則,病竈消失不能與缺失值區別。
? 隨訪期檢查應對在病竈的原發部位以及新發部位出現的新發病變進行及時檢測。新發病變的出現和部位應記錄在CRF表中,並以電子數據提交。
7 附2:PFS分析中需考慮的問題
研究方案和統計分析計劃應能詳細地體現無進展生存期(PFS)的主要分析。其中包括終點的詳細描述,評價腫瘤的方法,評價腫瘤進展情況時使偏倚最小化的方法,例如建立獨立終點評審委員會(independent endpoint review committee,IRC)。通過一兩次的次要分析評價臨牀實驗中預期的問題以及評價結果是否可靠。以下列舉一些需要考慮的重要因素。
l 進展日期的定義。生存分析使用確切的死亡日期進行分析。但是在PFS分析中,確切的進展日期往往不可知。以下是在PFS分析中用來定義已記錄進展日期(PDate)的兩種方法。
1.一個方法是將能夠證明進展的第一時間定爲PDate:
· 以新病竈的出現作爲進展的標準,PDate指的是首次觀察到可測定的新病竈的日期。
· 如果在不同的時間進行多次基於靶病竈測量值總和的評價,PDate是指對靶病竈進行最後一次觀察或影像學檢查的日期,可以顯示出靶病竈測量值總和的增加達到預定的閾值。
2.另一個方法是將PDate定義爲在所有影像學檢查完成後(綜合證明存在進展),即按方案計劃進行的臨牀隨訪的日期。
· 刪失/截尾日期的定義。刪失日期的定義適用於在數據截止或中途退出之前沒有進展記錄的患者。在這些患者中,刪失日期定義爲有足夠證據證明進展情況的最終日期。一個可行的方法是採用最後評價的日期。也可以用多次影像學檢查來確定進展。另一個可行的方法是採用與影像學檢查相應的臨牀隨訪日期。
· 充分的PFS評價的定義。對於無證據證明病情進展的病人,PFS的刪失通常取決於最後對腫瘤進行充分評價的日期。充分的腫瘤評價的精確定義包括充分的靶病竈的評估及用於評價非靶病竈和尋找新病竈的充分的影像學檢查。
· 部分缺失腫瘤數據的分析。當在充分腫瘤評價隨訪期間出現數據部分缺失時,分析計劃應當描述計算進展狀態的方法。
· 腫瘤數據完全缺失。有時在出現數據缺失的隨訪之後緊隨着的是隨訪發現死亡或發現進展。另一種情況是後續評價顯示沒有進展。對於後一種情況,繼續治療和繼續監測進展證據看起來是妥當的,但是處理缺失數據的方法因後續事件而不同,並能呈現信息的刪失。另一個可行的方法是包括來自後續PFS評價之後的數據。當評價頻率較高並且僅有一次隨訪缺失時是可行的,但是當有兩個或更多的隨訪缺失時,應在最後一次充分腫瘤評估後刪失可能更合理。爲評價缺失數據的潛在影響,統計分析計劃(SAP)詳述主要和次要的PFS分析至關重要。在確定刪失和進展狀態的過程中應綜合考慮脫落原因。例如就主要分析而言,因爲未被證實的臨牀進展、抗腫瘤治療的改變或體力狀況的惡化而退出研究的患者應在最後充分的腫瘤評價時刪失。次要的敏感性分析會將這些脫落視爲進展事件。儘管進展後的隨訪可能很困難,但應盡全力保證能對發生疾病進展的患者進行隨訪,而不必在意缺失的隨訪次數。
· 無法測量疾病的進展。如果可能,進展標準應對每一個評價形態特徵的方法進行描述(如CT掃描、骨掃描)。通過一個處於盲態的複審委員會,覈查無法測量而影像學掃描證實進展的疾病,並經過SFDA的核實是非常重要。
8 附3:PFS分析示範表
正如第二部分(二)2.4所討論的,敏感性分析有助於確定PFS分析是否可靠。但是,敏感性分析是探索性的,支持主要分析的結果,並且有效性不可能僅僅基於敏感性分析來確定。下表描述了不同的敏感性分析方法以說明如何指定進展日期以及進展數據的刪失日期。下列3個表分別描述了3種不同的敏感性分析方法:
a.表A給出了對於僅僅包括有充分記錄的,並能夠被證實的進展事件的敏感分析。其他數據被刪失。表A進展日期爲:
· 僅基於由獨立終點審查委員會(IRC)覈實的放射性評價。臨牀進展不能作爲進展終點。
· 第一次記錄腫瘤進展的時間。
9 表A PFS1(僅包括有記錄的進展)
情況 | 進展或刪失日期 | 結果 |
隨機化 | 刪失 | |
預定隨訪的過程中證實有進展 | 最初的發現: | 進展 |
無進展 | 刪失 | |
無證據表明進展而停止治療 | 刪失 | |
因毒性或其他原因停止治療 | 刪失 | |
開始採用新的抗癌治療 | 刪失 | |
首次疾病進展評估之前死亡 | 死亡日期 | 進展 |
充分的評估過程中死亡 | 死亡日期 | 進展 |
遺漏一次以上隨訪後死亡或進展 | 刪失 |
表B中的敏感性分析通過指定刪失日期以及預定隨訪日期的事件以糾正腫瘤評價隨訪進度中的潛在偏倚。但是,如果在鄰近的最後一次隨訪時發生進展,這一方法可能引入偏倚,特別是對於開放試驗而言。這一方法最好應用於隨機盲法的研究中。
10 表B PFS2(進展和評估日期一致)
情況 | 進展或刪失日期 | 結果 |
隨機化 | 刪失 | |
預定隨訪的過程中證實有進展 | 下次預定隨訪日期 | 進展 |
無進展 | 有適當評估的末次隨訪日期 | 刪失 |
無證據表明進展而停止治療 | 有適當評估的末次隨訪日期 | 刪失 |
因毒性或其他原因停止治療 | 有適當評估的末次隨訪日期 | 刪失 |
開始採用新的抗癌治療 | 有適當評估的末次隨訪日期 | 刪失 |
首次疾病進展評估之前死亡 | 死亡日期 | 進展 |
充分的評估過程中死亡 | 死亡日期 | 進展 |
遺漏一次以上隨訪後死亡或進展 | 有適當評估的末次隨訪日期 | 刪失 |
b. 表C中的敏感性分析則根據研究者的評價來評價PFS。但是,如果在鄰近的最後一次隨訪時發生進展,這一方法可能引入偏倚,特別是對於開放試驗而言。這一方法最好應用於隨機盲法的研究中。