一、 概述
与常见疾病相比,罕见疾病及其药物研发具有以下特点: ①罕见疾病中很多是严重或危及生命的疾病,许多属于先天遗传性疾病且多始发于儿童期;②对于罕见疾病,通常流行病学和疾病自然史等数据有限,医疗信息不充分,可能缺乏公认的疗效评价方法和研究终点;③患者群体小,开展临床研究的机会有限,药物研发经验较少;④疾病可能存在多种亚型,不同亚型患者的症状、体征、患病率及进展模式等可能各不相同,患者可能呈现较高的异质性;⑤小样本临床研 究方法具有特殊性。因此,罕见疾病临床研究的设计、实施和结果解释常面临挑战,罕见疾病的临床用药普遍存在未被满足的需求。
对于罕见疾病,在药物研发过程中,需要选择合适的设计和分析方法以确保研究质量和结果的可靠性。临床研究设计是决定研发成功与否的重要因素之一,良好的研究设计不仅有助于达到研究目的,同时能提高研究质量和研发效率;合理的统计分析有助于结果的解释。本指导原则针对罕见疾病药物临床研究中的关键统计学问题进行阐述,旨在为申办者开展罕见疾病药物临床研究提供指导。本指导原则主要适用于以支持药品注册上市为目的的临床研究,也可供以非注册为目的的临床研究参考。
二、 罕见疾病药物临床研究设计和分析
(一) 一般考虑
在临床研究设计阶段,申办者应根据研究目的确定合适的估计目标、入排标准、研究及治疗持续时间、数据收集频率等与临床研究相关的关键要素。疾病自然史研究在罕见疾病药物开发中非常重要。疾病自然史是指在没有对患者进行干预的情况下,疾病从发生、发展到结局(疾病消退、患者死亡)的整个过程。疾病自然史研究是一项旨在跟踪疾病过程并预先计划的观察性研究。其目的是确定与疾病的发展和结局相关的人口统计学、遗传、环境及其他因素(例如治疗方式、伴随用药等)。因此,疾病自然史数据是获得疾病诊断、进展、转化、结局等方面信息的重要方式,在罕见疾病药物开发的各个阶段均起到非常重要的作用,特别是在患者人群的识别、研究终点的选择、疗效阈值的确定、生物标志物的识别与开发、对照的选择等方面,对于罕见疾病而言,疾病自然史数据对相关药物开发和上市后使用提供重要的定位和指导。早期临床研究数据应与疾病自然史数据相结合,从科学上构成完善且逻辑充分的证据链,以支持药物的后期开发。对于临床研究的目标人群而言,一方面,由于患者总体人群小,罕见疾病的药物临床研究可考虑适当放宽入排标准使相对较多的患者进入研究,这不仅有利于患者招募,也能在目标治疗人群中更全面充分地评价药物的获益及风险。另一方面,对于异质性较高的罕见疾病,可考虑在临床研究中采用合理的富集策略以减少患者非药物相关的异质性,增强研究确证药物疗效的能力。
如果研究的目标人群是患有罕见疾病人群的亚群,申办者应考虑在非目标亚群中对该药物进行评估,以确定研究结果是否可以推广到更广泛的患者人群。申办者应从充分且设计科学合理的研究中获得确证目标人群的有效性证据,在伦理和实际操作可行的情况下,应尽量使用平行对照(例如安慰剂、标准治疗、阳性药物、不同剂量组对照等)设计。对照组的选择可能影响受试者的招募和脱落,申办者可考虑采用合理的研究设计,例如剂量效应、延迟启动、随机撤药、交叉设计、具有期中分析的适应性设计、以及同时利用试验和外部数据的混合合成对照组等设计方法,这些设计保留了安慰剂对照研究的优势,并且能够减少安慰剂的暴露,增加使用试验治疗的机会。由于患者人数有限,建议尽可能最大限度地利用每个受试者的数据,例如进行扩展队列研究、在早期研发阶段进行随机等。如有必要,可采用合理的分层随机以提高组间可比性,并且通过预先指定的分层分析提高检验效能。
盲法是控制偏倚的重要手段之一。如果临床研究只能使用非盲设计,应说明其合理性,且必须采取所有可能的措施来控制潜在的偏倚。
应严格将研究的总I类错误率控制在一定水平。如果研究的主要目的涉及对多个人群(例如生物标志物阳性人群和所有受试者人群)或多个终点进行假设检验,或者计划实施因有效性而提前终止研究的期中分析等多重性控制问题,应选择合适的多重性控制策略,并在方案以及统计分析计划中事先进行详细规定。计划因有效性而提前终止研究的同时需考虑安全性评价的数据是否充分等方面。
许多罕见疾病目前尚无公认的有效性评价指标,建议在早期研发阶段建立新的终点评估方法或改进现有的方法。对于含多个组成部分的复合终点,各个组成部分也应单独分析以确保整体结果不会过多依赖于少数组成部分;如果要对某些组成部分进行假设检验,则应事先规定控制总 I 类错误率的方法。在终点选择时需注意,罕见疾病临床研究可能纳入比常见病更广泛的疾病分期(例如疾病严重程度、并发症)或表型的患者。对于不同分期不同表型的患者,研究终点的有效性、灵敏度、可靠性或可解释性可能存在差异。另外,儿童患者和成人患者的终点指标也可能不同。
(二) 研究设计
通常情况下,随机对照试验通过随机分组最大限度地减少影响估计药物疗效的因素,因此研究结论的可靠性高,是评价药物疗效和安全性最有效、最准确的“金标准”。事实上,大多数已获批的罕见疾病药物均基于随机对照试验。对于常规的随机对照试验及可能适用于罕见疾病的剂量效应、延迟 启动、随机撤药、交叉设计等设计方法,本指导原则不再详述,而主要阐述在常规随机对照试验中加入其他设计元素的方法(例如序贯设计、应答适应性设计、n-of-1 设计、适应性无缝设计、篮式设计、贝叶斯方法等)、单臂试验、真实世界研究等。若采用单臂试验设计、真实世界研究等作为注册申报的关键性证据,申办者应说明其合理性。需要注意的是,任何一种研究设计都有其独特的优势和局限性。因此,实际药物开发中,申办者应根据研究目的和具体情形选择合适的设计并事先与监管机构沟通。
1. 序贯设计
序贯设计是指在控制总I类错误率的情况下,基于累积的数据进行期中分析,通过事先设定的合理的边界和样本量来判断疗效并决定试验是否继续。序贯设计适用于研究终点能够快速(相对于患者招募率)获得的临床试验。对于患者群体小、招募速度慢的罕见疾病临床试验,该方法可能适用。
2. 应答适应性设计
应答适应性设计是指新纳入受试者的随机分配概率根据已入组受试者的治疗结局而改变。这种设计的具体形式很多,常见的是“胜者优先”法,即根据已入组受试者的应答,如果一种治疗显示了更好的疗效,那么新纳入研究的患者更有可能在盲态下被分配到该治疗组中。此类设计可增加患者在潜在相对有效的治疗组中的暴露机会,同时可减少在剂量选择和确证性试验阶段的总体样本量。与序贯设计相同,该设计适用于能较快(相对于患者招募率)获得临床结局的试验。然而,这种设计不是基于随机分配概率固定的标准假设,且需注意盲态保持、统计分析等方面的问题。
3. n-of-1 设计
n-of-1 试验又被称为结构化的患者自身随机多交叉对照试验设计,简称自身多阶段随机对照试验。典型的 n-of-1试验包括多个治疗周期(一般≥3),每个治疗周期内包括若干个阶段,受试者在每个阶段中接受某种治疗。第一个治疗周期内的治疗顺序(例如试验-对照、对照-试验)随机确定,之后每个治疗周期内的治疗顺序随机确定或使用系统性的平衡设计(例如,试验有两个组别,第一次随机确定的治疗顺序是对照-试验,后续治疗周期直接分配试验-对照、对照-试验的治疗顺序,并依此类推)确定。这种设计的主要目标是通过对同一受试者进行多周期的交叉治疗,观察该受试者对试验药物和对照药物的反应,从而为该受试者寻找最优治疗方案。当有多个受试者进行了相同设计的 n-of-1 试验时,可采用与交叉设计和 meta 分析相似的方式合并多个 n-of-1 试验的结果。一系列 n-of-1 试验通常能够更好地显示出疗效趋势。
n-of-1 设计的优势在于利用患者自身对照设计,可以提高统计效率,减少样本量。同时能保证每个受试者都能得到阳性治疗。n-of-1设计也有其局限性,例如,较适用于速效对症治疗和在治疗结束后迅速恢复到稳定基线值的疾病。对于疗程较长或起效较慢、以及自限性疾病,不宜使用 n-of-1设计。需要注意的是,与一般的交叉设计类似,n-of-1 设计的前后不同阶段可能存在延滞效应。因此在试验的每个治疗阶段之间需考虑洗脱期。另外,受试者的随访时间比平行设计要长,因此受试者脱落的可能性较高。此外,研究设计还需要考虑治疗顺序的随机化和盲态的保持等问题。
4. 适应性无缝设计
适用于罕见疾病的适应性无缝设计主要是推断无缝设计,这种设计允许使用早期临床试验数据,在患者人群数量有限的情况下可能适用。例如,适应性 II/III 期推断无缝剂量选择的设计通常可以缩短由 II 期试验结束到 III 期试验开始时的时间间隔、减少试验总样本量、缩短试验时长等。另外,II期入组的受试者有更长的随访时间,有利于更早观察到药物的长期疗效和安全性。在使用适应性无缝设计时需考虑控制总I类错误率、保持试验完整性(例如,防止期中分析结果被泄露导致影响研究者的后续操作以及受试者的入组)等问题。
5. 篮式设计
适用于罕见疾病的主方案设计主要是篮式设计。篮式设计旨在评估一种药物治疗具有同一种生物学特征的不同疾病类型的治疗效果,每一子方案针对一种或多种类型的疾病。
6. 贝叶斯方法
贝叶斯方法是将先验信息与试验的样本信息综合得出后验分布,再根据后验分布进行统计推断的方法。即利用先验信息校正研究结果。先验信息的来源包括但不限于历史研究、专家经验及无信息先验等。借用各种来源可靠的证据作为先验信息,可减少当前试验的样本量、缩短试验时长、提高检验效能,对于招募困难的罕见疾病可能适用。为了获得充分的统计学证据,保证研究的质量、有效性和完整性,申办者应充分评估先验信息的合理性以及对统计学结论和最终结论可能带来的影响。建议使用其他合理的先验分布作为敏感性分析,以确保研究结论不会过分依赖先验信息。
7. 单臂试验
当罕见疾病患者数量极少、临床试验实施难度较大,尤其是当前缺乏有效治疗手段且危及生命的重大疾病,开展随机对照试验可能存在医学伦理风险,此时若考虑采用单臂试验设计,申办者需提供相应依据并阐明偏倚控制措施。
单臂试验通常采用外部对照,外部对照可以是目标值,也可以是外部的个体层面数据。对于以目标值为对照的单臂试验,目标值的确定应有充分依据,它可以来源于前期研究(例如,meta 分析或某一个具有最佳参考意义的研究)的效应量,也可以是行业内广泛认可的效应量,以此作为试验组至少应取得的目标效应。以目标值为对照的单臂试验须在研究设计和实施过程中控制选择偏倚,保证入组患者的代表性和与历史对照的可比性,并在统计分析时考虑可能的偏倚(例如选择偏倚、幸存者偏倚等)。由于缺乏同期平行对照,其研究结果应谨慎解读。
对于以外部个体层面数据为对照的单臂试验,有平行对照和历史对照两种形式,鼓励采用平行对照。采用历史对照是真实世界研究的一种情形,如果采用历史对照,需事先对历史数据进行治理,当治理后的数据满足适用性要求后,才可开展相关研究。外部对照研究终点的选择应与试验组保持一致,如果某些临床终点的测量在外部对照与试验组并非完全一致,需事先评估其影响并在设计时提出应对措施。试验组的样本量估计仍需基于统计学假设或估计精度,外部对照的样本量需考虑匹配因素等方面,因此外部对照的样本量通常多于试验组。
8. 真实世界研究
真实世界研究是指针对预设的临床问题,在真实世界环境下收集与研究对象健康有关的数据(真实世界数据)或基于这些数据衍生的汇总数据,通过分析,获得药物的使用情况及潜在获益-风险的临床证据(真实世界证据)的研究过程。
若申办者考虑利用真实世界研究作为支持罕见疾病药物上市的关键证据,建议参照相关指导原则进行科学严谨的设计,并就方案、数据治理/管理计划、统计分析方法等与监管机构沟通并达成一致意见。
(三) 样本量
对于罕见疾病临床研究,所需的样本量应保证能够充分评估药物的获益和风险。罕见疾病样本量的确定通常采用传统的估计方法,即基于临床研究目的、设计类型、原假设、备择假设、目标疗效以及个体变异,估计在一定的检验水准和检验效能下获得具有统计学意义结果所需的样本量。罕见疾病临床研究最大的挑战是患病率低,没有足够多的患者可纳入研究,因此申办者可能会采用灵活的设计方法,从而在一定程度上减少研究所需的样本量。如果采用非传统方法确定样本量(例如,使用贝叶斯等方法),样本量估计方法的合理性(例如,先验分布、参数估计值等设置是否合适)需经充分论证,必要时可采用不同的方法和/或基于不同的模拟参数进行估计,相关参数需与监管部门充分沟通并达成一致意见,在综合考量后确定最终样本量。样本量估计应有完整详细的记录,包括但不限于相关依据、文档、代码及结果,以支持监管部门进行必要的审核和验证。另外,样本量的确定还应考虑有充分的安全性评估数据。若采用国际多中心临床研究,样本量分配建议参考ICH E17。
(四) 统计分析
1. 统计模型的假设
罕见疾病研究的样本量一般较少,可能需考虑复杂、高效、获取信息丰富的统计分析方法。其中许多方法涉及利用统计模型,值得注意的是,只有在统计模型前提假设被满足的情况下,利用临床研究数据对疗效做出的推断才合理。在小样本情况下,实际中难以检验预设统计模型的前提假设是否正确,因此设计时应考虑在模型不同假设条件下及利用不同分析方法进行充分的敏感性分析,以评价结论的稳健性。判断模型是否适用及验证模型假设非常重要,申办者应在方案或统计分析计划中对模型假设、协变量选择及所用分析方法的合理性等关键统计学问题进行充分说明,并与监管机构沟通达成一致意见。
2. 统计分布
对统计分布的假设是使用统计模型的前提,当无法确定数据是否服从某特定统计分布(例如正态分布)时,可考虑使用非参数方法。
标准的渐近方法基于一个假定,即当样本量足够大时,假设检验统计量服从特定的分布。这在罕见疾病研究中样本量较小的情况下可能并不适用。当不确定渐近假定是否成立时,应采用合适的方法评估方法的小样本性质或考虑使用精确方法。
3. 协变量
在模型中纳入重要的协变量可能会提高疗效估计的精度和检验效能,但应注意协变量数量不宜过多。统计分析时应考虑随机分层因素,但它们之间的交互作用项通常不纳入主要分析模型。
4. 重复测量
采用受试者多时间点的(或身体的不同部位的)重复测量设计,可提高检验效能。需要注意的是,在重复测量设计中,同一受试者的观测结果之间是非独立的。忽视这种非独立性可能导致使用错误的统计学方法或得出错误的结论。此时可采用层次线性模型、混合效应模型等非独立数据的统计分析方法。
三、 罕见疾病临床研究实施中的注意事项
相对于常见疾病的药物临床研究,罕见疾病药物临床研究往往更常面对入组困难或入组时间长、样本量有限、入组受试者异质性高、缺乏有效治疗手段等问题,因而对临床研究实施中的质量有更高的要求。
第一,研究者往往缺乏足够的罕见疾病临床研究经验。申办者需要谨慎选择临床研究中心,确保研究中心具备相应条件;确保研究者以及研究人员对方案有充分的理解并严格按照方案和GCP执行研究;确保研究者、研究参与人员具备相关经验,并对研究运行中可能产生的突发事件有充分的处 置能力。
第二,罕见疾病患者,特别是儿童疾病和母婴疾病的患者,往往对于临床研究的相关知识了解很少,造成患者对临床研究的接受程度不高、参与临床研究的意愿不强。因此,需要提高患者的参与意识,使其充分了解临床研究的流程以及可能的获益与风险,使受试者充分知情并对其进行最大程度的随访,尽可能降低脱落率。对于停止用药的受试者,应鼓励其继续参与研究并进行随访观察,使研究信息的完整性和可解释性最大化。
第三,罕见疾病临床研究往往入组难度大、入组时间长,从而导致整个临床研究周期较长。在一段相对较长的时段内,
疾病诊断技术的发展可能导致入组受试者的特征改变,从而产生选择性偏倚;亦或由于标准治疗的改变导致对照组的选择困难。这些都可能给临床研究的实施和分析带来额外的困难,需要在研究设计阶段给予必要的考虑。
第四,为了确保研究人群的代表性以及足够的样本量,罕见疾病药物临床研究的入排标准有时相对较宽。这就要求入组过程必须严格遵循受试者的筛选条件,确保避免不必要的非目标人群计划外入组。
第五,罕见疾病患者数量有限,且临床研究的数据可能有多个来源。这就要求数据的收集和整理必须科学规范。标准化操作流程(SOP)、质量控制及数据质量保证都至关重要,另外还需保证疗效评估的科学、合理及规范。
四、 证据评价
与常见疾病药物一样,罕见疾病药物开发的总体目标是确证药物治疗某疾病的有效性和安全性,评估药物的获益-风险,并为药物说明书的撰写提供依据。因此,罕见疾病药物的开发和评价标准也应基于对药物安全性和有效性的合理评估。
(一) 有效性和安全性证据评价
在与常见疾病药物评价统一的监管标准下,鉴于罕见疾病的特点,对相关药物的评价具有一定的灵活性。特别是罕见疾病药物开发证据的建立可能需要考虑多形式、多方面、或合并来自多个数据源的证据,而药物的评估也将基于对全部证据的分析,包括对不同终点治疗效果的临床意义,治疗效果的持久性,以及安全性的评估等。
所有形式的证据都提供了一定的信息,并且应该包含在最终的综合分析中。例如,在极罕见的疾病中,单病例研究的综合评价可能是提供证据的唯一途径。对于此类研究,应在研究方案中进行前瞻性计划和描述。对所有数据(包括其他来源的数据)进行系统的审查和综合分析将增加证据的强度,例如对个别病例报告或观察性研究进行的综合分析。
在罕见疾病药物开发中经常缺乏公认的主要有效性终点和评价方法,因此建议在设计时尽可能考虑合理或可能的终点(包括替代终点、患者报告结局等),并在最终研究报告中呈现所有数据,以获得更加充分的证据。同时,可以在临床研究期间对疗效指标的合理性进行探索,为疗效指标选择的合理性提供证据。鼓励在临床研究期间研发适合罕见病的新的测量工具和终点指标。合理的替代终点与临床疗效的关系必须明确,才可能被接受。否则应根据预先制定的计划,用进一步的证据支持临床有效性、安全性和获益-风险的评价。
罕见疾病药物临床研究的统计设计、数据收集与分析以及结果的解读应遵循 ICH E9 及 E9(R1),充分考虑估计目标及伴发事件的影响。申报资料通常应包括事先计划的统计分析,例如主要分析、敏感性分析、补充分析、亚组分析等。
对于罕见疾病研究,由于患者人数少,可能需要复杂的统计分析方法,但需注意进行充分合理的敏感性分析,以确保结论的稳健性。另外,需注意临床研究实施中的相关问题对研究结果的影响,例如缺失数据、异质性等,要尽可能的量化这些问题对结果的潜在影响。
在利用真实世界证据时,应充分评估研究方法的科学性、数据的质量和相关性以及研究结果的可靠性,重点针对研究中潜在的选择偏倚、信息偏倚和混杂偏倚进行分析,并分别阐述在研究设计、实施和统计分析过程中对偏倚的相关控制 措施。对于研究结果,应探讨其局限性,并进行充分的敏感性分析,以检验研究结论的稳健性。
药物开发过程中安全性评价的目标是在合理的时间内,根据药物的预期用途,在合理数量的受试者中描述药物的安全性。对于罕见疾病药物,应考虑到该疾病患者数量有限所带来的可能挑战。为了尽可能增加上市前的安全性数据,申办者应考虑使用增强安全性评估的方法,例如疾病自然史数据、剂量选择研究、设置对照组及辅助安全队列等。充分可靠的自然历史数据有助于区分药物相关的不良反应和潜在的疾病表现。在伦理和实际操作可行的情况下,采用平行对照组设计可以帮助对不良事件因果关系的解释。辅助安全队列(例如,与有效性研究平行的安全性队列、药物其他适应症的研究、类似药物的研究)可以丰富上市前安全性数据库,提供更多的药物安全性信息。针对药物开发计划中可能面临的挑战,申办者应提出具体的应对策略。
(二) 获益-风险评估
虽然罕见疾病研发中的数据可能不够丰富,但仍需清晰呈现良好的获益-风险特征。申办者应遵循ICH M4 E(R2)的要求为药品的预期用途提供一个简洁、综合和可以明确解释的获益-风险评估。获益-风险分析需考虑罕见疾病特点,例如目前是否具有有效的治疗手段、疾病的严重程度(是否严重乃至危及生命)、临床急需性、以及患者在未满足医疗需求的情况下对风险的耐受性等。获益-风险分析应首先明确定义获益及风险、提供关键获益和风险相关的数据,并对数据的局限性和不确定性进行充分评估。对于明确或潜在的风险,应提出相应的风险管理计划。对数据分析结果的解读需要同时考虑统计学意义和临床意义,可将患者报告结局和医生临床观点纳入获益-风险分析,并将其作为重要的补充。
鉴于罕见疾病药物在临床研究中的局限性,通常需要在药物上市后进一步收集相关的安全性、有效性数据,为药物的获益-风险评价提供更加充分的证据和信息。
五、 与监管机构的沟通
由于罕见疾病在研究设计、实施、分析和报告中的特殊性,鼓励申办者与监管机构就方案设计及实施中的关键统计学问题进行及时沟通。进行沟通前,申办者应该向监管机构预先提供方案及关键统计学问题的详细资料。
(来源:国家药监局药审中心 https://www.cde.org.cn/main/news/viewInfoCommon/058e0d665b785e79b7f4f24dc1dc970c)