关注创新药Ⅰ期临床试验剂量探索设计方法及其对我国的启示
栏目:公司新闻 发布时间:2024-06-03

  公海赌赌船官网综上所述,我国创新药物的研发要走向世界,药物临床试验必须与国际接轨。根据目前国际发展趋势和国内计算机技术的普及,使用模型和模型辅助设计取代3+3 设计将成为必然。

  Ⅰ期临床试验剂量探索设计方法已成为国外新药研发的热点问题之一,及时引进国外新方法对提升我国Ⅰ期临床试验水平具有实际意义。本文从基于规则、基于模型和基于模型辅助的设计方法3 个方面较系统介绍了目前国际主流Ⅰ期临床试验剂量探索方法。从有效性、安全性、可靠性3 个层面介绍了国外新方法的评价指标和评价结果。 结果显示,以BOIN、键盘、mTPI-2 为代表的基于模型辅助的设计方法和以CRM 为代表的基于模型的设计方法明显优于我国目前惯用的3 + 3 设计。模型辅助设计方法和基于模型设计的方法具有相似的准确性但简单易用。在分析国外Ⅰ期临床试验剂量探索方法发展经验的基础上,探讨了引进国外新方法对提升我国创新药Ⅰ期临床试验剂量探索设计水平的四点启示。 在创新药研发中,剂量探索是新药Ⅰ期临床试验的重要研究目的之一,其研究方法的科学性直接决定了后续临床试验给药剂量的安全性和有效性。最近研究表明,国外Ⅲ期临床试验失败的主要原因之一是药物剂量确定不正确[1]。 目前,Ⅰ期临床试验剂量探索设计方法已成为国外新药研发的热点问题之一,并产生了一系列理论基础扎实,应用效果良好的新方法[2-9]。及时引进国外新方法对提升我国Ⅰ期临床试验水平具有实际意义。虽然国内学者从统计学角度对一些新方法进行了探索和介绍[7,10],但目前作者尚未见到以临床试验实际工作者为对象从应用角度对国外新方法较为全面的介绍。 本文旨在较系统介绍目前国际主流Ⅰ期临床试验剂量探索方法基本概念和应用方法的基础上,探讨引进这些方法对改变目前我国Ⅰ期临床试验剂量探索研究单一使用传统3+3 设计方法[11-13]的启示。

  Ⅰ期临床试验剂量探索设计方法按其原理分为三大类,即基于规则、基于模型和基于模型辅助的设计方法。本文将分别介绍这三类方法中的代表方法及其主要变体,重点介绍近年发展较快的模型辅助设计方法。

  3+3设计是一种最早应用于Ⅰ期临床试验基于规则的设计方法[14],也是我国目前Ⅰ期临床试验剂量探索中最为常用的方法[11-13]。设计原理为: 在假设药物效应和毒性随剂量增加而增加的条件下,使用预先确定的规则进行剂量增减。3+3设计的优势是: 原理简单,操作方便。 缺点是,目标毒性率固定为33.3%,不能按临床需要变化。另外所得的最大耐受剂量( maximum tolerated dose,MTD) 准确性差,结果较为保守,导致在指导Ⅱ期临床试验时,由于剂量不足而不能显现应有疗效。美国MD安德森癌症中心报告,在使用3+3设计的Ⅰ期临床试验中,只有约3%的患者对他们被分配到的治疗剂量有反应[14]。 为了克服3+3设计的缺点,Simon等[15]提出了加速滴定的3+3 设计,此设计的主要特点是快速的初始剂量递增并允许对同一受试者进行剂量递增,该设计有助于减少接受低剂量治疗的受试者数量并能加快研究进度。传统3+3设计的另一变体为药理学指导剂量爬坡方法( pharmacologicallyguided dose escalation,PGDE) [14]。 该设计假设剂量限制毒性反应( dose-limiting toxicity,DLT) 可以基于动物数据通过药物血浆浓度预测。PGDE方法分2 个阶段进行,在第1阶段,实时测量每位患者的药动学数据以确定随后的剂量水平。只要血药浓度-时间曲线( AUC) 面积未达预先定义水平,就按每剂量一个患者进行剂量爬坡,剂量增量通常为100%。一旦达到目标AUC 或DLT 发生,剂量爬坡方法就切换为传统3+3 设计,剂量增量减小( 通常约40%) 。

  连续重评估方法( continual reassessment method,CRM) [16]是一种最早的基于模型的Ⅰ期临床试验设计方法。其原理是假设药物的剂量反应关系为某一参数模型,常见的有双曲正切模型、logistic 模型、指数模型。应用贝叶斯统计整合先验信息和试验信息,求得最大耐受剂量MTD。 虽然CRM可获得准确的MTD并具有良好的统计特征[17],但CRM方法涉及较深奥的统计学理论和复杂的计算。首先为获得贝叶斯统计所需的先验信息,试验开始前需对各个剂量水平的毒性概率进行初步估计,这些概率被称作骨架概率( skeleton) 。 然后通过标准数值积分法或马尔科夫链蒙特卡洛模拟,利用贝叶斯统计专业软件计算MTD 的后验分布。对于临床试验者CRM 原理类似一个“黑盒子”,加之在试验过程中要不断更新后验分布动态计算剂量增减界值,因此早期的CRM 设计在其实施时常常需要统计学者的全程支持,增加了操作上的难度。另外一个妨碍CRM临床应用的问题是,在试验开始前如何正确估计骨架概率,若估计不正确,则会使结果偏离实际[18]。 这是CRM虽然理论完善,但发展至今仍未能被临床实际工作者广泛接受的主要原因。虽然CRM存在这些问题,但是CRM方法的意义在于提出了和3+3 方法截然不同的解决问题的新思路,通过定义模型、引入先验信息及贝叶斯方法,使得剂量探索的效率更高[17]。 自CRM首次提出后,吸引了众多研究者对其进行扩展和改进,包括控制过量用药的剂量递增方法( EWOC) [19],解决迟发毒性问题的时间事件方法( time-to-event CRM) [20]、贝叶斯数据扩增方法( DA-CRM) [21],解决“骨架”随意性对模型影响的贝叶斯模型平均方法( BMA-CRM) [18],半参数剂量递增方法[22]以及针对竞争风险的双变量CRM方法[23]等。

  近年来,伴随着Ⅰ期临床试验剂量探索方法研究的深入及统计学方法的进展,研究者越来越注重将统计优良特性与实际易用性相结合。因此,一类新的方法应运而生,称为模型辅助设计( model-assisteddesigns) [3,7]。这类方法的特点是剂量增减的规则类似于传统3 + 3 设计,但是规则的制定则基于统计模型的估计,因此,相比较于3 + 3 设计具有更好的统计特性,相较于模型的方法具有更好的易用性。

  该设计[24]的原理为: 首先定义3 个区间,(0,Ø-ε1),[Ø-ε1,Ø+ε2]和(Ø+ε2,1)分别代表当前剂量毒性过低区间( LI) ,剂量毒性适当区间( EI) 和剂量毒性过高区间( HI) 。其中 为预定目标毒性概率,ε1和ε2为根据临床实际确定的等效界值的上下限。然后通过贝叶斯定理分别计算上述3 个区间的单位概率质量( unitprobability mass,UPM) ,当LI 对应的UPMLI最大时,增加1 个剂量; 当EI 对应的UPMEI最大时,保持当前剂量; 当HI 对应的UPMHI最大时,降低1 个剂量。由上述原理可知,由于其决定剂量增减的标准是根据贝叶斯统计计算的概率值而不是人为确定的固定值,所以与3 + 3 设计相比其准确性提高; 又由于决定剂量增减的3 个区间可在试验前给出,不需像CRM 方法那样对模型进行实时重复计算,因此大大地简化了其实际操作。值得注意的是,尽管mTPI规定了相应的安全停止规则,但由于(1-Ø-ε2)通常宽度较大,因此mTPI 有分配受试者到毒性过高剂量的风险。Guo 等[25]提出mTPI-2 方法以缓解mTPI 剂量过度的问题。

  Keyboard 是由我国学者提出的Ⅰ期临床试验剂量探索新方法。该设计通过构建一系列宽度相等的剂量区间,称为琴“键”,以解决mTPI 易过剂量的缺陷。键盘设计将剂量毒性适当区间称为“目标键”,在其两侧构建一系列宽度相等的键填充[0,1]区间。接下来,该设计计算各键在当前剂量处观察到DLT 率的后验分布曲线下面积并取面积最大键为“最强键”。 剂量分配规则为: 如果“最强键”在“目标键”左侧,增加一个剂量水平; 如果“最强键”就是“目标键”,保持当前剂量水平; 如果“最强键”在“目标键”右侧,降低1 个剂量水平。Zhou 等[3]研究显示,与mTPI 设计相比,键盘设计在保留其简单性的同时具备更优秀的过量控制和识别MTD 能力[7]。键盘设计与mTPI-2 设计原理及决策规则基本相同,但键盘设计更易被非统计人员理解。Pan 等[26]将该设计扩展到联合用药的Ⅰ期临床试验中。

  ( Bayesian optimal intervaldesign,BOIN[27 - 28]) BOIN 与mTPI /mTPI-2以及键盘设计相比,更为简洁。BOIN 不需要提前计算后验分布,仅需将当前剂量下观察到的DLT 率与事先定义的剂量增减界值比较即可进行决策。令λe和λd分别表示当前剂量下剂量增加和减小的最优界值,^pj 代表当前剂量j 下观察到的毒性概率,则其剂量分配规则为: 如果^pj≤λe,则将剂量增加至j + 1; 如果^pj ≥λd,则将剂量减小至j-1; 如果λe <^pj < λd,则维持当前剂量j。 多个研究[3, 29]表明,尽管BOIN 设计简单直观,但在准确性和安全性方面具有与更为复杂的CRM设计相当的优良性能且优于mTPI。BOIN 在^pj > λd时,保证降低剂量,因此临床医生和监管部门容易评估试验的安全性。BOIN 还允许临床研究者通过选择适当的目标DLT 率校准设计,以满足监管机构特定的安全要求。与其他模型辅助设计( 如MTPI /MTPI-2 和键盘设计) 相比,BOIN 的灵活性和透明性是其重要优势。目前由美国国家癌症研究所正在进行的一项Ⅰ ~ Ⅱ期临床试验[30] ( NCT02942264) 可说明BOIN 设计的优势。该试验旨在确定TG02( 一种基于嘧啶的多激酶抑制剂) 与替莫唑胺联合应用治疗成人复发性星形细胞瘤或胶质母细胞瘤患者的MTD。研究设置了150, 200, 250 和300 mg 4 种剂量的TG02。最大样本量为24 例,目标DLT 率为0. 35。根据BOIN 设计,如果当前剂量观测到的DLT 率低于λe= 0. 276,升高剂量; 如果观察的DLT 率大于λd = 0. 419,降低剂量; 如果观察的DLT 率位于0. 276 和0. 419 之间则维持原剂量。而对3 + 3 设计,当DLT 率> 33%时,不能确定MTD。 此外,BOIN 设计还是一种“多才多艺”的方法,目前已经看到多个研究者对BOIN 设计进行了扩展,包括适用于联合用药的设计[8],同时探索药物毒性和药物疗效的设计[5],研究终点为时间事件指标的设计[4],用于处理多种毒性结局的设计[6]以及可在一个统一框架下处理毒性终点指标为等级、二分类或连续型资料的设计[31]等。BOIN 软件可在3种平台实现: R 软件包、Web 网页和Windows 系统,这些软件可在上免费下载[10]。据美国MD 安德森癌症中心统计,BOIN 软件在全球已超过3 000 用户。

  对应用工作者而言,除了了解这些新方法的基本概念外,可能更为关注的问题是如何评价这些方法,以便在实际工作中选择适合的方法。由于Ⅰ期临床试验的特殊性,使其评价方法较其他研究更为复杂。如除了关注药物的有效性,尚应满足伦理学要求( 安全性) ,除了对所用方法的平均水平进行评价外,尚应考虑对其极端情况( 分配不良) 的评价。其评价指标可总结为准确性、安全性和可靠性三大类。

  ② 分配至MTD 剂量的人数比例: 定义为所用方法将受试者分配到MTD 剂量组的平均百分比。显然,这2 个指标值越大,所得MTD 的准确度越高。

  ① 过毒剂量选择百分比: 定义为选择真实DLT发生率≥目标毒性概率作为MTD 的百分比。

  ② 过毒剂量配置人数平均百分比: 定义为将受试者分配到过毒剂量的平均百分比。显然,这2 个指标值越大,其安全性越差。

  ① 过量用药风险: 定义为在大于MTD 的剂量组中,超过x% 受试者的百分比。如设置x% =50%,则表示这种设计将超过半数的受试者分配到MTD 以上剂量的可能性。

  ② 分配不良风险,定义为在试验过程中小于6 名受试者接受MTD 治疗剂量的百分比。

  ③ 不合理剂量分配风险: 定义为当2 /3或3 /6 的受试者出现DLTs 时,该设计未能降低剂量的百分比。这3 项可靠性指标实质上是对被评价方法出现极端情况的度量。这对样本量小,安全性要求高,研究结果对后续临床试验影响较大的Ⅰ期临床试验剂量探索研究具有特别的重要性。

  Zhou 等[3]和Ruppert 等[29]对目前主流的3 种基于模型的方法[连续重评估方法( CRM) 、过量控制剂量递增模型( EWOC) 和贝叶斯逻辑回归模型( BLRM) ]和3 种基于模型辅助的方法[改进的毒性概率区间( MTPI) 、贝叶斯最优区间( BOIN) 和键盘设计( 等效于MTPI-2) ]进行了评价。结果显示,在准确性方面,CRM,MTPI,BOIN 和键盘设计效果相近,且均明显优于3 + 3 设计。但BLRM 和EWOC的准确性较差,其平均水平与3 + 3 设计相似。在安全性方面,BLRM 和EWOC 设计的安全性最好,但这一优势以牺牲准确性为代价。CRM,MTPI,BOIN和键盘设计效果相近,但BOIN 和键盘设计的变异更小。 在可靠性方面,从过量用药风险指标看,BLRM,BOIN 和键盘设计表现最好,CRM 和MTPI 设计稍差,EWOC 虽然有与BOIN 和键盘设计相似的过量用药风险,但EWOC 的变异明显大于BOIN 和键盘设计。关于分配不良风险,BLRM 和EWOC 表现最差,风险显著高于其他设计; CRM,BOIN 和键盘设计具有类似的错误分配风险; 键盘设计和MTPI-2设计均改进了MTPI 设计。关于不合理剂量分配的风险,即稳健性,模型辅助设计优于基于模型的设计,当2 /3 或3 /6 的受试者出现DLTs 时,基于模型的设计( CRM,BLRM 和EWOC) 有8% ~ 55% 的概率不能降低剂量,而在MTPI,BOIN 和键盘设计从未发生过这种不合理的剂量分配。这一结果可能是因为当模型被错误指定时,基于模型的设计会产生不合理的剂量分配,而模型辅助设计不存在这个问题。 综合考虑,BOIN 在简易性、准确性、安全性和稳健性上均表现突出,且易于和临床人员沟通,是一个值得我国学者高度关注的Ⅰ期临床试验剂量探索新方法.

  Ⅰ期临床试验剂量探索方法是保障新药开发成功的重要基础,近年来,国外无论在理论研究还是在临床应用上都取得了重要进展[1,3, 31]。在美国,BOIN 设计已用于不同人群不同肿瘤的临床试验,包括儿童[32 - 34] 和成人[30, 35 - 48]、实体肿瘤( 如乳腺癌[36]、脑部肿瘤[30]、卵巢癌[37]、胃癌[41]、颈部肿瘤[42]、肺癌[45]、膀胱癌[46]、前列腺癌[47]、生殖细胞肿瘤[48]) 、液体肿瘤( 如白血病[38]和淋巴瘤[43]) 以及各种治疗药物( 如化疗[30]、放疗[42]、单克隆抗体[35]) 。BOIN 还被用于非肿瘤试验,如用于中风患者的干细胞治疗[49]。 然而,遗憾的是,目前国内在这一方向仍沿用已经使用了几十年的3 + 3 设计[11 - 13],截至2019 年6 月,采用中国知网、万方数据库、中国生物医学数据库三大中文检索系统,未能检索到采用上述新方法的实例。这一方面说明CFDA在《药物Ⅰ期临床试验管理指导原则》提出的“我国对Ⅰ期临床试验的管理与国际规范相比还有一定差距”[50]的判断符合当前我国实际,另一方面提示,及时引进国外新理念、新方法已成为提升我国Ⅰ期临床试验水平的当务之急。

  他山之石可以攻玉,分析国外Ⅰ期临床试验剂量探索方法发展的经验,给我们带来以下启示:

  ① 虽然从理论基础和实际应用上,基于模型和模型辅助的新方法较3 + 3 设计的优势十分明显,但由于人们对新方法缺乏认识从而习惯性选择熟悉的3 +3 方法[1],这样的规律同样适用于我国。因此,为在我国使用这些新方法,必须对Ⅰ期临床试验剂量探索方法要有较深入和全面的了解。

  ② 面对众多新方法,要正确认识各种方法的优缺点和应用条件。特别是在Ⅰ期临床试验剂量探索方法中,方法的准确性和安全性常常是对立的,若要提高准确性,常要牺牲安全性,反之亦然。因此拿一根尺子去衡量这些新方法是不可取的。如某一新药的毒性较大,则有可能选择较为保守的EWOC 方法; 若某一新药的安全性较好,为加快试验进度,则可选用加速滴定的BOIN 设计。又如,根据现有的药理学知识和临床经验,可以较准确估计药物的剂量反应模型和骨架概率,则应使用模型基础的设计,但若缺乏对新药剂量反应关系的认识,则应使用模型辅助设计。

  ③ 在引进国外新方法时,切忌生搬硬套,在设定某些新方法的重要参数时,应特别注意这一点。如为方便实际工作者的应用,上面介绍的新方法在相应软件参数的设置上多已给出默认值。在使用这些默认值时,应理解这些参数的统计学意义和临床意义。如在BOIN 设计中,对目标毒性率,其下限推荐使用默认值Ø=0.6Ø,上限推荐使用默认值Ø2=1.4Ø,但若被研究的药物对安全性要求较高,则应降低上限值。

  ④ 在引进国外新技术的时候,要注重对方法原理的理解,不应停留在对方法表面认识的一知半解上。如对目前应用前景较好的BOIN 方法,从操作层面上看,十分简单( 类似于3 + 3 的简洁性) ,但其原理既蕴含有贝叶斯统计后验概率最优化的决策理论又有经典统计的似然比检验原理; 至于理解其具有的长期记忆一致性和大样本条件下收敛于MTD的特征[27]都对该方法的创新性引进具有重要意义。显然对这一方面的研究,需要生物统计学者的介入。综上所述,我国创新药物的研发要走向世界,药物临床试验必须与国际接轨。根据目前国际发展趋势和国内计算机技术的普及,使用模型和模型辅助设计取代3+3 设计将成为必然。这需要临床学者、生物统计学者以及监管学者的通力合作。

  社群全国医院擂台赛(第八季)全国医院擂台赛(第八季)扫码加入进群需提交用户信息,


本文由:公海赌赌船广告设计创意公司提供