医疗器械临床试验需要多少病例数

医疗器械临床试验是证明产品有效性的重要手段，医疗器械作为用于疾病治疗、检测、防护等功能的产品，其预期用途需要最终反映在使用者身上，因此直接在使用人群中实际使用该产品，能最直观评价产品是否能够实现预期的用途。受限于现实情况，临床试验不可能将全社会的所有适用人群全部纳入测试，只能选取有限的病例人群纳入试验。本质上，临床试验属于抽样检验，抽样检验过程中，抽样数量即临床试验病例数是其中最重要的参数。

Table of Contents

1.抽样检验的两类错误

抽样检验指从一批样品中抽取少量样本进行试验，以抽样样本的合格率来反映整批样品的合格率。很多时候不合格样品在整批产品中并不是均匀分布（临床使用中个体差异），因此抽样的情况不一定能正确反映整体的实际情况，可能发生抽样检验的两类错误，即第一类错误（假阳性）和第二类错误（假阴性）。

1）假阳性错误

整批样品中绝大部分为合格产品，抽样的时候运气不好，刚好抽到几个不合格的，错误地判定整批不合格。临床试验中表现为整体有效，但纳入临床试验的几例病例恰好临床效果都不佳，误判为产品无明显临床效果。

2）假阴性错误

整批样品中不合格产品超过可接受比例，抽样的时候运气好，刚好抽到几个合格的，错误地判定整批可接受。临床试验中表现为整体无明显效果，但纳入临床试验的几例病例恰好临床效果都显著，误判为产品有明显临床效果。

3）错误发生的概率

实际上，抽样数量越多或临床试验病例数越多，试验结果越接近真实世界的临床应用结果，出于对临床试验成本的考虑，试验中无法大量纳入试验病例，因此计算病例数时，应尽量控制两类错误发生的概率，见下图：

2.临床试验的比较类型

临床试验的研究类型包括随机对照试验（RTC）、队列研究等，其中随机对照试验为主要的研究类型。对照试验需要将试验产品的临床效果和对照产品（或方法）进行比较，比较类型包括优效性试验、等效性试验、非劣效性试验，可依据临床方案的需求选择其中一种，区别见下表：

试验类型	选择说明
优效性试验	试验产品有效率优于对照品，统计学检验为单侧检验。
等效性试验	试验产品有效率等于对照品，统计学检验为双侧检验。
非劣效性试验	试验产品有效率不低于对照品，统计学检验为单侧检验。

采用安慰对照的临床试验，需进行优效性检验。采用疗效/安全性公认的已上市器械或标准治疗方法进行对照的临床试验，可根据试验目的选择，如无特殊要求，一般选非劣效性试验，试验产品有效率要达到对照品90%以上。

3.临床试验病例数估算

医疗器械临床试验样本量需要符合统计要求，依据试验类型、适应症、主要指标的类型、临床意义的界值、检验的可信度和把握度、阳性率、脱落率及产品性质等确定。企业可自行设计样本量估算算法，或参考相应的法规和标准的推荐公式。以《医疗器械临床试验设计指导原则》中的平行对照、非劣效性试验公式为例：

式中：n_t——试验组样本量

n_c——对照组样本量

∆——为非劣效界值（常取5%-10%）

Z_1-α/2——为标准正态分布的分数位，当α=0.05时，Z_1-α/2=1.96

Z_1-β——为标准正态分布的分数位，当β=0.2时，Z_1-β=0.842

P_T——试验组预期事件发生率

P_C——对照组预期事件发生率

｜D｜——｜P_T-P_C｜

由于该公式中非劣效界值、预期事件发生率等均为经验值或临床认可值，所以不同类型的产品临床样本量差异较大，根据临床试验经验，对于平行对照、非劣效试验的产品样本量估算参考给出以下参考，供企业在产品注册前进行成本和试验难度评估：

产品类型	样本量参考
普通Ⅱ类产品	120-160例
植入类产品	200-300例
高风险医疗器械	200-300例
体外诊断试剂（Ⅲ类）	1000例
体外诊断试剂（Ⅱ类）	200例