文荟谭初产妇早期和延迟屏气用力对母婴结局影响的回顾性研究

无痛分娩中国行2020-07-31 14:08:26

 编者按 

第二产程延长或者屏气时间过长和母婴不良结局相关。延迟屏气被认为可以缩短用力屏气的时间,减轻产妇的疲劳程度和增加阴道产率。但是目前,延迟屏气对围产结局的影响还没有一致的结论。此研究虽然为回顾性研究,但收集的样本量大,分析了21034 个初产妇资料。与既往大部分研究结果不一致的地方是,延迟屏气组第二产程和屏气时间都比对照组明显延长,且剖宫产率、手术阴道产率和产后出血发生率都较对照组高。两组新生儿不良结局没有差异。由于是回顾性研究,因此延迟屏气与妊娠结局的因果关系还不能明确。与对照组相比,延迟屏气组有更多的年长患者、非西裔白种人、引产/助产患者和接受硬膜外镇痛患者。研究没有能分析两组患者胎方位、不均倾、先露位置的资料。一些因为内在因素需要更长屏气时程才能分娩的产妇例如持续性枕后位、不均倾或先露位置较高的患者,医护可能会为了节约母亲体力消耗或者等待胎儿自动旋转等选择延迟屏气。这些可能造成研究组和对照组样本的非同质性。在白天工作时段,在有24 小时产科麻醉服务或者产科医生较少的情况下有更多的患者延迟屏气。医生和助产士对于采纳延迟屏气的态度也可能不尽相同。这些医疗相关因素都有可能造成研究组样本的偏差。

总之,延迟屏气是否以及如何影响围产结局还需要更多的研究,特别是随机对照的前瞻性研究来进一步探讨。初产妇与经产妇第二产程特点也不同。在得到进一步的结论以前,不应该将延迟屏气作为产程管理措施在临床普遍推广应用。

本期特约编者按:邓捷

耶鲁大学医学院附院母胎医学专科医师

2/27/2018


NPLD-GHI Journal Club 2018年2月文献评判

精选文章

【英文引用】Yee LM, Sandoval G, Bailit J, Reddy UM, Wapner RJ, Varner MW, Caritis SN, Prasad M, Tita AT, Saade G, Sorokin Y. Maternal and Neonatal Outcomes With Early Compared With Delayed Pushing Among Nulliparous Women. Obstet Gynecol. 2016 Nov;128(5):1039-47.

文章摘要

【标题】初产妇早期和延迟屏气用力对母婴结局影响的回顾性研究

【目的】分析延迟屏气用力相关因素,并进一步评估延迟屏气用力与足月单胎初产妇围产结局的关系。

【方法】本研究是尤尼斯-肯尼迪-施莱佛国立儿童健康与人类发育研究所“围产期医疗质量评估”(NCIHD-APEX)队列研究的二次分析。研究对象为2018年至2011年间美国25家医院分娩的115,502名产妇及其新生儿。研究纳入了单胎、头位、胎儿无异常、宫口开全10cm的足月初产妇,并分为“延迟组”(宫口开全后60分钟或更长时间之后开始屏气用力)和“早期组”(宫口开全后30分钟内开始屏气用力)进行比较。应用多因素回归分析评估延迟屏气用力与分娩模式、第二产程时长及其他母婴围产结局的独立相关性(P值<0.05视为有统计学显著差异)。

【结果】在21034例样本的初步分析中,延迟屏气用力的为3,870例,占18.4%。高龄妊娠、享有商业保险、非西班牙裔白人、采用引产或催产、合并糖尿病、接受硬膜外分娩镇痛的产妇更有可能延迟屏气用力。此外,延迟屏气用力也更常见于第二产程在白天发动的产妇或者有产科麻醉24小时专职值班的医院中,尽管统计学差异很小。通过对患者基线数据、产程特点(包括各医学中心)的差异进行校正后发现,延迟组产妇第二产程平均时长(191/84分钟,P<0.01)、主动用力平均时长(86/76分钟,P<0.01)均长于早期组。延迟组与①剖宫产率上升(11.2%/5.1%,校正比值比[OR] 1.86,95%可信区间[CI] 1.63-2.12)、②阴道助产率提高(校正OR 1.43,95% CI 1.14-1.40)、③产后出血率(校正OR 1.43,95% CI1.05-1.95)及④输血率(校正OR 1.51,95% CI可信区间1.04-2.17)增加均相关。与早期组相比,延迟组未增加新生儿不良结局的发生率。

【讨论】这个大数据的出生队列研究表明,延迟屏气用力与第二产程延长、剖宫产率及产后出血发生率的增加有关,但与新生儿发病率无关。


文献评判

1.评判标准

西北大学芬堡医学院麻醉科

医学论文质量评分表(改良版)

评定项目(每项评分0~2分)

1    问题和假设

2    伦理研究委员会和知情同意

3    研究设计方法,随机的方法

4    研究对象:入选标准,排除标准,人群描写指标

5    主要临床指标,次要临床指标

6    标本量计算,统计的Alpha值(P值)

7    统计方法的合理性

8    研究的局限性

9    讨论的逻辑性和结论的客观性

10    实际临床意义,直接临床结局相关的


2.论文质量评判结果及理由

14分

文章:

初产妇早期和延迟屏气用力对母婴结局影响的回顾性研究

评分标准(0~20分)

1

2分

评定项目:问题和假设

评分标准(0~2分)




背景/问题:

第二产程推迟用力或在主动用力前尽可能休息的做法已经成为日益普遍的产程管理措施。这种做法被认为可以减少孕产妇力竭,并预防产妇中转剖宫产和严重会阴撕裂等并发症。 尽管美国妇产科医师学会(ACOG)对推迟用力还没有明确表态,助产学和一些产科文献建议对合适的患者考虑推迟1-2小时用力,或直到产妇有自发用力的冲动。同样的,国际妇产科学联盟(FIGO)建议:初产妇在感受到用力冲动、进入主动用力阶段之前,最长可以等待4小时。

尽管第二产程延长和长时间主动屏气用力与母婴不良结局风险增加有关,但母婴风险与延迟屏气用力相关性方面的研究是相互矛盾的。一些数据表明推迟屏气用力可以减少主动用力的时间并可促进自发性阴道分娩;与此相反,一项纳入了高质量证据的对于随机对照试验的荟萃分析报道,推迟屏气用力与促进自发性阴道分娩无关。随机试验也报告了自相矛盾的结果,其中一些报告延迟屏气用力减少了主动用力的时长,另一些报告则认为早期或延迟屏气用力与主动用力的时长或分娩方式上没有差异,还有一些研究认为延迟屏气用力减少了异常分娩(难产)患者的主动用力时间,但在正常阴道分娩患者中未见差异。Frey等人回顾性分析表明:延迟屏气用力与主动用力时间延长相关,不影响或者可能降低自发性阴道分娩率。同时增加了不良围产结局,包括产妇发热和脐动脉血pH值降低。

本研究目的有两个方面:首先,通过这个大数据、全国多中心的初产妇队列研究,评估延迟屏气用力和围产结局之间的关系; 其次,探讨患者和医院层面因素与延迟屏气用力的相关性。

假设:延迟屏气用力与不良围产期结局相关,且因医院和患者特点而各异。

2

2分

评定项目:伦理研究委员会和知情同意

评分标准(0~2分)



伦理委员会:

本研究是对于APEX(2008~2011年)研究数据的二次分析。参与APEX研究的25家医院均获得各自医院本院伦理委员会审批。

3

1分

评定项目:研究设计方法,随机的方法 

评分标准(0~2分)




研究设计:

本研究是一项回顾性队列研究,是基于美国25家医院共同参与、纳入11.5万产妇、历时三年(2008~2011年)的大型、多中心观察性研究——APEX队列研究而进行的二次分析。

随机方法:

本研究为回顾性研究,非随机选择研究样本。

4

2分

评定项目:研究对象:入选标准,排除标准,人群描写指标 

评分标准(0~2分)




患者入选标准:

  • 2018年到2011年间在参加研究的25家医院分娩的单胎、足月(孕37周以上)、顶先露、正常妊娠、第二产程发动(产房记录宫口开全)的初产妇及其新生儿;

  • 符合上述1条件的初产妇中,阴道分娩第二产程早期屏气用力的(宫口开全后30分钟内)或延迟屏气用力的(宫口开全60分钟以后);

  • 符合上述1条件的产妇中,阴道分娩第二产程中期屏气用力的(指宫口开全后31~59分钟内屏气用力),初级分析时被排除,二级分析时纳入延迟组进行敏感性分析。

患者排除标准:

  1. 经产妇,胎儿异常,非顶先露,孕周<37周;

  2. 第二产程开始前产妇已分娩;

  3. 多胎妊娠,宫口未开全已分娩;

  4. 开始屏气用力的时间未经记录,宫口开全前已开始屏气用力;

  5. 进入产房前宫口已开全或者产妇已分娩;

  6. 宫口开全至分娩或主动用力的时长、主动用力至分娩的时长>12小时。

人群描写指标:

产妇基线特征、产科情况和内科病史,包括:产妇年龄,孕周,分娩时的体重指数,种族和信仰,保险状况,有无糖尿病,有无催产或引产,是否施行椎管内镇痛或麻醉,新生儿出生体重,是否治疗绒毛膜羊膜炎。

5

2分

评定项目:主要临床指标,次要临床指标

评分标准(0~2分)




主要临床指标/首要结局变量:

产妇分娩方式(阴道分娩或剖宫产)

次要临床指标/次要结局变量

  1. 第二产程总时长、二程主动用力时长、阴道助产率。

  2. 其他母婴并发症包括:

    ①会阴侧切;②重度会阴裂伤(三度或四度裂伤);③产后出血(估计失血量>1,500mL、输血或子宫切除);④输血;⑤产妇收治重症监护病房(ICU);⑥肩难产;⑦新生儿5分钟Apgar评分低于5分;⑧脐动脉pH≤ 7.0;⑨新生儿收治重症监护病房(NICU)。

  3. 医院和系统层面的因素,包括:

    ①是否配备24小时院内值班的产科医生、麻醉科医生或新生儿科医生;②产房是否有妇产科住院医值班;③进入第二产程时是否恰值医生换班;④换班时是否有正式交接班。

6

1分

评定项目:标本量计算,统计的alpha值(P值)

评分标准(0~2分)




样本量计算:

  • 本研究为回顾性研究,是对APEX队列研究大数据(2008~2011年25家医院共计 115,502 例患者)的二次分析。本研究设定了首要/次要临床指标,通过患者入选标准和排除标准对APEX的大样本进行了二次筛选,最终确定了纳入了23,732例患者,但没有标本量计算(参见原文图1):


  1. 早期组(宫口开全后30分钟内开始用力)17,164例;

  2. 中期组(宫口开全后31~59分钟内开始用力)2,698例;

  3. 延迟组(宫口开全60分钟以后开始用力)3,870例。

统计的α值:0.05

所有的统计均采用双侧检验,P值<0.05视为有统计学统计差异。

7

1分

评定项目:统计方法的合理性

评分标准(0~2分)




在比较延迟组和早期组的患者基线数据、产科特征以及母婴结局时,连续变量的单因素分析采用Wilcoxen检验,分类变量采用卡方检验。人群描写指标(见上文)中可能的混杂因素根据P值<0.05来确定。为评价延迟用力与母婴围产期结局的相关性,结局指标中连续变量采用多因素线性回归分析,分类变量采用多因素逻辑回归分析。这些回归模型将各医院/医学中心视作固定效应。此外,当逻辑回归因发生分离而无法收敛时,采用Firth’s惩罚最大似然估计。第二产程中期屏气用力的(宫口开全后31~59分钟内开始主动用力)纳入延迟组进行敏感性分析。所有检验均采用双侧检验,P值<0.05视为有统计学差异。其中的比值比(OR)应为风险比(RR)。缺失数据未进行填补。

8

1分

评定项目:研究的局限性(原文自评)

评分标准(0~2分)




局限性:

作者提到虽然数据本质上是回顾性的,更大的样本增加了检测差异的能力,并且多样化的队列提高了这些结果的可靠性。但是我们的发现可能与之前的工作有所不同,因为这些结果受到多因素的影响。产科并发症是多因素的,比如产后出血,比如逻辑上定义的第二产程持续时间包括延迟本身,仍然不清楚为什么延迟屏气用力与更长时间的主动用力相关联。因此进一步的工作是需要了解的是确定的相关性背后的发生机制。

原文自评:

  1. 第二产程开始时,胎儿高度和胎儿位置未知,有可能胎头高浮会影响首要临床结局(阴道分娩或剖宫产)。

  2. 如前文所述,延迟屏气用力可能受到非医学因素影响,本研究亦无法区分哪些是主观意愿的延迟用力,哪些不是;而将中期延迟(31~59分钟内)病例排除在外,有可能削弱了主观意愿延迟用力产妇的比例。但敏感性分析显示,纳入这部分产妇数据,并未实质性改变研究结果。

  3. 本研究无法确定不同医护人员类型的作用;当助产师或家庭医生将产妇转运到妇产科医生处进行手术分娩时,可能未将其按医务人员记录在册,导致这些阴道助产或剖宫产均与产科医生关联起来。

  4. 此外,回顾观察性研究数据无法证明因果关系,统计学模型亦无法解释所有偏倚的出处。

  5. 作为二次分析,本研究检验效能不足以检出罕见不良结局的组间差异。

9

1分

评定项目:讨论的逻辑性和结论的客观性

评分标准(0~2分)




逻辑性:

本文讨论的专业逻辑比较严谨,并未将研究结果及相关结论扩大化或普遍化,避免了读者或其他研究者们衍生出研究结果以外的包括阴性结论在内的任何结论目的清晰,首先结合结论进行文献背景描述,对不确定因素进行分析并讨论了研究的局限性,提出下一步改进方向。

客观性:

文章客观报告他们的发现,虽然是阴性结果,但进行了客观分析。

10

1分

评定项目:实际临床意义,直接临床结局相关的

评分标准(0~2分)




临床使用可行性

延迟屏气用力在产程管理中具有非常重要的意义,对降低剖宫产,提高母婴安全具有指导作用。下一步设计多中心随机双盲对照研究迫在眉睫。

能不能改变现状:

维持现状。根据不同情况作出选择。这篇文章不足于改变现行的临床规范。


3.专业评判

点评项目

1    研究问题是否有临床意义?

临床点评:确实需要有个确定性的结论指导临床实践。

胡灵群


2    研究内容的先进性、可行性?

临床点评:天天面临的,也是非常实际的临床问题,有非常大的可行性。当然得注意研究人群。

胡灵群


3    试验设计的严谨性?

冷月

方法学点评:比较严谨,利用了较大的一个回顾性队列数据库进行分析,符合试验问题的要求。


4    研究方法的合理性?

临床点评:这是一个二次分析研究。虽然是一个前瞻性的数据采集,但也还是一个回顾性研究。起到的作用只是指导将来的研究。事实上,两个分组基准资料已经显示她们的不可比性。更谈不上揭示因果关系。

胡灵群

冷月

方法学点评:该研究虽然不能和随机临床试验相比,不能揭示因果关系,但是作为一个回顾性设计使用的方法还是基本合理的。


5    研究过程的质量控制?

冷月

方法学点评:该研究未提及明确的质量控制,尤其是在分析时有重复大量的检验及回归模型,也并未做重复分析的校正,对结果的可信度有影响。


6    研究结果的可信度?

临床点评:区别于普通的回顾性研究,由于数据采集是前瞻性的,数据盲点比起一般的病历回顾少。这是一个世界上最大的25家教学医院研究联盟。以前有很多影响产科的研究出自这个研究联盟。文章采用的多项回归作为统计报告的主要部分可能会更贴切。

胡灵群

冷月

方法学点评:总的来说研究基于一个较为可信的回顾性样本,样本量大,设计严谨,不过由于可能有重复分析的问题结果的可信度受一定影响。


7    证据水平及原因?

冷月

方法学点评:该研究为回顾性观察研究,证据水平较低。


8    临床是否采用?(与目前方案比较)

临床点评:还是一个悬而未决的问题。因为研究对照的非随机性,结果不能直接指导临床实践,自然也就不能改变现有的临床实践。

胡灵群


专业点评荟萃

【方法学】冷月(美国加州大学旧金山分校流行病学博士后学者,J. NPLD-GHI统计学编辑)

该研究基于较大的一个回顾性样本,采用了wilcoxon, 卡方检验,线性回归,Logistic回归等一系列分析方法。研究设计及选取的统计方法较为严谨合理,并采用了firth’s adjustment针对rare events进行分析。值得注意的是,研究样本量大,并进行了很多次重复分析,缺乏对p值的校正,容易出现假阳性 (false positive)的情况。换而言之,当样本量足够大,统计检验次数足够多的时候,总会有几次结果是有统计学意义的。因此在这种情况下不能完全依赖P值下结论,应该综合effect size及校正p值后进行考虑。


【产科】丁晴(纽约大学妇产科)

我简单阅读了这篇文章,很有意思,样本量非常大。 我与住院医师一起工作,主要是高风险产妇,有很多引产,很少有自然临产的。多数产妇选硬膜外镇痛。延迟屏气用力的产妇往往有以下几种情况: 先露高的,助产师助产的,还有就是下班快到交接班前后。平时见到这类产妇小孩的新生儿重症监护室入住较多,也见到很多绒毛膜羊膜炎,但从这篇文章上看,没有证据支持我的直觉。当然,这不是一篇前瞻性随机双盲分组的研究。


【麻醉科】胡灵群(美国西北大学芬堡医学院西北纪念医院麻醉科医师,NPLD-GHI创始人,J. NPLD-GHI主编)

很多西方产科研究中,除了和分娩镇痛有关的研究,一般很少提及这其实是一个普及了椎管内分娩镇痛的人群。这种马上屏气用力和延迟屏气用力的研究在没有椎管内分娩镇痛的情况下是难以实施的。这篇文章便是一个典型的例子。但在评判这类文献中,这是一个非常值得注意的问题。研究结论是否能在自己医院产房使用的一个前提是研究人群和自己的病人一样,不然是不能直接运用的。这就是为什么在评判文献时,需要非常注意看研究人群的入选标准和排除标准。

需要明确的是,一项典型的回顾性研究是通过“果”(这个研究是包括剖宫产在内的母婴结局)来找“因”(本研究中的屏气用力的时机可能是其中的“之一”)为目的的。为后续认证找到的那个可能的“因”确实是“果”的研究做铺垫。这次大家面临的是一个数据库的回顾性研究,这会改变传统“回顾性研究”的属性吗?

当今各个数据库研究中一个最大的问题是,怎么使用这些数据研究?从最简单的P值确定,到因果关系的确定,都不再完全遵循我们以往教科书里一直讨论和擅长的抽样研究的各种方式方法。这些方式方法面临着各种挑战。本研究试图通过原来已有的数据,和现成记录的临床结局,分析大家比较关心的“因”与“果”之间的关系。但这是这篇文章并没有改变其回顾性的本质,也论证不了因果关系。并且,我看到过的从这个数据库出来的研究已经不下三个,P值没有进行校正还是选择0.05的做法值得商榷。

当然,在我们以往做过评判的、来自同一个数据库来论证主要临床指南是否对母婴临床结局产生影响的自然临床研究(impact study),非常值得国人借鉴。这是一个可以确定因果关系的、会越来越普及的大数据研究方法。探讨各种产妇或/和新生儿不良结局的危险因素有哪些是我们可以从这个数据库里另一个大家可以期待看到的结论。



4.知识加餐

向前看?往回看?RR、OR带你走~~~

本研究从APEX队列研究的大样本中筛选了21,034例产妇数据、分别纳入“延迟组”和“早期组”进行回顾性队列研究(对APEX数据的“二次分析”),尝试由“因”至“果”分析延迟用力与母婴结局的关联性。但研究采用OR(比值比)而不是RR(相对危险度)来评估“第二产程延迟用力”与首要结局指标(分娩方式)、次要结局指标(围产期不良结局)(详见原文表3)的相关性,这一点值得商榷。

OR(Odds Ratio)又称“比值比”,是病例对照研究(Case-control Study)常用的一项评价指标。病例对照研究属于“观察性研究>>回顾性研究”,通过分析病例组与对照组在过去时间段里的“暴露”情况,由“果”溯“因”,评价“暴露”因素与疾病之间的关联强度。病例对照研究的观察指标是暴露率(Odds),通常计算比值比OR(Odds Ratio),即病例组的暴露比值(即暴露人数除以非暴露人数) 除以对照组的暴露比值,如下:

点击图片,可查阅大图


下面,根据表3提供的数据,我们可以试着来计算一下首要结局指标、次要结局指标的OR值。

点击图片,可查阅大图


1,延迟屏气用力与剖宫产的关联(实质上剖宫产为“果”,延迟用力为“因”,“果”溯“因”)

点击图片,可查阅大图


现在,请读者们也动动手,来计算下①阴道器械助产、②严重会阴撕裂、③产后出血的OR吧,看看其与延迟用力的关系和原文表3的OR值是否相符。

而大家对RR一定不陌生。RR(Risk Ratio)是暴露组的危险度(累计发病率或死亡率)与非暴露组的危险度之比,所以又称“相对危险度”或“率比”。RR是反映暴露与观察人群发病/死亡关联强度的指标。——也就是研究观察的某个因素对于观察人群的危害程度(也可能是保护作用)。RR常见于“观察性研究>>队列研究(非干预)”或“实验性研究>>随机临床试验(RCT,有干预)”;RR值越大,表明暴露的效应越大、暴露与结局的关联强度越大。在由“因”至“果”的研究设计中,这种强关联性可以建立起因果关联。其实回顾性队列研究,更可以看作是从某个时间节点开始的“历史前瞻性队列研究”,虽然未进行随机分组,用RR来计算和评估“延迟用力”对各个临床结局的影响(危害或保护),证据强度高于病例对照的回顾性研究。

点击图片,可查阅大图


点击图片,可查阅大图


下面两张图显示了:1.前瞻性研究和回顾性研究的时间方向;2.不同研究类型的偏倚可能性(证据强度)。

点击图片,可查阅大图


供大家继续思考。

唐琳

2018.2.26


更多精彩推荐


致产房┃”别喊,⋯ 使劲儿!”“该用力了!”能管用吗?

点击文章题目,即可查阅全文

文荟谭┃产科专项临床细则的“存在”真的会明确改善妊娠结局吗?

点击文章题目,即可查阅全文




中文引用:武海荣、唐琳、冷月、邓捷、丁晴、胡灵群.  文献评判:初产妇早期和延迟 屏气用力对母婴结局影响的回顾性研究.  [J]. NPLD-GHI. 2018 Feb 20;5(2):27 

英文引用:Wu HR, Tang L, Leng Y, Deng J, Hu LQ.  Journal Club: Maternal and Neonatal Outcomes With Early Compared With Delayed Pushing Among Nulliparous Women.  J NPLD-GHI. 2018 Feb 27; 5(2):27


欢迎投稿:16762530@qq.com

小编微信:y16262530


特别感谢:"无痛分娩中国行"战略合作伙伴

Journal of No Pain Labor & Delivery 

- Global Health Initiative 

(ISSN: 2475-711X)

无痛分娩中国行杂志


译者:武海荣

编校/撰稿:唐琳

统计学审稿:冷月

专业审稿:邓捷 、丁晴、胡灵群

责任编辑:唐琳

主审:胡灵群

执行编辑:杨书伟

图片来源于网络