中华医学科研管理杂志, 2018,31(5) 张策, 陈淑良, 王晓桐, 等
摘要目的从期刊论文统计方法缺陷方面进行分析,并提出解决方案。
方法资料采用中国知网文献数据库中的"基础科学"及"医药卫生科技"数据库的全部文献作为抽样源,限定时间为2014年11月10日-2017年11月10日进行检索。共检出文献1 456 417篇,采用随机数字法每年抽样100篇,共300篇逐一通读考察统计学方法应用,指出统计缺陷并给出解决方案。
结果在分析的300篇文献中有126篇采用统计学方法,存在一定程度上的统计缺陷,其主要集中在未详细标注统计量和P值,统计方法的适用条件把握不好等问题,针对这些问题,笔者开发了统计学路径图和问答式计算机系统,供临床应用。
结论从被抽查的论文看,存在大量统计学缺陷,本文提出的统计路径图和问答式计算机系统为解决临床统计问题提供了一种解决方案。
统计学(Statistics)是一门研究数据收集、整理和分析的学科,随着现代医学的发展,统计学在医学科研领域得到广泛应用,研究设计、数据记录、结果表达与解释等均涉及统计学知识,统计学方法的正确应用是论文具有科学性和可靠性的前提;统计学的内容非常丰富且不断发展,但在科研过程中不规范使用、滥用、甚至误用的现象非常普遍,且涉及实验设计到结果解释的各个环节[]。医学统计学是医学科学研究中必需的手段,它体现科研结果的可信性、可靠性、科学性[]。但是许多调查研究发现,在医学学术论文中仍存在不少统计方法使用错误及表达不当的情况,这造成了论文统计结论的不可靠,有的甚至产生了严重的偏倚。本研究对近3年医学学术论文中统计学分析方法的应用情况进行了抽样调查和分析,分析常见的统计分析方法缺陷的原因,为提高论文的学术水平提供有益的建议。
资料与方法1.1 资料一般情况资料采用中国知网文献数据库中的"基础科学"及"医药卫生科技"数据库的全部文献作为抽样源,限定时间为2014年11月10日-2017年11月10日进行检索。近3年共检索出文献1 456 417篇,其中2017年535 250篇(2016年11月10日-2017年11月10日)、2016年795 074篇(2015年11月10日-2016年11月09日)、2015年126 093篇(2014年11月10日-2015年11月09日)。
1.2 文献抽取方法运用SPSS20.0软件包生成300个随机数,利用随机数在2015到2017年这3年的所有文献中,每年各随机抽取100篇文献进行统计学质量评价,具体方法为以中国知网搜索引擎搜出的文献的默认顺序号为基准,用随机数进行对应抽取。抽样过程中,随机种子设为20171110,执行RAND函数。
1.3 统计学路径设想统计学误用往往导致非常严重的后果,如结论错误、数据造假、丢失有价值的数据信息等,医学科研中的统计学缺陷可能违背医学伦理学要求,甚至可能导致不良的临床后果[]。但同时应该注意到的是,临床专业人员对统计学的执行不够严格,特别是统计学的基本理论欠缺,不能正确的选择统计学方法,笔者针对这一问题,创建统计学路径理论和问答式计算机系统,配有专门的统计学软件操作视频进行指导,目的是让临床医生不必过多了解统计学基本理论就能正确的选择统计学方法,利用"傻瓜式一站统计"助力临床科研。相信可以降低统计学缺陷的产生。
结果2.1 前十名杂志的一般特征300篇文献中涉及使用统计学研究方法的有126篇,其中2017年35篇、2016年50篇、2015年41篇。将抽选数量排名前的十位杂志列表显示,抽样文献中选自《中国妇幼健康研究》共有29篇,占41.43%。抽样分析中刊物级别省级和国家级大致均衡。本文的影响因子一般都在0.5~1之间,国内文献影响因子不高。其中影响因子最高的是《武汉大学学报》杂志,影响因子为1.321。
2.2 期刊中的统计学缺陷分析国内外研究者通过调查发现,在现代医学期刊中,统计方法的运用及表述存在着较多的问题[],本次分析中发现的问题如下,如表1所示:
表12015-2017年抽取的文献中统计学缺陷举例(n=189)
2.2.1 未标注P值 假设检验时,可由样本数据计算出该统计量的值,根据检验统计量的具体分布,可求出P值。[]根据抽样发现,抽样得到的300篇文献中,共有41.27%的文献没有标注P值,建议给出假设检验的精确P值而不是仅仅表达为"P>0.05"或"P<0.05"。P值与概率密切相关,其含义是样本间的差异由抽样误差所致的概率大小,所以精确标明P值,对假设检验的判断还是比较有意义的。
P值的习惯表述是,P>0.05称组间差异不显著,P≤0.05称组间差异显著,这里的"显著"是统计学的一个术语,指观察结果统计量实际代表的总体参数与原假设总体参数在概率意义上的"显著"偏离。P值越小,拒绝原假设的统计学依据越充分,但不能理解为P值越小,试验结果本身越有意义[]。
2.2.2 未标注统计量 在进行统计分析时,应根据不同的分析方法给出相应的检验统计量。[]统计量是计算P值的重要依据,也是判断P值的重要参考,论文中应同时标注统计量和P值。我们的研究发现有许多文献在分析中并未给出统计量,而仅仅给出P值,这样的问题占比40.21%。大大降低了论文的科学性和严谨性。
2.2.3 希腊字母χ2(卡方)用X2表示,科研有欠严谨 研究发现有11.6%的的卡方检验的希腊字母χ用英文字母用X表示,体现科研工作欠严谨。
2.2.4 方差分析未考虑方差齐性 方差分析的前提条件是资料要服从独立、正态和方差齐性。在本次调查中发现,方差分析中针对独立性和正态性控制的较好,对方差齐性检验尚存在欠缺,有2.65%的研究没有明确考虑方差齐性。在统计工作中,如方差齐采用LSD等方法进行两两比较,如果方差不齐,应对变量进行处理:(1)用非参数检验方法;(2)用近似法;(3)采用变量变换法,使其方差呈齐性[]。
2.2.5 未考虑正态检验 数据的正态性检验是参数检验的基础,所以数据是否服从正态比较重要,本次研究中,有1.59%的研究没有考虑数据的正态性检验。正态性检验可采用绘制PP图、QQ图进行观测,也可以采用假设检验的方法计算P值,是数据分析中的一个比较重要的步骤。统计学的中大部分参数检验均存在数据正态性假设的统计前提,不进行正态性检验就贸然选用参数统计的假设检验方法无疑进入了统计方法误用的误区。
2.2.6 数据建模中无模型评价,直接给出建模结果,导致建模参数表达没有依据 抽样中共有3篇文献建模,均未出现建模评价,同时应该注意的是,模型建立的好坏直接关系到数据建模的结果,是数据结果的基础,在文献中,基本都没有对统计模型建模评价的说明,是统计上的一个缺陷。
2.2.7 配对资料采用独立资料的检验方法 有些医学论文采用配对设计却误用了独立设计资料的t检验,配对t检验适用于配对设计的资料[12]。配对t检验的原理是对每对数据的差值做与0比较的单样本t检验,例如观察对象属于干预前后对比(治疗前后、检查前后等)和同体同源对比(同一观察对象两种干预方法)的两组资料,作统计学处理时应采用配对t检验,如果用组间独立样本检验,其更易获得本应没有意义的结论得到有意义的结论,范统计学上的第II类错误,特别是在显著性临界状态时更明显[。同时在进行配对检验时,除了描述配对样本的一般情况(如均数和标准差)、该出假设检验统计量和P值外,也应注意给出组间差值的均差及其95%可信区间,作为统计结论的重要依据。
讨论临床医生对统计学的掌握程度并不高,在科研统计学方法的选择上存在问题,让临床医生了解复杂统计理论存在一定的现实困难,笔者团队创建临床科研统计简易路径,方便研究者使用。研究者在使用时,只要通过了解该路径右侧的几个名词解释,就能正确选择统计方法,研究团队为各种统计方法制做了SPSS软件操作视频,供使用者学习,统计路径如图1所示。
图1临床科研统计学简易路径
同时,笔者团队将这一路径做成了超链接形式,使用者采用人机对话形式回答电脑给出的问题就可以找到正确的统计学方法。并针对临床研究人员对SPSS操作不熟练的特点,在相应的统计学方法中给出了一站式解决方案,具体为首先用Excel组织数据,然后将数据导入到SPSS中,通过执行我们所给出的SPSS语句就可以实现统计操作,减少研究者的软件操作过程,切实解决了研究者统计应用问题,此人机对话电脑系统能够成为临床医生的统计助手,人机对话软件如图2所示。
图2人机对话形式的统计学路径选择
提高医学期刊中论文的统计学质量是一项艰巨而又持久的系统工程,需要各界人士(作者、编辑、审稿者、读者、期刊管理者等)的共同努力[]。笔者只是对医学论文中常见统计学概念方面的误用情况做了简单的分析和总结,限于篇幅,不能详细概括出问题的全部。但有一点是很明确的,即作者只有提高认识,才能在医学研究中自觉地运用统计学原理进行医学资料的科学收集、整理和分析。本文通过分析总结近3年相关文献中统计学分析方法的应用情况进行了抽样调查和分析,分析常见的统计分析方法缺陷的原因,并开发了科研统计辅助工具以帮助医学科研工作者提高科研水平。重视数据在科研中的作用。这就需要从源头抓起,提高作者的统计学处理能力[]。
关注“医学科研管理空间”