热门问题
时间线
聊天
视角
元科学
来自维基百科,自由的百科全书
Remove ads
元科学或元研究也被誉为“关于研究的研究”或“研究科学的科学”,是用科学方法研究科学的学科,旨在提高科学研究的质量和效率。元科学关注所有领域,试图改进所有的研究方法。[1]如约翰·约阿尼迪斯(John Ioannidis)所说:“科学是人类最伟大的成就……但我们还能做得更好。”[2]
1966年,一篇早期的元研究论文考察了10份著名医学期刊上发表的295篇论文所用的统计学方法,发现“在73%的报告中……结论所依据的理由压根是无效的。”元研究在接下来几十年里发现了许多科研方法上的缺陷、低效及不良做法。医学和文科(软科学)领域的许多科学研究都无法得到复现,2010年代初诞生的术语“可复现性危机”即代表了人们对这一问题的关注。[3]
元科学揭示的问题已经有了一些应对的措施,比如对科学研究和临床试验实施事先登记制、成立CONSORT和EQUATOR网络等组织,发布通用的方法和报告指南。也有个人和组织一直致力于减少统计误用、消除来自学术界的不当激励、改善同行评审流程、系统收集学术出版系统的数据、[4]打击科学文献中的偏见,以提高科学过程的整体质量和效率。
Remove ads
历史

1966年,一篇早期的元研究论文考察了10份著名医学期刊上发表的295篇论文所用的统计学方法,发现“在73%的报告中……结论所依据的理由压根是无效的。”[6]2005年,约翰·约阿尼迪斯(John Ioannidis)发表了《为什么大多数发表的研究结论是错误的》,认为医学领域的大多数论文得出的结论都不可靠。[5]这篇论文后来成为PLOS中下载量最大的论文,[7][8]一般认为确立了元科学这门学科。[9]在与Jeremy Howick和Despina Koletsi合作的相关研究中,约阿尼迪斯指出,只有少数医疗措施通过GRADE系统得到了“高质量”证据的支持。[10]后来的元研究发现,在心理学和医学在内的许多科学领域,普遍存在复现研究结果的困难,这个问题也被称作“可复现性危机”。元科学的发展是对可复现性危机的回应,也是对研究中浪费现象的关注。[11]
许多知名出版商都乐于元研究和提高出版物质量。《科学》《柳叶刀》《自然》等顶级期刊都对元研究和可复现性问题进行了持续报道。[12]2012年,PLOS ONE发起了“可复现性倡议”;2015年,现代生物出版集团在4种刊物中引入了一个最低报告标准的检查表。
元研究这一广泛领域的第一次国际会议是2015年于爱丁堡举行的Research Waste/EQUATOR会议;第一次关于同行评审的国际会议是1989年举办的同行评审大会。[13]2016年,《研究诚信和同行评议》创刊,开篇社论呼吁“有关同行评审、研究报告以及研究和出版道德的问题,提高我们的理解并提出潜在解决方案的研究”。[14]
Remove ads
元研究的领域和主题

元科学主要关注5类领域:方法、报告、可复现性、评估和激励。[1]
元科学旨在识别不良的研究行为,如研究中的偏见、统计误用等等,并试图找到减少这些行为的方法。[1]元研究已经发现了科学文献中的许多偏见。[15]特别值得注意的是,科学研究普遍存在着对P值的误用和对统计意义的滥用。[16]
科学数据科学利用数据科学来分析已发布的论文,包含了定性研究和定量研究。科学数据科学研究包括欺诈检测[17]和引用网络分析。[18]
期刊学也称出版科学,是对学术出版过程中的所有方面的学术研究。[19][20]这一领域试图在学术出版过程中实施循证实践,来提高学术研究的质量。[21]“期刊学”由《英国医学杂志》前总编辑史蒂芬·洛克(Stephen Lock)提出。1989年在伊利诺伊州芝加哥召开的第一届同行评审大会标志着期刊学成为一个独立的领域。[21]期刊学一直试图推动科研领域的事先登记,特别是在临床试验方面。现在大多数国家都要求进行临床试验登记。[21]
元研究发现,在研究的报告、解释、传播和普及方面往往存在不良做法,特别是在社会科学和健康科学领域尤为严重。不良的报告使人们难以准确解释科研成果、难以复现研究、难以识别作者可能存在的偏见和利益立场。常用的解决措施如实施报告标准、提高科研透明度等。参照报告机构(如CONSORT和更大的EQUATOR网络)指定的指南,可以规范报告所用的数据和方法。[1]

可复现性危机是一种持续的方法论危机,人们发现许多科学研究难以或无法复现。[22][23]它源于20世纪中后期的元研究,但“可复现性危机”这个术语要到2010年代初才出现[24],反映了人们对这一问题日益增长的认识。[1]可复现性危机尤其影响到心理学(尤其是社会心理学)和医学,[25][26]包括癌症研究。[27][28]复现是科学过程的重要组成部分,因此复现的普遍失败会使受影响领域的可靠性遭到质疑。[29]
此外,一般都认为复现研究的影响力不如原创研究,在很多领域都难以发表。这大大阻碍了对研究的报到,甚至阻碍了对研究进行复现的尝试。[30][31]
元科学试图为同行评审建立一个完整的科学基础。元研究会对同行评审系统进行评估,包括发表前后及公开的同行评审。它也试图找到更好的研究资助标准。[1]
元科学试图通过更好的激励系统促进研究的进步,如探索对研究工作和研究人员进行排名和评估的不同方法的准确性、有效性、成本及效益。[1]批评者认为,不正当的激励措施给学术界塑造了“不发文章就会死”的环境,催生了大批垃圾科学、低质量研究和虚假结果。[32][33]比如,Brian Nosek认为,“我们面临的问题是,激励制度几乎完全集中在‘让研究发表’上,而不是‘让研究正确、可信’。”[34]支持改革者试图构建激励体系,以提高科研结果的质量。[35]例如,根据专家的叙述性评价(“而不是[仅仅或主要]靠各种指数”)、机构评价标准、保证透明度和专业标准来评判质量。[36]
- 贡献度
研究提出了机器可读的标准和(一种)用于科学出版管理系统的数字徽章,其侧重于贡献者的身份:谁对研究劳动做出了什么样的贡献和多少贡献,而传统学术署名则强调谁以任何方式参与了出版物的创作。[37][38][39][40]一项研究指出了与持续忽视贡献度有关的问题:“由于作者名单越来越长,论文却越来越短,发表数量还在激增,所以出版物数量已经不再是一个好的衡量标准。”[41]
- 评估因素
除了文章本身的优点外,其他因素也会大大影响同行评审员的评价。[42]但这些因素也可能很重要,例如使用关于研究者先前出版物的真实性,及其与公共利益一致性的记录。然而,同行评审等现行评价体系可能在很大程度上缺乏合理的机制和标准,它们多以引用数、Altmetric等为指标。这些数据确实可以反映文章的影响力,但没有考虑对现实世界的积极影响、进步性和公共用途。[43][44]反思学术激励机制的结论是,“为数据等中间产品提供更正式的认可”可能会产生可观的积极影响。[45]
- 对培训的认可度
有评论指出,学术排名并不考虑各自的研究者在哪里(国家或研究机构)接受培训。[46]
Remove ads
科学计量学关注科学出版物中文献数据的测量。主要的研究问题包括对研究论文和学术期刊影响力的测量、对科学引文的理解,以及在已知的政策和管理背景下应用测量方法。[47]研究表明,“用于衡量学术成功度的指标,如出版物数量、引文数量和影响因子之类,几十年来都没有变化”,而且在某种程度上“不再是”好的衡量标准,[41]导致了诸如“生产过剩、非必要碎片化、过度销售、掠夺性期刊、巧妙剽窃、故意混淆科学成果”等等乱象。[48]
这一领域的新工具有量化被引节点对引文节点的影响程度的系统。[49]这可用于将未加权的引文网络转换为加权网络,并用于重要性评估,得出“对所涉的各种实体(如出版物、作者等)的影响度量”[50],并用于搜索引擎和推荐系统等工具。
科学资助和科学管理也可以通过元科学得到探索和了解。[51]
另见
参考文献
阅读更多
外部链接
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads