Although it is of importance to scientific research, software has long been considered as a supporting service instead of a formal research product. In fact, scientists consume considerable time in developing software and they share their software with others. Sharing software reduces the barriers of software use and benefits the scientific community. Scientists want to demonstrate the academic value of their software for promotion and funding application. Therefore, a study of the academic impact of software is imperative. In this study, we propose a hybrid approach (called BWS approach) based on bootstrapping, word embedding, and support vector machine to extract software entities from full-text scientific publications. Then, we assess the academic impact of software entities extracted by BWS approach using usage- and reference-based metrics. Moreover, we analyze the important factors that influenced user’s behavior. The findings of this study will help us better understand the value of software and the contributions of their developers and help build an open, transparent, and inclusive scientific reward system. In addition, the results of this research will also foster more effective use of software and provide reference for identification and evaluation of other types of knowledge entities.
软件在科学研究的诸多方面发挥着重要作用,但是长久以来,它们仅被看作是支持科学研究的服务,而不是体现科学家价值的正式研究成果。事实上,很多科学家花费相当多时间在软件开发上,并且一些科学家将其软件免费共享。科学家希望通过证实软件的学术价值来帮助自己获得晋升机会和基金资助。因此,有必要对软件的学术影响力进行研究。本项目拟构建BWS系统,即基于自扩展、词向量和支持向量机的混合型软件实体自动抽取系统,从学术论文全文本数据中抽取出软件实体,并利用该系统从软件使用和引用角度对软件的学术影响力进行评价。此外,本项目还将研究影响用户软件引用行为的主要因素。研究结果有助于学术界深入认识软件的学术价值和软件开发者的科学贡献,为有关部门将软件纳入科研评价体系提供重要的决策依据,以期建立一个更为透明、开放、包容的科研评价体系。此外,研究结果也将有利于促进软件的有效利用,并为其他知识实体的识别和评价提供方法参考。
软件在科学研究中发挥着越来越重要的作用,但在目前由出版物驱动的科研评价体系中,软件常常被认为是科学研究的副成品,而不是体现科研人员价值的研究成果,其学术价值一直被低估甚至被忽略。学术界对软件学术价值的低估会导致科研人员有动力撰写好论文,却没有动力开发和共享好软件。这将造成软件的重复开发和科研资源的浪费,不利于资源的优化配置。为激励科研人员开发和共享软件,近年来欧美一些国家的科学资助机构和科研评价机构开始将软件认定为科研人员的有效研究成果。那么随之而来的问题是,如何量化评价软件的影响力。本项目不仅从学术论文全文数据中的软件使用、引用和扩散角度来揭示软件学术价值,还从科研人员角度来分析科学软件使用和引用行为的影响因素。主要研究内容包括:图书情报学领域的软件使用和引用研究;科学软件在学术交流系统中的扩散和影响力研究;科研人员的科学软件使用和引用行为影响因素研究;不同国家对科学软件的资助与贡献研究。研究发现:图书情报学研究对软件的依赖程度愈发显著,然而研究者在论文中提及和引用其所使用软件时表现出很大的随意性,软件引用缺失依然严重;起源于图书情报学领域的知识图谱工具在本领域扩散地最快也最广,与此同时,它们逐渐被其他研究领域采用,初期扩散速度较慢,后来扩散速度不断加快;国内知识图谱领域研究人员接受和使用新软件的速度在不断加快;我国大部分科研人员认为科学软件对自己的研究工作重要且经常使用科学软件,但他们却比国外同行更少地参与科学软件开发;近一半的科研人员因缺乏软件引用意识、不清楚软件引用格式、低估软件学术价值等原因而未在研究成果中正式引用科学软件;中国对世界科学科学软件的贡献远低于美国、德国和英国这些欧美国家;中国科学基金对科学软件开发的资助力度远低于欧美国家。这些研究结果对于我国科研评价体系的完善、科学资助结构的调整、学术规范内容的增补都有重要的参考价值和应用意义。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
基于SSVEP 直接脑控机器人方向和速度研究
小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究
学术大数据环境下的论文影响力与推荐研究
基于引用模式分析的学术影响力研究
非结构化数据中威胁本体构建、实体识别与关系抽取方法研究
藏文实体语义关系抽取理论与方法研究