学术咨询服务正当时学报期刊咨询网是专业的学术咨询服务平台!
发布时间:2020-02-13 14:29所属平台:学报论文发表咨询网浏览: 次
摘要:文章以从GoogleDataset获取的93个国际图书馆学研究数据集为样本,对其外部特征进行计量与讨论,并遵循元分析法思想、利用文本挖掘工具对其内容特征进行定量和定性分析。研究发现,数据赋能的国际图书馆学形成现代图书馆事业管理LIS教育与信息素养培育
摘要:文章以从GoogleDataset获取的93个国际图书馆学研究数据集为样本,对其外部特征进行计量与讨论,并遵循元分析法思想、利用文本挖掘工具对其内容特征进行定量和定性分析。研究发现,数据赋能的国际图书馆学形成“现代图书馆事业管理”“LIS教育与信息素养培育”“研究数据管理与共享”“科学计量与替代计量学”“信息与科学技术应用”“开放科学与开放存取”等六大前沿议题;展现出理论与技术融合创新提供了新基础、研究数据管理与共享上升为新焦点、开放科学交流与合作成为发展新趋势等三个研究发展方向。
关键词:数据赋能;国际图书馆学;谷歌数据集;研究数据;研究前沿
图书馆员评职论文范文:图书馆事业在文化产业发展中的价值体现
【摘要】文化产业的发展建设作为现阶段我国所有建设事业中最为重要的一部分,其发展水平对我国综合国力的提升以及国民素质的提升有着至关重要的作用。图书馆事业作为文化产业发展过程中的技术后盾和资源支持,做好图书馆事业的管理工作才能更好地进行相关文化产业的建设。基于此,文章主要针对图书馆事业在文化产业发展中的价值体现进行探讨,希望能够为我国文化产业的未来发展提供一定帮助。
随着数据密集型科学发现发展成为第四研究范式,数据驱动型研究将进一步延伸至数据驱动型学术创新,如《图书馆杂志》数据出版管理平台开创了“数据论文、论文+数据支撑、论文+富媒体格式”的研究数据共享与出版模式。在数据科学时代,数据赋能(DataEmpowerment,DE)带来了学科范式的嬗变,对于正处于快速发展的图书馆学而言,可期以智慧化数据驱动范式推动面向科研的知识服务创新。与此同时,数据赋能也为识别、跟踪图书馆学研究前沿与发展趋势提供了新视角:研究数据作为科研成果的重要载体之一,蕴含着大量科学研究主题,准确地挖掘、分析隐含在图书馆学背后的研究数据主题及其演化脉络,可以帮助我们明晰学科发展动态与方向。基于此,本文拟以GoogleDataset收录的93份相关研究数据集为样本,统计分析其外部特征及内容特征,对国际图书馆学研究前沿和发展趋势作出研判。
1相关研究简评
本文选用中国知网以及ElsevierScienceDirect、EBSCOhost和GoogleScholar外文数据库作为检索工具,分别以Title=“图书馆学AND(热点OR前沿)”和“libraryscienceAND(hotspotORfrontier)”等作为检索词进行组配检索(检索时间:2019年5月4日),经剔除非学术性文章后共计获得相关中文文献102篇,外文文献25篇。从已有论文成果来看,国内外学者对图书馆学热点与前沿的研究包括以下维度:
(1)样本维度。研究样本主要以文献资料为主,包括期刊论文、学位论文、报告以及国家社科基金项目和课题指南等。如K.Dong等[1]就图书情报学(LIS)领域提出了从科学文献中识别和预测跨学科主题的综合方法;X.Xiao等[2]以10所LIS教育机构的CSSCI、SSCI索引论文作为研究对象;柯平[3]、朱明[4]等分析了国内外图书馆学的核心期刊论文和高被引论文;李维[5]、王君[6]等关注了硕博学位论文的视角;从这些方面探讨图书馆学研究热点和趋势。此外,亦有学者基于趋势报告(如“IFLATrendReport”)、国家社科基金项目及课题指南、研究生招生方向等对国内外图书馆学学科研究热点与前沿进行剖析[7-9]。
(2)方法维度。总体而言,采用科学的研究方法的目的是为了对研究样本及其内容进行客观解析,以便得出更加精确的结果。文献计量法(如以HistCite统计作者、关键词频次)、内容分析法(如通过高被引、热点论文探寻热点主题)是最为常用的研究方法,除此之外亦包括引文分析法、共词聚类分析法、社会网络分析法、可视化分析方法(如使用CiteSpace、VOSviewer等工具绘制知识图谱,直观推演热点与前沿)等研究方法。
(3)内容维度。相关研究主要关注文献资料的外部特征和内容特征:外部特征主要为刊源、载文量、年份、区域、作者、机构、支持基金、影响因子、下载和被引频次等;内容特征则主要涉及关键词词频分析、主题演化分析等,如J.Hodonu-Wusu和Lazarus[10]通过关键词计量分析证明,学术图书馆(AcademicLibrary)、信息素养(InformationLiteracy)、文献计量学(Bibliometric)、引文分析(CitationAnalysis)、开放存取(OpenAccess)等相结合的主题将是未来图书馆学相关领域的研究趋势。
可以看出,国内外图书情报界学者从未停止对学科热点与前沿的认知规律探索和解析,产出了丰硕的研究成果,指引着学科研究与实践的发展。从研究样本、方法和内容维度而言,前人研究成果较为全面,更不乏立言立说之努力。然而针对最原始的、第一手的研究数据这一具有较高价值和内涵的信息源,仍没有得到广泛认识,基于多源数据的领域前沿识别方法应用亦有待强化。而数据赋予图书馆学发展以“动能”,数据赋能的国际图书馆学研究前沿与发展趋势识别正是本研究的价值和意义所在。
2数据来源及研究方法
2.1数据来源
2018年9月,谷歌推出了一个存有海量研究数据的开放数据生态系统(OpenDataEcosystem)及其搜索引擎——GoogleDatasetSearch,它使用开放标准schema.org、W3CDCAT、JSON-LD等进行数据标识,旨在实现研究人员与研究数据的智能连接,实现数据的知识图谱(GoogleKnowledgeGraph)协调与智能排序、检索,从而促进数据重用和科学研究的推陈出新。GoogleDataset收割了HarvardDataverse、Figshare等众多出版平台的数据集,存储的研究数据较为全面,具有一定的代表性。本文以其为数据源,检索主题为“libraryscience”,检索与统计时间为2019年5月1至2019年5月10日,初次检索得到数据集246个。进一步经内容分析、人工筛选得到实际有效数据集93个,作为研究样本。
2.2研究方法
前沿研究必须树立问题导向、运用科学的方法和工具、经过科学的研究过程[12]。从数据赋能的角度看,图书馆学前沿研究本质上是一种数据内容解析过程。因此,本文主要采用两种研究方法:计量分析法和元分析法(Meta-Analysis)。首先,对特定的数据集显著属性(如名称和描述、空间和时间覆盖、出处信息等)逐一进行计量统计,并分析数据赋能的国际图书馆学外部特征;其次,揆诸元分析法思想的精要,使用文本挖掘工具深入“数据内容”这一知识单元,进行定量与定性分析,总体遵循元分析法“提出问题→收集资料→筛选资料→提取信息→计算数据→检验分析→结果解释”的流程,归纳研究前沿及发展趋势。
3数据赋能的国际图书馆学研究外部特征统计与分析
3.1数据集时间特征分析
对国际图书馆学研究数据集时间分布特征进行分析可知:(1)数据集最早可追溯至1951年美国国家海洋与大气管理局(NationalOceanicandAtmosphericAdministration,NOAA)发布的《国外数据图书馆》(ForeignDataLibrary)[13],此数据提供了NOAA中央图书馆的馆藏资源情况;(2)数据集高度集中分布的时间区间为2007-2019年,这与近10余年来从知识范式到数据范式的数据科学发展时间历程基本吻合;(3)2014年以后,国际图书馆学主题研究数据量呈线性高速增长趋势,一定程度上反映出国际图书馆学“数据管理”发展的蓬勃之势。
3.2数据集提供者特征分析
统计93个国际图书馆学研究数据集的提供者(机构层面)信息共计涉及54个提供者。依据提供数据量≥2个的标准,可以看出:首先,科研教育机构的项目负责人(PrincipalInvestigator,PI)、联系人(PointofContact,PC)等扮演了重要角色,PI和PC等发布的数据集主要为“LibraryHoldingsforEX”系列,此系列数据集主要为数据管理计划(DataManagementPlan,DMP)、科学快速预览报告等图书馆目录数据[14];其次,HarvardDataverse、Figshare和Zenodo等科学数据开放存取(OpenAccess,OA)出版平台提供的数据集占有较大比重,这些出版平台尤为重视数据生命周期视角下的科学数据OA出版,数据集内容主要包括OA、LIS研究以及研究数据管理与共享的政策、需求和实践等。
3.3数据集作者特征分析
对国际图书馆学研究数据集提交作者信息进行分析,共计包含59位参与作者。其中,英国城市大学(City,UniversityofLondon)的E.Priego和美国高校政治与社会研究联盟(Inter-UniversityConsortiumforPoliticalandSocialResearch,ICPSR)的R.C.Schonfeld参与度最高,前者研究方向包括科学计量学(Scientometrics)和替代计量学(Altmetrics),研究对象包括图书馆学期刊和推特档案(TwitterArchive)等产生的数据[15-16];后者主要组织了“IthakaS+R”系列调查,为科研教育机构、图书馆等的战略咨询和决策支持服务提供相关数据[17]。此外,来自ICPSR的C.Wolff、A.M.Pienta、J.Lyle和来自Figshare的K.Holmberg等人的数据集上传频次均为2次以上。
3.4数据集覆盖范围特征分析
对列出数据覆盖范围(国家/地区分布)的国际图书馆学研究数据集进行统计分析发现:(1)北美参与度较高,其中尤以美国和加拿大为主。一是缘于GoogleDataset成立于美国,主要为欧美科研人员所使用;二是缘于美国与加拿大在学科体系与工作实践中重视图书馆学、情报学与相关信息学科;(2)以英国为主的欧洲国家次之。这与欧盟国家制定的科学数据管理保障与驱动政策有关,如欧盟《通用数据保护条例》(GeneralDataProtectionRegulation,GDPR)、欧盟研究与创新指导委员会《OA2020计划行动纲要》、FAIR《科学数据管理指导性原则》等。
3.5数据集资助者特征分析
93个国际图书馆学研究数据集中仅有6项受到资助,资助者涵盖美国、奥地利的6个机构,包括美国莉拉·华莱士(LilaWallace)读者文摘基金会(3项)、美国卫生与公众服务部(2项)、美国国会图书馆国家数字信息基础设施保存计划(NDIIPP)项目(2项)、美国国家医学图书馆(2项)、美国国立卫生研究院(2项)以及奥地利科学基金会(1项),主要资助推动公共图书馆成年人文化项目发展、社会科学中的数据共享等研究[18-19]。
3.6数据集许可协议特征分析
遵循创作许可(CC)等知识共享协议提供的豁免与规范,能够保护使用或重新分发数据作者作品的科研人员免受版权侵权的关注,同时保护数据拥有者的权利[20]。统计发现,共计48个数据集明确遵循知识共享许可协议(CCBY4.0、CC0等)和ICPSR使用条款(TermsofUseforICPSR)等8项约束型许可协议,有1个数据集表明版权状态处于公共领域,遵循开放型许可协议“公共领域标记1.0”(PublicdomainMark1.0)。可见,国际图书馆学研究数据集较为重视规范研究数据共享过程中的知识产权保护。
3.7数据集下载格式特征分析
国际图书馆学研究数据集常见的下载格式较多,共计有24个数据集注明了下载格式,并提供25种格式在内的数据下载方式,相关数据集可供下载的格式较为丰富。其中,大多数数据集支持pdf、csv、stata、spss和delimited等一系列下载格式,这些下载格式可便于作者进行科学研究过程及结果的二次验证和重用研究数据。另外,部分数据集提供了基于数字对象标识符(DigitalObjectIdentifier,DOI)的唯一永久标识、引用方式,以此推动数据可发现、可访问、可互操作和可重用[21]。
4数据赋能的国际图书馆学研究前沿与展望
主题词能够从很大程度上反映出学科研究热点与前沿。研究热点部分源于研究前沿,研究前沿发展到一定阶段,往往可能演化、析出为下一段时期的研究热点,如苏福和柯平[22]的研究表明:国际图书情报学研究前沿呈现的特点为运用LIS方法研究跨学科领域的对象。由于GoogleDataset并未标识数据集关键词,因此,可利用文本挖掘工具ROSTCM6以及Python的Jieba、Wordcloud等模块库对数据说明字段(Illustration)进行高频词统计、清洗和可视化分析,有效地展现了出国际图书馆学研究数据集的主题特征。此外,借鉴元分析法的基本思想深入“数据内容”这一知识单元,赋予93个国际图书馆学研究数据集以相关主题并进行定量分析,最后结合高频词的可视化和主题分类,选定数据赋能的国际图书馆学研究前沿,并对其发展趋势作出展望。
5结语
本文提出了一种通过数据赋能视角揭示国际图书馆学研究的外部特征、研究前沿和发展趋势的方法,通过文献计量和可视化分析得出以下结论:
(1)从外部特征来看,数据集集中分布于2007-2019年,2014年以后研究量高速增长;科研教育机构的PI、PC以及科学数据开放存取出版平台等是数据集的主要提供者;数据集高参与度作者主要是来自英国城市大学、ICPSR和Figshare的E.Priego、R.C.Schonfeld等;数据集地区分布不均衡,主要集中于欧美的美国、加拿大、英国等;受资助数据集占比较小,资助者包括美国、奥地利的6个机构;学者及机构较为重视通过约束型、开放型许可协议规范研究数据共享与利用;数据集格式较为丰富,便于作者进行科学研究过程及结果的二次验证和重用研究数据。
(2)从研究前沿和发展趋势来看,信息与数据业已成为国际图书馆学研究的核心,近年来持续研究的前沿热点包括图书馆事业管理、LIS教育与信息素养培育、研究数据管理与共享、科学计量与替代计量学、信息与科学技术应用、开放科学与开放存取等;研究发展趋势为:理论与技术融合创新提供了新基础,研究数据管理与共享上升为新焦点,开放科学交流与合作成为发展新趋势和重点。
当然,本研究难免存在局限性。一是通过研究数据集虽可以判定出研究结论,但无法识别出数据作者的具体观点,这给前沿与发展趋势的研判带来了一定的障碍,在研究过程中,笔者试图结合研究数据集的对应研究论文来校正作者核心观点,但因关联论文部分缺失,对前沿与发展趋势的研判可能缺乏更为多元的材料佐证;二是因GoogleDataset仅展现内容与结构生成的内生指标,所提供的研究数据集无法展现引文关系,故无法使用外生指标探究本学科研究数据的传播规律。这些将是未来值得我们深入研究和拓展的重点。
参考文献:
[1]DongK,XuH,LuoR,etal.Anintegratedmethodforinterdisciplinarytopicidentificationandprediction:acasestudyoninformationscienceandlibraryscience[J].Scientometrics,2018,115(2):849-868.
[2]XiaoX,ZhangF,LiJ.LibraryandinformationscienceresearchinChina—asurveybasedanalysisof10LISeducationalinstitutes[J].Journalofacademiclibrarianship,2015:41(3):330-340.
[3]柯平,陈信,宋家梅,等.2013年国外图书馆学研究前沿与热点分析[J].图书情报知识,2014,161(5):17-29.
[4]朱明,谢梦晴,刘宇.近十年国内图书馆学研究热点述评:基于高被引论文的计量分析[J].高校图书馆工作,2019,39(1):5-10,54.
[5]李维,文庭孝.我国近10年图书馆学硕士学位论文研究热点分析[J].图书馆学研究,2015(16):2-8,31.
[6]王君,刘竟,卢章平,等.我国图书馆学硕博士学位论文研究热点可视化分析[J].图书情报工作,2010,54(19):28-31.
[7]柯平,邹金汇.2014-2015年国外图书馆学研究前沿之一——《IFLAJournal》综述分析[J].图书馆理论与实践,2016(11):1-8.
[8]郜正亚.我国图书馆学学科研究热点分析——基于2011年国家社科基金项目及课题指南的统计[J].图书馆工作与研究,2012(5):8-12.
转载请注明来源。原文地址:http://www.xuebaoqk.com/xblw/5007.html
《数据赋能的国际图书馆学研究特征与前沿展望》