您的当前位置:首页正文

情报学核心期刊论文摘要与文章篇幅的相关分析

来源:爱go旅游网
2009年11月 现代情报 Nov.,2009 第29卷第11期 Journal of Modem Informafion V01.29 N0.11 ・工作研究・ 情报学核心期刊论文摘要与文章篇幅的相关分析 段运 (湛江师范学院图书馆,广东湛江524048) [摘要】从“中国期刊全文数据库”中下载摘要为指示性摘要的情报学核心期刊论文474篇。统计这些论文的中文摘要的 字数与篇幅(字数)的关系。利用SPSS16.0软件分析两者之间的相关关系。结果表明,2008年情报学论文指示性摘要的平均字 数为126.7字,91.35%的摘要字数集中在51~200字的区间内。不同分类论文的统计回归模型表明,摘要字数随论文篇幅的变 化率为0.0154~0.0304;摘要字数(Y)与论文篇幅( 4)的统计回归方程为Y=39.572+O.0254X4,经检验,方程达显著水平。 根据回归方程,计算了置信度为1一a(a=0.05)时不同篇幅论文的摘要字数的置信区间。 [关键词]情报学核心期刊论文;论文篇幅;摘要字数;相关分析 [中图分类号]G255.2 [文献标识码]A (文章编号]1008—0821(2009)l1—0128—03 The Correlation Analysis Between Thesis Length and Abstract Word Number of the Information Science Core Journals Thesis Dnan Yun (Library,Zh iang Normal College,Zhanjiang 524048,China) [Abstract]474 Information Science Core Periodicals thesis were downloaded from“china joumal full—text database”. Analysis on relative between thews kngtl1 and abstract word number by SPSS16.0 showed that lnean abstract word number is 126.7.There is evident relative between thesis length and abstarct word number.Regression model showed that the variation of abstract word number was O.0154~O.0304 with thesis length.The regression equation Y 39.572+O.0254x4.test showed the equation had evidentleve1.Based on equation,eonfidenceinterval of abstractword numberWas calculatedwhen confidentwas1一 口(口=0.05). (Key words]informaiton¥cienc ̄COre joumal8 thesis;thesis length;abstract word number;relative analysis 摘要是论文内容不加注释和评论的简短陈述,是对全 的适宜字数也已基本确定[5l,但未见情报学学术论文中两者 文核心内容的总体概括…1。一篇高水平论文的摘要能反映 定量关系的报道。本文对2OO8年出版的474篇情报学核心期 出原文的内容实质,能帮助读者全面、有效地了解正文内 刊论文的摘要字数和篇幅进行了统计分析,试图建立两者之 容。高水平的学术期刊论文在具备高的学术水平的同时还 间的回归模型,为摘要的写作和编辑加工提供参考。 必须同时遵循国际科技出版标准,提供标准化文献【2J。摘 要是学术论文标准化的关键部分。编写摘要的目的一是节 1材料与方法 约读者查阅文献的时间,二是有利于科学地编撰文献检索 从《中国期刊全文数据库》中下载2008年出版的情报 工具,使读者快速地检索到文献。摘要编写形式可分为报 学科技论文,这些科技论文所在的期刊全部被《中文核心 道性摘要、指示性摘要和报道性/指示性摘要3种。有关研 期刊要目总览》(2008年版)列为核心期刊l6J。统计摘要字 究表明我国图书馆学情报学相关论文的不少摘要存在着各 数及论文篇幅(字数)。 种不妥之处【3I4J。很多论文摘要仅有几十字,影响了信息 的准确快速传播。论文摘要的适宜字数与论文的信息量和 1.1论文要求 篇幅有关,就某一论文而言,信息量已经确定,那么其摘要 参加统计的论文必须符合下列条件: 收稿日期:2009—06—19 作者简介:段运(1981一),女,助理馆员,研究方向:竞争情报,发表论文数篇。 一l28— 罢 l11yl期 成。 情报学核心期刊论文摘要与文章篇幅的相关分析 V0N1o.v29. N,20o0.91 1 ①论文由引言、正文、结论(结果与讨论)3部分组 7篇,占1.47%。字数为51~150字的摘要篇数最多,达 345篇,占总数的近72.78%。91.35%的摘要字数集中在51 ~②按照《中国图书馆分类法》分为G35类的论文[ 。 ③情报学论文摘要中指示性摘要占所有论文摘要的 74.09%[引。200字的区间内。中华人民共和国国家标准摘要编写规 则(G ̄446—86)在“详略度”一节中规定了摘要的字 故本文选择的论文均为带有指示性摘要的论 数-9J:指示性摘要一般以200字左右为宜。但从统计结果 可以看出,2008年情报学科技论文的摘要字数与GB6447— 1986的规定存在较大出入。存在的主要问题是摘要的字数 较少,提供给读者的信息不足。 文。 ④论文所在的期刊被《中文核心期刊要目总览》(2008 年版)列为核心期刊。 根据上述要求,共采集到符合条件的2008年出版的论 文474篇。 1.2统计方法 统计摘要字数(Y)和论文各部分字数的关系。从 《中国期刊全文数据库》中收集的论文全为Portable Docu. mcnt Format(PDF)格式的论文。将这些PDF格式的论文用 pd£2al1软件转到microsoft otifce word2003中去,通过该软件 工具栏中的“字数统计”工具统计文章各部分的字数。统 计过程中设定了4个自变量,1个因变量。分别为: 1一引言字数;X2一正文字数;盼一结论字数;X4一 论文的篇幅( 4= l+ 2+ 3) y一摘要字数 论文中表格按实际字数计算。用插图所占的版面比例 乘以该期刊标准版面的字数,折合出插图的字数。 1.3统计分析 《中国期刊全文数据库》中将情报学按内容分为情报学 及情报工作体制、组织,情报工作,情报事业3个大类。 按照分类,分别进行摘要字数与论文各部分字数的相关分 析;同样按照这个分类建立摘要字数(Y)与论文篇幅 (X4)的回归模型;然后按下式计算置信度为1一a时,不 同篇幅论文摘要的置信区间。 多一 < <多+ (1) =£要(n一2) 其中: 为置信度为1一口时的t统计量,n为样本 数,Q为样本均方差。 1.4统计工具 Spss软件(Statistical Package of the Social Science)即社 会科学统计软件包,是一套模块化的统计分析软件。常被 用来研究一个变量与另一个变量间的相互关系。本文采用 SPSS16.0统计软件来进行数据统计分析。 2结果与分析 2.1摘要的字数分布 以5O字为1个区间,各区间内摘要的数量见表1。可 见,小于100字的摘要占28.90%,大于300字的摘要只有 表1各字数区间摘要的篇数分布 摘要字数区域 摘要字数区域 薹 y ̄<50 0 0 251≤,,≤300 8 1.69 51≤,,≤1(30 137 28.90 301≤y ̄<350 3 O.63 101≤y≤150 208 43.88 351≤y ̄<400 0 0 151≤y ̄<200 88 18.57 401≤y ̄450 3 0.63 201≤y ̄<250 26 5.48 451≤y ̄<500 1 0.21 2.2不同类的论文摘要字数与论文篇幅的相关分析 按照《中国期刊全文数据库》对情报学的分类将被统 计的474篇科技论文分为3组,计算论文的各个部分的字 数与摘要字数的相关系数(表2)。 从表2可见,情报学及情报工作体制、组织;情报工 作;情报事业3类论文的篇幅 与摘要字数的相关系数均 达到显著水平。 表2各类论文摘要字数与论文篇幅的相关系数 根据表2,对不同组建立了摘要字数(y)与论文篇幅 (X4)的统计回归模型(表3)。 从表中可见,3类论文的样本数达40以上,回归方程 均达到显著水平。从这些回归方程可知,摘要字数随着文 章篇幅呈单调递增,其随论文篇幅的变化率为O.0154~ 0.o3o4,也即是说,论文每增加1 000字,摘要字数大约增 加15 3O字。 表3各类论文摘要宇数与论文篇幅的回归模型 内容分类 回归模型 ,值 n 情报学及情报工作体制、组织y=37.437+O.0154x4 8.453 164 情报工作 y=4o.372+0.0304x4 9.634 266 情报事业 Y=38.830+O.0248x4 13.239 44 2.3摘要字数置信区间的估计 利用统计所得的474篇论文的样本资料建立了情报学 ・--——129 --—— 2009年11月 现代情报 Journal ofModemInformation =Nov.。20o9 第29卷第11期 类科技论文篇幅与摘要字数的回归方程为: Y=39.572+O.0254X4 Vo1.29 No.11 39.572+0.0254x4,经检验方程达显著水平。在口=O.o5 (2) 时,论文篇幅为1 000,2 000,3 000,4 000,5 000,6 000, 方程的F=l2.231>Fo-0】,达极显著水平。 根据(1)和(2)式,在a=O.05时,论文篇幅为 1 000,2 000,3 000,4 000,5 000,6 000,7 000,8 000和 7 000,8 000和9 000-7-时,其摘要字数的置信区间分别为: 54—74,83—97,109~12l,136—146,159—173,183— 199,207~227,231—253和256 280字。 9 0oo字时,摘要字数的置信区间分别为:54—74,83—9r7, 109—121,l36—146,159—173,183~199,207—227,231 —参考文献 253和256~280字。科技论文的作者和科技期刊的编辑 [1]刘喜中,徐芳.图书馆学期-11学术论文撰写格式的规范和标准 化问题[J].图书馆论坛,2000,20(1):7—11. [2]郑晓南.美国科学信息研究所对完善IsI数据库选刊标准中有 工作者可作为参考。 3结论与建议 (1)2OO8年情报学核心期刊论文指示性摘要的平均字 关中国期刊文献收录方针的进展报告与建议[J].中国科技期 刊研究,2000,(1):8. 数为126.7字,91.35%的摘要的字数集中在51—200字的 区间内。这与2006年吴漂生统计出17种图书馆学、情报 学核心期刊论文摘要的平均字数为106字_8 J相比有了小幅 度的增长。但126.7字还明显低于GB6447—86中说明的 [3]杜也力.图书情报专业核心期刊论文摘要分析[J].图书馆 学、信息科学、资料工作,2002,(6):104—108. [4]吕联钟.图书馆学期刊文前摘要的编写方法[J].鹭江职业大 学学报,2001,(1):12一l6. [5]谢成英.学术性论文摘要的综合质量分析[J].情报学报, 1998,17(4):266—272. “指示性摘要一般以200字为宜”的标准。究其原因是论文 作者对摘要重要性的关注程度虽有提高但仍不够,对摘要 编写的方法没有熟练掌握导致的。 [6]戴龙基,蔡蓉华.中文核心期刊要目总览(2008年版)[M】. 北京:北京大学出版社。2008:185—202. (2)情报学的各类论文摘要字数与论文篇幅存在较明 显的线性相关关系,可以建立线性回归模型。从所建立的 模型可以很清楚地了解到,指示性摘要的字数是论文篇幅 [7]中国图书馆分类法编辑委员会.中国图书馆分类法(第4版) [M].北京:北京图书馆出版社,1999:1033—1035. [8]吴漂生.图书馆学、情报学核心期刊论文摘要分析[J].图书 馆建设,2006,(1):96—97. 的单调增函数,其随论文篇幅的变化率为0.0154—0.0304, 即论文每增加1000字,摘要字数增加15 30字。 (3)474篇论文的篇幅和摘要字数建立的回归方程为Y [9]国家标准局.GB6447—86摘要编写规则[S].北京:中国标 准出版社,1986:490. :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: (上接第127页) 标引数据严格规范,检索功能强大,检索结果具有权威性, 但文献数据收录相对狭窄。读者实际使用时可考虑在Ⅱ检 3结论 索的基础上,进一步进行Gs查询,扩大文献范围。 参考文献 通过GS与Ⅱ的查询对比可以得出如下结论: (1)GS数据中许多非英文文献本身带有英文的题录及 [1]朱佳鸣.GeegleScholar Beta检索性能的初步分析[J].图书情 报工作,2005,49(12):115,11. 摘要,Gs在标引时一般没有把其英文题录作为题录标引, 而只是在全文中可以查询到,部分能查询到英文标题的非 英文文献主要来自英文文献引文及来自英文平台上的译文; (2)标题名检索中,GS可以查出Ⅱ中88%的英文期 [2]陈家翠,谷玉荣.Google学术搜索检索性能的分析及评价 [J].情报理论与实践,2O07,30(5):74—78. [3]Kayvan Kousha and Mike 11ldwau,Google Scholar Citations and GooSe Web/Url Citations:A Multi—discipline Exploratory Analysis, Journal ofthe American Society for lnfommfion Science and Technology, 刊文献及57%的会议文献。Gs标题检索时需要在查询窗口 人工输入相关的派生词才能满意地查询到完整的结果,例 如通常情况下名词关键词要考虑其单复数; 2OO7,58(7):1055—1065. (3)El有自己独立的受控词或自由词字段,其中的一 些关键词不同于文献本身标题及文摘的词,全文查询时影 响了GS对Ⅱ中的文献检中率; [4]夏旭.基于Google学术搜索的引文检索研究[J].情报理论与 实践,2006,29(6):697—701. [5]John J.Meier and Thomas W.Conkling,GooSe Scholar’s Coverage of the EngineeringLiterature:An Empirical Study。The Journal ofAca— (4)GS可以部分代替Ⅱ进行文献查询,但相比二者 更多的是具有互补性。Gs数据来源广、免费检索,但实际 结果显示具有不确定性;E/来自各工程学科的核心文献, demic Librarianship,2008,34(3):196—201. 一13O一 

因篇幅问题不能全部显示,请点此查看更多更全内容