第一文秘网    > 活动总结

规范科技名词在学术文献中的使用调查

作者:jnscsh   时间:2022-02-14 08:40:21   浏览次数:

摘 要:为了解规范科学技术名词在科技文献中的使用情况,文章使用全国科学技术名词审定委员会审定公布的英译和汉语科技名词在国家科技图书文献中心网络服务系统中进行了文献检索统计。检索结果表明英译规范名词在不同的文献类型和学科中的使用有较大的差异;汉语科技名词的检索结果从科技文献使用的角度说明了规范名词遴选的科学性和权威性。文章还对《地理学名词》中不同形式的名词在科技文献中的使用情况进行了文献检索统计。

关键词:科技名词,数据库,科技文献,文献检索,检索统计

中图分类号:N04;N8 文献标识码:A 文章编码:1673-8578(2012)04-0007-05

收稿日期:2012-05-15

作者简介:甄伟(1959—),女,北京人,国家科学图书馆副研究馆员,研究方向为文献数据库和知识组织工具建设。通信方式:zhenw@mail.las.ac.cn。引 言 经全国科学技术名词审定委员会(以下简称全国科技名词委)审定公布的科学技术名词(以下简称公布名词)已在全国推广使用了多年,为了了解规范科技名词在学术文献中的使用情况,笔者在《全国科学技术名词审定委员会公布名词》2.0光碟版以及第二版《地理学名词》中抽取部分公布名词,在国家科技图书文献中心(National Science and Technology Library,以下简称NSTL)网络服务系统中进行了文献检索,并对结果进行了简要的统计分析,以期通过检索结果说明公布名词在科技文献中的使用情况。

一 公布名词的学科等级结构

及编排方式 全国科学技术名词审定委员会于1985年经国务院批准成立,是经国务院授权,代表国家进行科技名词审定、公布的权威性机构,经全国自然科学名词审定委员会审定公布的名词具有权威性和约束力。目前已公布了天文学、物理学、生物化学、电子学、农学、医学等近百种规范名词,这些规范名词的陆续公布出版,对科研、教学和学术交流起到了很好的作用,为我国科技名词统一工作奠定了基础[1]。

1.公布名词的学科等级结构

在较早出版的印本公布名词中设有多级学科结构,如1991年出版的《化学名词》具有四级学科层级结构,以化学与光谱分析之间的关系为例:一级为化学,二级为分析化学,三级为仪器分析,四级为光谱分析。

近年出版的印本以及光碟版公布名词学科的层级结构有所调整,多数具有三级结构,其中的二级学科设置更为细致,如2006年修订出版的《地理学名词》分为总论、自然地理学、地貌学等30个二级学科领域,而在第一版中只有21个。

2.公布名词编排方式

在较早版本的公布名词中,中文名词按学科相关概念体系排列,并附与该词概念对应的英文名。对某些新词和概念易混淆的词给出简明性的注释,主要异名列在注释栏内,“又称”为不推荐用名,名词中[ ]部分的内容表示可以省略[2]。近年出版的印本《公布名词》,其编排方式大体与早年相同,不同的是,新版为每个汉文名都附有相应的定义或注释[3]。

在2010年出版的光碟版(2.0版)公布名词中,收录了截至2010年9月公布的80册规范科技名词,包含25万余条目[4]。在光碟版中,没有按照印刷版的各册学科领域组织词汇,所有的名词在一个数据库中管理。一个条目的内容包括:术语、英语等价术语、汉文相关术语、术语所属学科体系、子学科、注释等。检索方式分为“首词”“包含”“精确”三种,英文术语检索结果以字母顺序排序。对涉及多个学科的名词,将其在各学科中的规范名称全部列出,极大地方便了用户的使用。光碟版检索结果显示界面见图1:

二 应用NSTL网络服务系统对

公布名词进行文献检索 1.国家科技图书文献中心

国家科技图书文献中心(NSTL)是根据国务院领导批示于2000年组建的一个虚拟的科技文献信息服务机构,成员单位包括中国科学院国家科学图书馆、工程技术图书馆(中国科学技术信息研究所、机械工业信息研究院、冶金工业信息标准研究院、中国化工信息中心)、中国农业科学院图书馆、中国医学科学院图书馆,网上共建单位包括中国标准化研究院和中国计量科学研究院,采集、收藏和开发理、工、农、医各学科领域的科技文献资源[5]。目前,NSTL已成为国家科技文献信息资源的保障基地、国家科技文献信息服务的集成枢纽和国家科技文献信息服务发展的支持中心[6]。

NSTL收藏的中、外文科技文献包括科技期刊、学位论文、科技报告、专利文献等,数据库中可供读者使用的文献包括全文、文摘数据等,截止到2012年2月数据量已近8600万条,详细情况如表1所列:

2.英译科技术语的检索统计

笔者使用《全国科学技术名词审定委员会公布名词》中的英译科技术语于2011年对NSTL数据库进行文献检索,在各类检索文献中,以英文科技文献为主,也包括俄文、日文以及中文等非英文文献,数据库对于上述文献的描述包括英文篇名、作者、关键词以及文摘等信息,这为多角度检验公布名词与文献数据库的检索点契合与否提供了一个良好的平台。

(1)使用的素材和抽词方法

英译术语抽词使用2010年由高等教育出版社发行的《全国科学技术名词审定委员会公布名词》2.0光碟版数据作为基本素材,光碟的数据库中涵盖了全国科技名词委已审定公布的最新版各学科规范名词25万余条目。

光碟版不提供学科浏览,只能在检索栏输入词汇进行检索。为了保证检索使用词汇抽取的均衡,本次测试抽词方法如下:分别用26个字母在光碟中进行词汇的首字母检索,在每个字母的检索结果中以等距抽样的方式抽取词汇,再用抽出的词汇在NSTL网络服务系统中检索,检索的范围为“所有文献类型数据库”,检索点为题名、关键词、文摘等入口字段。

(2)检索结果统计

1) 基本情况统计

共抽取英译术语713个进行文献检索,覆盖27个学科领域。其中检索量大于1万条的词汇有21个,占抽取词汇量的2.95%;检出文献的名词570个,占79.94%;检索结果为零的名词有122个,占17.11%。有些术语比较通用或跨学科较多,其检出文献数量很大,如:术语“Heat”检出文献132.4万条,“Radiation”检出文献59.7万条。如果不将文献检出量大于1万条的术语纳入统计范围,在本次统计中,平均每个术语检出文献量为1061.3条。从统计结果看,应用领域广泛的术语检出量大,没有检出文献的术语多为学科分支细、字符较长的词汇。

2) 各类文献检出量

在各种文献类型的检索结果中,西文期刊检出文献量最大,约占总文献检出量的45%;其次为专利文献,约占24%,见表2:

3) 各学科文献检出量

在各学科中,如果以平均检出文献量计算,化学类文献检出量最高,资源学最低,这与学科自身的发展历史不无关系。各学科名词平均检出文献量如图2所示。

图2 各学科名词平均检出文献量

3.汉语科技术语抽词检索统计

笔者使用科学出版社2006年出版的第二版《地理学名词》于2012年初对NSTL数据库中的中文文献进行了检索,检索的文献类型包括中文期刊、学位论文、标准文献、会议文献和专利文献。

(1)二级和三级词汇对照检索

1) 检索用词的抽取方法

第二版《地理学名词》收录术语4089条,学科层级为三级结构,全书分为30个部分,各部分收录的三级学科名词数量不等。在二级学科中,除“地理学总论”和“社会与文化地理学”之外,其余28个学科范畴名称均为公布的规范术语,这28个规范术语作为本次检索使用的二级词汇。三级学科检索使用的名词则以等距抽样方法,在每个分支学科中抽取3个名词。

2) 检索结果统计

二级学科平均每个名词文献检出量为2467.2条;三级术语平均每个名词的文献检出量为3690.6条。

统计结果显示,三级学科名词的文献检出量要高于二级学科名词,这与NSTL数据库以揭示学术论文、专利和标准等原始文献为主有关,此类文献主要论述和记录某一专业的研究成果,所记载的知识和信息比较新颖、具体、详尽[7]。在二级学科名词中,“地球信息科学”一词的文献检出量最高,为27 456条,这与该学科在近年来的迅速发展和广泛应用有关;检索量较低的为“化学地理学”和“资源地理学”,检索文献量分别为6条和5条。

(2)规范名称和异名的对照检索

1) 检索用词的抽取方法

《地理学名词》中,除了汉语推荐使用的规范名称外,同时也收录了一部分术语的主要异名,以“又称”标记,如“任向河”又称“偶向河”,“残积物”又称“残积层”。“又称”一般为“不推荐用名”。本文抽取了38个带有异名的术语,将其规范名称与异名进行对照检索,用以调查推荐与非推荐名词的使用情况。

2) 检索结果统计

38个规范名称的检索结果共计84 378条,平均每个名词的文献检出量为2220.5条,与之对应的异名检索结果共计23 319条,平均每个名词的文献检出量为613.7条,由此可以看出,规范名词的使用程度远高于异名,这充分证明了公布名词遴选的科学性及权威性。

但在一些术语中,有异名检出文献量大于规范名词检出量的情况,这种情况表明,一些异名目前在科研生产活动中仍有广泛的

(3)缩略和全称规范名称对照检索

1) 检索用词的抽取方法

在《地理学名词》中,一部分汉语推荐使用规范名称是术语的简略形式以及全称形式,二者均为规范术语,如“铁质化[作用]”“复合[型]阶地”,其中方括号中的文字是可以省略的部分。本次测试,抽取了36个带有简称和全称的术语,将其简称和全称分别进行文献检索。

2) 检索结果统计

36个简称检索结果共计221 492条,平均每个名词文献检出量为6152.6条,与之对应的全称检索结果共计14 292条,平均每个名词文献检出量为397条。检索结果表明,简称的使用程度远高于全称,部分原因与简化后的名词比全称更为通用有关。

以“[土]变种”一词为例。全称“土变种”一词,只被地理学名词收录,其在土壤地理学中的定义为:依据耕作层或表层性状的某些差异划分的“土种的续分级别”;简称“变种”在公布名词中被土壤学、动物学、遗传学、植物学等学科收录,使用全称“土变种”一词的检索结果为零,而使用简称“变种”的检索结果为11 803条,其中336条与土壤学有关,约占总检索量的2.84%。

3) “海面”与“海平面”检索统计

在《地理学名词》中,收有“海[平]面”一词,“海面”为简称,“海平面”为全称。在36组检索词中,带有“海[平]面”文字的术语有6个,其中“海[平]面变化”“全球性海[平]面变化”“相对海[平]面变化”三组,全称的文献检索量均大于简称。见表4:

在Google [8]和百度 [9]中分别用两个词汇的搜索,“海面”一词得到的结果大大高于“海平面”,而在国内知名的以收录学术文献为主的知识信息资源网站[10-11]进行检索,“海平面”一词得到的结果则高于“海面”,详细情况见表5:

以上两项检索统计数字说明,比较口语化的“海面”一词,在大众化的搜索网站上的检索结果远远高于“海平面”;而“海平面”一词,则因其更接近书面语言,在学术文献中有着广泛而深厚的语言学基础,其使用频率要高于“海面”一词。

三 结 语 在英译科技术语的检索结果中,比较通用或跨学科的词汇文献检出数量很大,而涉及新兴和分支较细的学科领域文献检出量较少。英译科技术语在原版科技期刊以及国外专利数据库中有较高的文献检出量,表明公布名词的推广使用会在国际间的学术交流与合作层面起重要作用,公布名词也会成为国内知识组织领域英汉互译规范术语的主要来源之一。

汉语科技术语在中文文献中的检索结果,从文献检索角度证明了公布名词的科学性和权威性,也说明公布名词得到了广泛的推广和使用。规范名称与异名、全称与缩略语的对照检索出现了与预期相反的结果,表明了术语学研究的复杂性,需要在今后的术语遴选中加以重视。

参 考 文 献

[1][EB/OL].[2012-03-10]. /view/463756.htm#2.

[8][EB/OL]. [2012-05-09]..hk/.

[9][EB/OL]. [2012-05-09]./.

[10][EB/OL]. [2012-05-09].http://scholar.cnki.net/result.aspx.

[11][EB/OL]. [2012-05-09].http://159.226.100.28/Visitnew.asp.

--------------------------------------------------------------------------------

推荐访问:名词 文献 学术 规范 调查