工 作 简 报
中文新闻信息技术标准研制课题办公室编 第10期 2005年10月18日
编者按:
“中文新闻信息技术标准研制”课题作为国家“十五”重大科技专项课题,其目的是形成适用于新闻行业的有重大意义的国家标准。因此,按照国家标准审查的严格要求,两个分课题组积极开展了对课题成果的测试和验证工作,并分别在归口标委会的标准审查会上进行了汇报和演示。“中文新闻信息置标语言”在全国新闻技术工作者联合会的组织下,由多家新闻机构的测试专家对标准的不同环节进行了一万多条稿件的联合测试,并提交了测试报告。“中文新闻信息分类与代码”通过对四万多条数据的分类编目测试,在测试的基础上进一步完善了标准。本期简报是对课题组标准测试工作的专题汇报。
☆☆☆ “中文新闻信息置标语言”标准 ☆☆☆
“中文新闻信息置标语言”标准课题组从6月份开始与多家合作方或新闻单位签订了标准测试验证合作协议。并在9月份完成了相关测试系统的开发和测试工作。
“中文新闻信息置标语言” 标准的测试和验证工作是由全国新闻技术工作者联合会组织,按照国家标准委标准审查部和全国信息技术标准化技术委员会要求,遵照《国家标准制定程序的阶段划分及代码》(GB/T 16733-1997)的规定,以及课题参与单位的大力支持和配合下完成的。
测试和验证工作借鉴了软件工程中软件测试技术,利用实时系统测试、行为测试、任务测试等技术,通过三个测试项目对“中文新闻信息置标语言” 标准(简称CNML)进行了测试。其中由北大方正电子公司协助完成的“CNML新闻采编试验系统”展示了“中文新闻信息置标语言” 标准在新闻采编技术系统中对全流程稿签、多媒体业务的支持,由TRS公司协助完成的“CNML新闻客户端系统”展示了该标准在稿件用户端收稿软件中对新闻信息按照新闻信息和产品栏目分类法展示等功能的支持,由清华大学计算机系协助完成的“CNML向国内外新闻行业标准的转换”展示了该标准良好的逻辑框架,以及与国内外标准的接轨能力,本次测试验证工作的稿件样本量达12384条。在中国新闻评论网进行的试点项目还在建设中。
测试结果表明,“中文新闻信息置标语言标准”国家标准具备较好的周全性,能够满足稿件原创以及稿件二次加工等新闻采编业务对技术标准需求,“中文新闻信息置标语言标准”具备较好的可扩展性,能够满足各层次标准用户的个性化需求;该标准逻辑性较好,方便和国际标准以及国内的行业标准接口;该标准方便易用,可以表达结构简洁乃至非常复杂的新闻信息产品,实施该标准将催生新的新闻业务和增值服务模式。2005年9月29日在由全国信标委主持召开的“中文新闻信息标识语言”标准审定会上,课题组演示了三个测试系统并介绍了标准的测试验证情况,提交了测试情况的报告,专家观看测试系统演示后,对标准的测试验证工作给予了充分肯定,并同意“中文新闻信息置标语言标准”上报国家标准委成为国家标准。目前,课题组正在配合由中国新闻技联完善标准测试验证的后续工作,并积极准备在国家科技部组织的验收会上要进行的验证系统的演示工作。
☆☆☆ 《中文新闻信息分类与代码》标准 ☆☆☆
《中文新闻信息分类》标准课题组的分类测试工作于5月初全面展开,参加测试工作的有新华社、中央人民广播电台、经济日报社、解放军报社。新华社对近2万条数据进行分类,其中涉及类目1040条,24大类中均有,占类目表达26%。;中央台实际分类8213条,其中涉及类目301条,主要在20文化、休闲、21文学、艺术两大类中,占类目表达3.6%。经济日报社实际分类14378条。其中涉及类目348条,主要为工业、矿业类,其它少有涉及,占类目表达2.4%。解放军报社实际分类5001条。其中涉及类目441条,重点为军事类,其它类目基本涉及到,占类目表达8.8%。
新华社的测试内容主要包括以下几方面,一是新华社电讯稿、经济参考报、参考消息、国际先驱导报、经济信息稿(均以全天发稿)。二是行业报纸,如法制日报、科技日报、中国航天报、消费日报、中国有色金属报、中国医药报、中国海洋报等。三是综合性报纸,如人民日报、光明日报、中国青年报以及台湾、香港、澳门的报纸。四是按分类的大类目,主要涉及的有信息产业、传媒业;农业、农村;交通运输、邮政、物流;体育;服务业、旅游业;环境、气象;医药、卫生;贸易、海关;财政、金融;社会、劳动、灾难事故;基本建设、建筑业等。测试的内容比较全面的对《中文新闻信息分类》进行了测试,基本上对24个大类都能够涉及到。
课题组根据在测试过程中发现提出的问题对分类表进行调整、修改、补充,从5月初开始测试,到8月初准备印刷送审,比较大的修改约有7、8个版本。有的是对类名进行拆分,如:原“国际市场与国际贸易关系”分为“国际贸易关系”和“国际市场”,这样如分类时单独讲的可分别归类,如综合谈的两个类可同时标引;有的对类名进行修改,如原类名“医德、医风”改为“医务队伍建设”涵盖面就更广了;原“社会问题”,包括社会风尚、道德,社会不良现象以及青少年、老年人、妇女等社会问题等,现改为“社会行为”和“社会问题与社会工作”,“社会行为”又包括“亲社会行为”、“不良社会行为”和“反社会行为”,“社会问题与社会工作”又包括“青少年问题”、“老年人问题”、“妇女问题”、“残障人士问题”、“职工问题”、“农民问题”、“人口老龄化问题”、“城市住房问题”、“城市交通问题”、“贫富分化问题”、“邪教问题”、“社会治安问题”、“社会伦理问题”“自杀问题”等,这样修改使得分类表能够准确。另外,在对历史数据如1949年新闻稿,1996、1997年的经济信息等进行测试的过程中,发现有些类目并不能适应历史数据,因此,根据新闻报道的特点课题组对分类表进行了必要的调整。
总之,通过测试分类对《中文新闻信息分类与代码》标准中的问题进行分析、归纳、总结,并相应进行了比较合理的修正,使《中文新闻信息分类与代码》标准更符合和贴近新闻信息。但是,由于时间有限,人力有限,测试面和测试数据时间段有限,以及新事务不断出现,有些是难以预料的,因此,分类标准难免还有不尽人意的地方,分类标准本身也不少一劳永逸的,只有通过在今后的使用中加强管理,才能使《中文新闻信息分类与代码》标准不断完善。
─────────────────────────────
报:国家重要技术标准研究专项管理办公室、课题领导小组成员、课题工作小组成员;
新华社党组成员、副秘书长、副总编辑、多媒体数据库办公室
发:课题组成员
编辑:武国卫 刁毅刚 林红 电话:63071983 13681237559
邮箱:wugw@xinhua.org 文传:63072187