藏语言文字信息化情况调研报告
punctuation'>
一、基本情况
我国藏族主要分布在西藏自治区和青海、甘肃、四川、云南等省,人口约有540多万。藏语属汉藏语系藏缅语族藏语支,是我国古老的语言文字之一,它具有完备的表达功能和严密的语法结构,是藏族人民群众的主要交际工具和信息载体。藏文为记载和传播藏民族优秀文化,推动社会发展进步,发挥了不可替代的重要作用。
自西藏和平解放以来,特别是十一届三中全会以来,党的民族语文政策和国家有关民族语文的法律法规在西藏得到了很好的贯彻落实。1988年,西藏自治区组建成立了专门管理藏语文工作的机构。自治区成立了西藏自治区藏语文工作指导委员会,2003年更名为西藏自治区藏语文工作委员会,下设正厅级建制的办公室。自治区藏语文工作委员会的历届领导都由自治区主要领导担任。自治区藏语文工作委员会办公室负有宣传、贯彻、执行党和国家新时期民族语文方针政策;研究起草全区学习、使用和发展藏语文工作的地方性法规、条例、办法草案和重大方针政策的建议稿;指导和监督检查全区学习、使用和发展藏语言文字工作;制定和审定藏语言文字及藏语言文字信息处理的规范和标准;承担藏语言文字新词术语的审定、推广工作;负责指导藏文软件开发、推广应用工作;组织、开展藏语言文字以及翻译工作的理论研究;管理、监督全区社会使用藏语言文字的规范化工作等一系列职能。在西藏全区各地(市)、县(市、区)一级也都建有相应的藏语言文字工作机构。
为了促进西藏藏语言文字信息化的发展,2002年,自治区成立了西藏自治区藏文软件研发领导小组,现由区党委常委、区人民政府常务副主席吴英杰同志担任组长,自治区人民政府副主席甲热・洛桑丹增同志担任副组长。领导小组负责藏文软件的研发推广工作。
1987年7月,西藏自治区四届人大五次会议审议通过并颁布了《西藏自治区学习、使用和发展藏语文的若干规定(试行)》, 1988年,西藏自治区人民政府发布了《西藏自治区学习、使用和发展藏语文工作的若干规定的实施细则》。2002年5月,西藏自治区七届人大五次会议对1987年颁布的《西藏自治区学习、使用和发展藏语文的若干规定(试行)》进行了修订,审议通过并颁布了《西藏自治区学习、使用和发展藏语文工作的规定》。新的规定的实施细则正在修订之中。2001年11月,拉萨市发布了《拉萨市社会用字管理办法(试行)》。
藏语文不仅在人民的日常生活中,而且在西藏自治区的政治、经济、文化、教育、科技、军事、新闻、出版、广播、影视、法律、信息等各个领域得到了广泛的学习和应用。西藏自治区在藏语文的规范化、信息化等方面做了大量的工作。
二、藏语言文字信息化的历史状况
(2004年之前)
同我国其它少数民族语言文字相比,藏语言文字信息化工作起步较早。在研发软件和制定标准等方面做了大量的工作,取得了较大的成就。
1.早期的藏文软件以文字处理为主
从上个世纪八十年代初,我国有多家高等院校、科研院所就开始着手藏文信息处理技术系统的研制,到1984年,我国已开发出与汉英兼容的藏文处理系统,实现了藏文精密照排。
截止2004年底,我国国产的藏文软件主要有:北大方正、山东青鸟华光、青海班智达、甘肃同元、四川火狐和西藏大学藏文字母卡等。也有一些国外的藏文软件通过赠送、免费下载等途径进入我国,主要有美国的桑布扎(SAMBOHOTA)、TCC,德国的嘉木洋(JAMYANG),英国的TIBKEY等。
以上所有软件都是以文字处理为主。由于西藏自治区信息化水平较低,藏文软件市场价格较为昂贵,操作复杂等原因,就整体而言,藏文软件使用的数量不是很多,但在党政机关、教育、新闻、出版、广播、电视等行业都得到了普遍应用。
2.藏文编码字符标准是我国少数民族文字中的第一个国际标准
实现藏文信息化,藏文编码字符标准的制定是基础。为了促进藏文信息技术的发展,加速藏族地区现代化建设的进程,早在1992年,西藏自治区党委、政府、国家技术监督局、国家电子工业部和国家民族事务委员会等有关部委就将制定藏文编码标准的工作列上议事日程,并作了具体部署。
1993年,国家有关部委给西藏自治区藏语委办下达了组织牵头研究制定藏文编码标准的任务。国家有关部委和西藏自治区领导明确指示,在研究制定藏文编码国际标准上要坚持以我为主的原则,拿出最好的方案来为祖国争光,为民族文化事业的发展作出贡献。西藏藏语委办组织成立了由西藏大学、西藏技术监督局、青海师范大学、西北民族学院等单位参加的工作组,组织计算机、藏文、标准化方面的专家,全力以赴,共同研制国际标准的提案。
1993年西藏自治区在接受研究制定藏文编码标准任务时,ISO/IEC 10646的第一平面(BMP)所剩空间已经不多,从技术角度上讲,第一平面(BMP)是非常重要的编码空间,藏文编码标准能否进入第一平面(BMP)是当时制定面临的一个非常重要的现实问题。在国际上,提出藏文编码标准提案的国家除我国之外,还有美、英、印度、爱尔兰等国家,竞争非常激烈。然而,藏文的故乡在中国,中国西藏自治区是藏语言文字的发祥地,在制定藏文国际标准时,我国理应起主导作用。我们自始至终坚持以我为主的原则,精心研究设计,在提案的科学性、全面性、先进性等方面始终领先于别国的提案。
经过四年的不懈努力, 1997年6月30日至7月4日,在希腊举行的第33届WG2会议及SC2全会最后一级的投票表决,通过了由我国研制的藏文编码标准提案,正式形成ISO/IEC 10646《通用多八位编码字符集》藏文编码国际标准。
藏文编码国际标准共有192个编码点,168个编码字符。其中文字类字符43.组合用格式字符70个、数码类字符20个、标点符号类字符26个、文化类字符9个。另外,我们给每个藏文编码字符给出了标准的音读和转写名称。至此,藏文编码标准成为我国少数民族文字中第一个国际标准。
在形成国际标准的同时,1997年9月2日国家技术监督局正式发布中华人民共和国国家标准GB 16959―1997《信息技术 信息交换用藏文编码字符集 基本集》(Information technology―Tibetan coded character sets for information interchange―Basic set),1998年1月1日起实施。该标准在技术内容上与国际标准是等同的。起草单位包括西藏自治区藏语文工作指导委员会办公室、西藏大学、西藏自治区技术监督局、西北民族学院、青海师范大学。
藏文编码国家标准是我国少数民族文字中第一个采用最新编码结构体系的标准。藏文编码字符国际标准的通过,标志着藏文信息技术处理已经发展到一个新的阶段,也充分体现了我们国家对继承和发展民族文化,对少数民族语言的文字信息处理标准化工作的的重视与关怀,在政治上为祖国争了光,有力驳斥西方敌对势力诬蔑我们毁灭藏族文化的谬论。
图1 国际标准《基本集》藏文图形字符代码表
3.藏文点阵字型、键盘布局国家标准相继制定公布
在研制编码字符标准的同时,我们还开展了藏文点阵字型和键盘布局标准的研制工作。经过不懈努力,我国相继公布了GB/T 16960.1―1997《信息技术 藏文编码字符集(基本集)24×48点阵字型 第1部分:白体》和 GB/T 17543―1998《信息技术 藏文编码字符集(基本集)键盘字母数字区的布局》两项国家标准,为藏文信息化工作奠定了坚实的基础。
1997年9月2日,国家技术监督局发布了中华人民共和国国家标准GB/T 16960.1―1997《信息技术 藏文编码字符集(基本集)24×48点阵字型 第1部分:白体》(Information technology-Tibetan coded character set(basic set)―24×48 dots matrix font―Part1:Bai Ti),1998年1月1日开始实施。该标准依据GB16959―1997所提供的藏文字符,以我国藏文规范字形为基础并按照整理藏文字形的原则,具体设计和规定了藏文信息系统用24×48点阵字型该标准适用于藏文信息系统,也适用于其他有关设备。起草单位包括:西藏自治区藏语文工作指导委员会办公室、西北民族学院、西藏自治区技术监督局、西藏大学、青海师范大学。
图2 藏文24×48点阵字型的式样例图
1998年11月5日,国家质量技术监督局发布中华人民共和国国家标准GB/T 17543―1998《信息技术 藏文编码字符集(基本集)键盘字母数字区的布局》(Information technology―Keyboard layout of the alphanumeric zone for Tibetan coded character set(basic set)),1999年6月1日开始实施。该标准是依据GB16959所提供的信息交换用藏文编码字符集制定的。在信息处理用键盘的字母数字区域内,规定了藏文字符在键上的分布和排列。起草单位包括:西藏自治区藏语文工作指导委员会办公室、青海师范大学、西北民族学院、西藏大学。
图3 藏文编码字符键位分配图
4.藏文印刷字体规范
1996年7月,西藏藏语文工作指导委员会办公室和国家民委文宣司、国家新闻出版署技术发展司、全国印刷字体工作委员会等单位在拉萨共同主持召开了全国藏文印刷字体审定会,会上确立了西藏提交的14种、北大方正提交的5种、青鸟华光提交的3种,共22种字体作为规范的藏文印刷字体。
5.开展新一代藏文软件研发的前期准备工作
2002年,在收到新华社《国内动态清样》2002年第1014期“信息产业部重视国外藏文软件抢占我国市场”和有时任中央统战部部长王兆国同志批示的统函〔2002〕[二]231号《积极支持国内研发机构开发藏文软件工作的函》等文件后,西藏自治区党委、政府迅速成立了由自治区领导同志担任组长的自治区藏文软件研发领导小组,组织协调藏文软件开发工作。藏语委办受自治区藏文软件开发领导小组的委派,组织成立了有关专家参加的藏文软件研发工作组,确立了以我为主、立足国内、不搞低水平重复开发和先标准后开发的原则,提出了既充分考虑发挥藏语文故乡的资源优势和区内有一批藏文软件技术人员及开发经验的优势,与国内软件科研开发单位接洽、合作,又充分考虑能和汉、英等语言文字相互兼容、古今通用,达到现代信息技术标准等要求。
(1)西藏自治区藏语委办在区内外开展了大量认真细致的调研、洽谈工作,掌握了藏文软件的现状和存在的问题等第一手资料。
(2)西藏自治区领导带领有关人员多次向国家有关部门领导反映情况,得到了有关部委对研发藏文软件的支持。
(3)2003年,西藏自治区以自治区人民政府的名义向国务院上报了藏政发〔2003〕5号《西藏自治区人民政府关于研制开发藏文软件的请示》,内容包括藏文编码字符标准制定等三个基础方案和藏文办公套件等三个软件研发方案。
6.藏文大丁字符集国际标准的申报工作受挫
藏文属于拼音文字,进行横竖两个方向的拼写。对藏文进行编码时,一般采用对藏文纵向拼写结果或对藏文基本构件编码两种方法。 1997年制定的藏文字符编码国际标准和国家标准中只有192个基本字符,其特点是采用动态叠加的方式实现成千上万个藏文字符,但由于技术原因,截止2002年,还没有任何操作系统通过动态叠加组合方式实现基于ISO/IEC 10646的藏文信息处理,还是呈现出“万码奔腾”的局面。在国内藏文信息化受到高度重视的形势下,西藏自治区藏语文工作委员会办公室认识到要加快藏文信息化的进程,制定符合当前主流技术的藏文编码字符――纵向叠加字符的国家标准乃至国际标准显得更为重要。
2002年10月,西藏藏语委办了解到ISO/IEC 10646基本平面上还有1800多个连续码位后,立即组成工作小组,咨询了有关专家的意见,决定研制申报《藏文大丁字符集》国际标准,得到了自治区党委、政府和国家信息产业部、国家民委、国家教育部、国家标准化管理委员会等有关部委的大力支持。
对藏文纵向拼写结果编码,有多达几千个字符。为了使藏文纵向组合字符能够进入10646基本平面,工作组再三研究,决定将以现代藏文字符和科技术语借音中的纵向组合字符为主,包括少量古代藏文字符的共956个字符制定成了《藏文大丁字符集》,申报国际标准。如果能将《藏文大丁字符集》申请制定为国际标准,很多支持ISO/IEC 10646的系统不做大的修改即可很好地支持藏文信息处理与交换。
我们的提案,经过ISO/IEC/JTC/SC2/WG2的2002年第43次和2003年第44次两次会议审议,由于以美国为首的西方国家的反对,最后遭到了否决。本次国际会议的斗争是国外信息技术产业的技术封杀,这是国际间经济利益矛盾和斗争在国际标准化领域中表现出的典型案例。
7、确立了藏文信息处理技术发展方向
2003年12月,全国信息技术标准化技术委员会受国家标准化管理委员会委托,在四川省成都市召开了藏文编码技术交流会。来自西藏和内地共10家科研单位、软件企业的藏语文、藏文信息处理、标准化方面的专家参加了此次交流会。信息产业部、教育部、国家民族事务委员会等政府机关有关部门的领导出席了会议。
会议认为目前国内新一轮藏文信息化项目已经启动,许多藏文处理软件开发已经或即将列入计划,急需制定统一的藏文字符集编码标准;会议确立了在国际标准框架下制定藏文大字符集编码国家标准,定义垂直预组合的藏文字符,应作为近阶段我国藏文信息处理发展的策略;同时,不排斥小字符集的技术方案,并积极跟踪研究动态组合技术;会议建议国家标准化管理委员会加强与国家有关职能部门的协调与沟通,尽快成立藏文字符集编码国家标准工作组,确定具体的工作计划,落实经费,组织开展“国际标准框架下的藏文大字符集编码国家标准”制定与开发工作。
三、藏文信息化最新发展和需求
(2004年2007年)
进入新世纪,研发新的藏文软件,推广应用藏文软件,提升藏文信息化水平,成为大家的共同心愿。经过大家近几年的不懈努力,藏文信息化得到了飞速发展,取得了明显成就。
1.电子产业发展基金新一代藏文软件研发取得全面突破
受自然条件和经济发展水平的制约,长期以来,西藏自治区与内地之间的信息化水平存在较大差距,“数字鸿沟”正在形成并逐步加深。据测算,2003年藏族地区信息化水平仅相当于全国平均水平的20%。很多藏文软件还停留在DOS水平,少数Windows平台藏文软件的功能和性能明显落后于汉文软件。市场发育不完善,经济效益难以显现,企业开发藏文软件产品的积极性不高;藏文编码字符《基本集》标准没有得到统一使用,软件互不兼容,支持藏文的操作系统和关键的基础、应用软件产品缺乏,出版、办公和教育等领域的信息化程度低。藏文软件技术产品的落后极大的制约了西藏自治区经济和社会信息化的持续健康发展。
由于我国西藏自治区的特殊和敏感性,藏文软件和藏文信息化问题一直受到国外的高度关注。达赖分裂集团影响力较强的某些欧美国家一直在加紧研发藏文信息技术及产品,并利用各种形式向我藏族地区免费赠送。如美国利众基金会已向藏族地区免费赠送“桑布扎”藏文软件数千套,使用相当普遍。西方敌对势力和国外分裂势力借此扩大影响,大肆宣扬达赖集团鼓吹的“藏文化毁灭论”,对我国藏族地区的社会稳定和民族团结造成了不利影响。同时,国外藏文软件产品大多功能不齐全,编码标准不统一,兼容性差,信息安全难以保障。加快藏文信息化步伐,大力开发国产藏文软件并推广应用,是涉及国家政治安全、民族团结和国家统一的重大问题。
基于上述情况,信息产业部与西藏自治区人民政府着手开展藏文软件开发和推广应用工作。经过多次积极协调,并在大量调研的基础上,2004年8月,双方签署了《关于藏文软件开发和推广应用的合作协议》,信息产业部负责组织藏文软件的开发,西藏自治区人民政府负责组织藏文软件的推广应用,共同加快藏族地区软件与信息服务业发展。信息产业部制定了藏文软件开发专项实施方案,定位在藏文信息化基础核心软件的开发,有限目标,重点突破,以研制统一的藏文字符编码标准为突破口,开发出一批基础及共性软件,满足藏文信息处理的急需,突破西藏自治区经济和社会信息化发展的瓶颈,为未来藏族地区信息化发展提供支撑。
2005年,藏文软件开发专项作为信息产业部电子信息产业发展基金第一批项目计划下达,安排资金3300万元。项目分9个大项、13个小项,由内地和西藏自治区的骨干企事业单位承担。专项发挥内地和藏族地区两方面的积极性,重点开展藏文字符编码、字库、输入法、操作系统、上网软件、办公软件、电子出版系统和检测系统的技术和产品研发。2007年这8月,这些项目都通过了国家专家组的验收,并在西藏自治区以及我国其它藏区中逐渐开展推广应用。专项共取得发明专利2项,软件著作权16项,出版专著3部,发表论文40篇。专项成果基本覆盖了藏文信息处理的主要领域,为藏族地区办公、出版和教育信息化水平的提高提供了有力的支撑,一批成果填补了国内外空白,使我国藏文信息处理技术的整体水平达到国际领先。整体判断,藏文信息处理基本达到了当前汉文信息处理的能力和水平,具备了同步发展的条件。主要成果如下:
(1)藏文大字符集国家标准
2003年,我国代表团提交的藏文大丁字符集国际标准的提案遭到否决后,给我国带来严重的后果。一是在未来国际标准ISO/IEC 10646一枝独秀的环境下,我国多年来基于“藏文大丁字符”模式开发研制的藏文信息处理产品和数以亿计数据的继承将成为难以解决的问题;二是我国信息技术产业在藏文信息技术产品的开发和市场占有上将继续处于不利的地位,并有可能继续恶化。藏文大字符集编码标准的研制、发布与实施应该作为我国藏文信息产业发展的基础,必须先行启动。
2003年12月,由国家信息产业部、教育部、国家民委、国家标准化管理委员会组织召开的藏文信息技术标准研讨会上,与会专家达成一致意见,决定制定ISO/IEC 10646框架下的藏文扩充集(俗称“大字符集”)编码国家标准。2004年3月,国家标准化管理委员会组建成立了藏文信息技术标准国家工作组。工作组通过在北京、西藏、云南、四川、青海等地召开的6次大型会议和多次小型会议以及不间断的通信讨论,于2006年完成了标准的研制和标准实现技术的研讨。
2006年,藏文大字符集标准研制项目完成,形成了两项国家标准:GB/T 20542―2006《信息技术 藏文编码字符集 扩充集A》(Information technology―Tibetan coded character set―Extension A)已于2006年10 月9日发布,2007年3月1日起实施。
《信息技术 藏文编码字符集 扩充集B》(Information technology―Tibetan coded character set―Extension B)正在报批中。
《扩充集A》共有1536个藏文纵向组合字符,主要包括962个现代藏文、古藏文、已成为藏文的梵音转写藏文字符和574个最常用梵音转写藏文字符。《扩充集B》共有5669个藏文纵向组合字符,这些字符都是梵文转写藏文字符,与GB 16959―1997.GB/T 20542―2006配合使用时,对全部藏文和梵音转写藏文字符的覆盖率达到99.99%。这两个标准的起草单位有:西藏自治区藏语文工作委员会办公室、西藏大学、中国电子技术标准化研究所、青海师范大学、西北民族大学、北京北大方正电子有限公司、潍坊北大青鸟华光科技股份有限公司、中国科学院软件研究所、民族出版社、国家民委文宣司语文室、中国标准化研究院、中央民族大学、中国民族语文翻译局。
长期以来国内藏文信息处理软件产品不相兼容、不同产品产生的数据无法交换和共享的问题将得到彻底解决。
(2)基于Linux的藏文操作系统
该项目基于红旗Linux,在系统中支持藏文信息处理国家标准的技术方案,系统性地解决了Linux操作系统支持不同编码字符集的体系框架、藏文文本输入与输出、支持非BMP平面字符处理机制方面存在的一系列问题,设计与实现了完整支持藏文国家标准的输入法、TrueType藏文字库与操作图形用户界面。Linux桌面操作系统是由中科红旗软件有限公司、中科院软件所、西藏大学、西藏自治区藏语文工和委员会办公室共同研发。
(3)藏文之星For Windows2000/XP
藏文之星For Windows2000/XP是支持微软For Windows2000/XP计算机操作系统的藏文平台软件,主要功能包括:Windows2000/XP的环境下,实现藏文字的计算机输入、显示,使各种应用软件能随意的进行藏文字的各种字体的打印输出处理;支持中文汉字的的转化,对藏文字进行艺术化处理。藏文之星由北大方正集团有限公司与北京方正新天地信息网络科技有限责任公司联合完成的。
(4)三种藏文输入系统
电子产业发展基金藏文专项共针对不同用户、不同系统研发了三个藏文输入系统,一是西藏大学完成的“跨平台藏文输入法研发”,二是青海师范大学和西宁玛钦电子有限公司完成的“藏文输入法软件”,三是甘肃同元信息系统技术有限责任公司完成的“跨平台的藏文输入法研发”。这三个输入法,各有所长,有的同时支持Windows和Linux操作系统,有的具有智能输入,有的支持在线输入,有的支持藏文扫描识别。
(5)两种藏文办公套件
OpenOffice跨平台藏文办公套件建立了面向多文种信息处理的系统框架,并在此框架下实现了藏文信息规范化标准化的处理的体系结构;实现了规范化、实用化的支持Linux和Windows的跨平台办公套件产品。还初步实现了基于ISO/IEC 10646的藏文小字符集文本的正确显示输出,以及藏文的拉丁转写和藏文的排序。该软件附有不同藏文编码之间转换的程序,为我国原来藏文信息处理数据的交换创造了条件。该软件由中国科学院软件研究所、西藏大学、西藏自治区藏语文工作委员会办公室联合研制。
中标普华藏文软件主要是用于满足政府、企业的电子政务、电子设备、应用服务等领域的应用需求,包括电子公文、电子表格、电子演示文档等。该软件是由上海中标软件有限公司和西藏大学联合研制。
(6) Windows平台上藏文浏览器及网页制作工具。
由北大方正集团有限公司与西藏大学联合完成的藏文浏览器及网页制作工具是在Windows平台上中文浏览器及网页制作工具的基础上进行开发的,除了保持Windows平台上中文浏览器及网页制作工具的全部功能外,又加入了藏文处理功能,使得藏文互联网信息编辑、制作及发布的水平与中文保持同步,此外,北大方正集团还同步开发出了藏文翔宇电子报解决方案、藏文在线输入法,使得藏文互联网解决方案更加完整和丰富。
(7) 两种藏文电子出版系统
方正新一代藏文电子出版系统是在方正最新中文电子出版系统的基础上,基于最新的Windows平台上进行开发的。完全遵循我国藏文编码国家标准,该系统主要包括:藏文字库和输入法、藏文交互式飞腾排版软件、藏文后端输出软件、藏文补字软件。另外,方正集团还同步开发并推出了藏文书版软件、藏文新闻采编软件、藏文翔宇电子报系统,使得新一代藏文电子出版系统更加完善。该系统由北大方正集团有限公司研制。
华光藏文书刊、公文电子出版系统基于藏文信息技术国家标准,基于Windows环境,包括藏文新字库、藏文标准输入法、藏文书刊排版系统、藏文公文排版系统、藏文解释输出系统和藏文电子公文系统,实现了印刷出版、数字出版一体化和网络协同作业。该软件是由潍坊北大青鸟华光照排有限公司研制。
(8) 藏文政府办公系统
该系统以西藏自治区各级党政机关单位日常办公业务需求为导向,以“智能化、构件化、个性化”为核心,基于多层次体系结构、藏文平台、门户和工作流引擎等核心技术,以RJ-eGov政务办公系统产品为原型进行藏文化和客户化开发,满足藏区各级党政机关电子化办公要求,为实现机关单位之间网上协作办公、数据交换和资源共享奠定了基础。该软件由福建榕基软件开发有限公司和西藏自治区藏语文工作委员会办公室联合研制。
(9)藏文软件标准符合性检测系统
该系统实现了基于Windows和Linux操作系统、藏文字库、藏文输入法、以及数据管理系统的藏文支持等进行检测。主要包括:藏文软件标准符合性检测系统(Windows平台)、藏文软件标准符合性检测系统(Linux平台)、检测用电子文档形成了检测系统的检测用例等。该软件不仅能够规范藏文信息处理产品的研发、节省成本与降低风险,也能够从根本上提高藏文软件产品的质量与可用性,极大地促进了藏文信息技术产品的规范化与标准化。
2.藏文点阵字形国家标准的制定和藏文字库的制作
在制定藏文大字符集国家标准的同时,藏文信息技术标准国家工作组还着手开展了藏文吾坚琼体点阵字形国家标准的制定工作。通过在北京、西藏、云南、四川、青海等地召开的6次大型会议和多次小型会议以及不间断的通信讨论,标准研制组于2006年完成了标准的研制和标准实现技术的研讨。
2005年8月,工作组完成了《信息技术 藏文编码字符集(基本集及扩充集A)24×48点阵字型 吾坚琼体》和《信息技术 藏文编码字符集(扩充集B)24×48点阵字型 吾坚琼体》的研制工作,目前,这两个标准正在报批中。这两个标准的起草单位有:西藏自治区藏语文工作委员会办公室、西藏大学、中国电子技术标准化研究所、青海师范大学、西北民族大学、北京北大方正电子有限公司、潍坊北大青鸟华光科技股份有限公司、中国科学院软件研究所、民族出版社、国家民委文宣司语文室、中国标准化研究院、中央民族大学、中国民族语文翻译局。
3.丰富多彩的藏文字库
在研发藏文软件同时,我国国内制作了的大量的高精度的TrueType藏文字库,为丰富、美化藏文版面起到了重要的作用。主要有:吾坚琼体、朱匝体、徂同体、智华白体、智华黑体、嘛呢体、长足体、短足体、竹体、行书体、青白体、白体、黑体、标题黑、新白体、新黑体、美术体等,这些字库的制作为藏文信息化工作提供基于国家标准的字库支撑,起到了丰富、美化藏文软件的界面,满足日常办公、学习等需求的作用。
4.全面支持藏文的Windows Vista操作系统
1997年藏文编码国际标准通过后,世界上的主流操作系统厂商――美国微软公司发布的Windows98.Windows2000、Windows2003.WindowsXP等一系列操作系统都不支持藏文。我们国内加大藏文软件的研发力度后,他们也闻风而动,加快了支持藏文的研发工作,2007年1月发布的Windows Vista操作系统上实现了对藏文的支持。该系统基于藏文编码字符集《基本集》,采用微软公司垄断的OpenType技术,实现藏文纵向组合字符的动态叠加。
Windows Vista操作系统,既因技术的先进和Windows系统的普遍使用,对于我国藏文信息化工作有促进作用,又因OpenType技术的垄断性,以及与我国长期以来采用的大字集编码的藏文信息处理方式不兼容而影响国内藏文软件的普及和藏文软件企业的发展。
5.基于国家标准的藏文网站开始涌现
2004年前,互联网上出现少量的藏文网站,这些网站要么是用贴图的方式,要么是用某种不支持藏文编码字符国家标准的藏文字库在网络上实现藏文信息的传播。这些藏文网站只能浏览,不能真正实现资源的共享。在《扩充集A》国家标准通过后,涌现出一大批基于国家标准的藏文网站。西藏藏语言文字网是一个成功的案例。
在国家教育部语信司的热切关心和上海市语委的鼎力支持下,2005年8月,西藏藏语言文字网正式开通。西藏藏语言文字网具有藏汉两种版面,藏文版面是完全支持我国制定的一系列藏文编码国家标准的,实现了藏文信息资源真正意义上的共享。
具有国家标准的藏文网站还有:中国藏学网、中国西藏信息中心等等。
6.藏文无线通信系统正式开通
2005年11月 25日,藏文信息无线通信系统正式开通。藏文无线通信系统手持电子通讯设备是由西藏大学、西藏电信公司和深圳润汇科技有限公司联合研发的,这项系统设计和生成了符合藏文字体特性的点阵藏文字库,独创了藏文短信的编码和解码技术,重码率低、翻页少,具有全藏文界面、完整藏文输入输出功能和藏文短信收发功能,它集成了十几年来藏文信息技术的发展成就,填补了手持电子设备上实现藏文信息处理的空白,首次在无线通信系统上实现藏文信息传输,,标志着藏语言文字信息化工作提高到了一个崭新的水平。
藏文无线通信系统的研发成功,不仅可以借助藏文无线终端和藏文信息的录入及存储,点对点的藏文短信传递服务等基本功能,为广大农牧民群众提供灵活便捷的通信信息服务。同时也可以通过发布短信的方式,将政策信息、藏文新闻、农牧科技、气象服务、地质灾害等信息及时传达到农牧民群众中去,使藏文无线通信系统成为传播党的声音、促进农牧民增收致富的桥梁。
图3 藏文版手机
7.藏文软件使用情况
(1)我国研制的新一代藏文软件开始在西藏区内使用
1)Linux藏文桌面操作系统推广应用情况。2007年初,中科红旗公司给西藏藏语委办签署协议,免费赠送价值50万元的1200套Linux藏文桌面操作系统软件。2007年10月,西藏藏语委办向西藏自治区教育厅赠送了500套,在教育系统内推广使用。西藏藏语委办还向区内其它单位发出了Linux藏文桌面操作系统需求统计的通知,绝大多数单位积极响应,西藏藏语委办陆续将该软件发放给用户。
2)中标普华藏文版办公套件使用情况。2007年5月,上海中标软件公司给西藏藏语委办赠送了200套中标普华藏文版办公套件,在西藏范围内进行了试用,用户反映良好。
3)藏文政府办公系统在西藏自治区人民政府办公厅和西藏自治区编译局已经正式使用;方正藏文飞腾排版软件在西藏日报、青海日报、四川甘孜报等已经正式使用,大大提高了报纸的质量,使这些报刊达到了内地省级报刊的先进水平;华光藏文书刊、公文电子出版系统已经在中国藏学研究中心大藏经对刊局和出版社,拉萨晚报社以及部分党政机关、学校使用。一批藏文网站陆续建设,国内机构主办的藏文网站数目明显增加。西藏自治区公安厅二代居民身份证制作也使用了专项成果。西藏大学已应用专项成果开设藏文信息技术必修课程,参与学习的学生已达4000人。
4)跨平台的藏文办公套件(Open Office.org)、跨平台藏文输入法(藏大岗杰藏文输入法)、基于(Windows XP)的藏文操作系统(藏文之星)等新一代藏文软件的推广应用工作也已列入计划。
(2)其它藏文软件的应用情况
我国国内研发的北大方正、青鸟华光等一大批老的藏文软件在西藏自治区已经使用多年,由于经费和使用习惯等原因,大多数用户仍在继续使用。一些个人用户也有使用国外藏文软件的。
2007年,美国微软公司的Windows Vista操作系统推出后,由于Windows Vista是从系统内核上支持藏文的,而且在新的计算机中以OEM的形式推广,Windows系列操作系统在用户当中占了绝大多数,在西藏一些新采购计算机的用户,自然而然地就有一些用户开始使用Windows Vista带的藏文软件。由于操作习惯等原因,Windows Vista目前不被大多数用户看好,也出现了不少删除电脑中自带的Vista而改装成XP操作系统,再安装其它藏文软件的用户。
8.藏语文信息化的需求
近几年来,藏语言文字信息化工作取得了很大的进展,但也存在一些问题,需要我们加以改进。
(1)需要建立藏文信息化工作的长效机制。纵观藏文信息化工作的历程,由于缺乏长效机制,在政策方面容易出现时冷时热的现象,在机构方面都是临时机构,在经费方面得不到有效保障,这给藏文信息化工作带来了很大的影响。
(2)藏文软件的推广应用工作需要进一步加强。现在研发出了一大批藏文软件,但存在市场规模较小,企业不能完全依靠市场化运作;西藏财政困难,信息化经费支持力度较小;一些旧的藏文软件仍在使用,人们的使用习惯不能在短时期内得到改变等诸多不利因素,严重制约了藏文信息化的普及与提升,藏文软件的推广应用工作需要进一步加强。
(3)需要加大藏文信息化标准的整顿规范力度。新研发的藏文软件支持国家标准,但原来的藏文软件和藏文网站等大多数仍使用企业编码标准,在事实上仍存在标准不统一的现象,需要整顿规范。
(4)现有藏文软件种类偏少,需要研发一些专业的藏文软件。目前研发的藏文软件较原来单一的文字处理软件来讲有了很大的突破,也为藏文信息化工作奠定了坚实的基础。但是现在研发的藏文软件主要集中在操作系统和办公系统、输入法等基础和共性软件方面。不同用户、不同行业对于藏文软件的需求是不同的,现有的藏文软件远远不能满足广大用户的需求。
(5)需要丰富藏文信息资源。目前虽然有不少藏文网站,但就整体而言,数量仍然非常少,且大多内容相近或雷同,再加上有些网站不支持藏文编码字符国家标准等原因,能共享的藏文信息资源更是非常有限。
四、意见与对策
针对存在的问题,在进行广泛调研的基础上,我们对藏文信息化提出以下解决问题的意见与对策。
1.建立健全藏文信息化工作长效机制。主要建议包括:成立专门的工作机构,负责藏文信息化;每年国家财政和西藏地方财政都要拿出一部分资金,用于藏文信息化建设。从机构、经费等方面为藏文信息化做好保障,建立长效机制,确保藏文信息化水平与经济社会同步发展。
2.加大藏文软件推广应用工作的力度。藏文软件市场规模小,难以形成规模效益,单纯依靠市场手段,无法实现藏文软件的广泛应用。要采取政策引导、行业整体规划、政府出资、信息化援藏、软硬件配套落实等多种措施,加大藏文软件的推广应用工作力度。采取多种形式,大力推广应用藏文软件。主要包括,一是按行业推广应用,比如:报社出版系统,教育系统、党政机关等;二是积极争取资金,以政府采购形式为经费较少的单位解决藏文软件;三是争取软件企业的支持,以较低的价格或免费的形式给广大用户提供藏文软件等。同时要大力开展藏文软件使用的培训工作。
3.全方位开展藏文编码标准符合性检测。我们已经研发出藏文软件标准符合性检测系统,这为藏文编码标准符合性检测做好了保障。要全方位开展藏文编码标准符合性检测,首先,我们要成立专门的藏文软件符合性检测工作机构,并培养专门的人才,开展检测工作;其次,我们要从不同角度加大检测工作的力度。采取要求企业送检、开展市场检查,全面检测所有藏文网站等手段,严把入口关,力争在短时期内使所有的藏文软件和藏文网站等和藏文信息化相关的产业都做到符合国家标准,实现藏文资源的全面共享。
4.从国家层面继续投入资金支持研发藏文应用软件等相关工作。新一代藏文软件研发了一批藏民族急需的基础和共性软件,提升了藏文信息化的整体水平。但是藏文信息化是一个长期的、系统的工程,研发出几个软件,或只是一次性投入不能解决所有问题。我们需要从国家层面进一步统筹规划,加强指导和政策支持,给予持续的资金保障。一方面要在巩固完善专项成果、技术产品升级换代、应用软件开发、相关技术服务和人员培训等方面还需要做大量工作。另一方面还需要在现有软件的基础上,结合实际,有针对性地研发一些行业应用软件。例如:藏汉英翻译软件、图书管理、超市购物管理、藏文网络通讯、藏民族特有的游戏、藏文手机(支持GSM、CDMA)等藏文软件。
5.加强藏文信息化人才培养和教育。经过几年的努力,西藏自治区藏文信息化人才队伍得到了快速发展,但是汉藏英语兼通的信息技术人才匮乏,这就要求我们加强藏文信息化人才的培养。要建立培养、使用、留住人才等一整套藏文信息化人才的培养模式,为未来西藏自治区信息化的持续发展提供保障。同时要普及藏文信息化教育,我们建议教育部协调我国西藏和其他藏族地区教育部门,将藏文信息化教学纳入各大中小学的信息化教学内容之中。编纂藏文信息化教材,在大中小学校教学过程当中安排一定的藏文信息化课时,普及藏文信息化教育。
6.大力建设藏文信息资源。建设藏文信息化资源不能仅靠民间力量,需要各级政府在政策上引导,在资金上投入,多渠道、有计划的建设。例如从有利于民族文化的传承角度出发,将一些藏文古籍进行信息化处理;从用户的需求出发,建立一些大型藏文门户网站、论坛等等。
7.信息安全问题值得关注。随着藏族地区信息化水平的不断提高,信息安全问题将不可避免。应在藏族地区信息化起步阶段未雨绸缪,对信息安全的相关问题给予足够重视。
参考文献:
1.专著
[1] 恰白・次旦平措、诺章・吴坚、平措次仁合著. 《西藏通史-松石宝串》[M] . 拉萨. 西藏古籍出版社. 2004.
[2] 西藏嘎吉林建筑有限公司顾问组编著. 《雪域书法唐卡大集》[J].拉萨. 西藏人民出版社. 2006.
[3]东嘎・洛桑赤列著. 《东嘎藏学大辞典》(藏文)[M]. 北京. 中国藏学出版社. 2002
[4]觉顿・仁钦扎西著. 《丁香帐-藏文古今词语辨析》(藏文)[M]. 北京. 民族出版社. 1982
[5]端智嘉、陈庆英著. 《赞普赤德松赞小传》(藏文)[M]. 北京. 民族出版社. 1984
[6]南卡洛布著. 《藏族族源及文字小传》(藏文)[M]. 成都. 四川民族出版社. 1989.
[7]毛尔盖・ 桑木丹著. 《语法明悦》(藏文)[M]. 兰州. 甘肃人民出版社. 1981.2
[8] 毛尔盖・ 桑木丹著. 《藏族文化发展史》(藏文)[M]. 成都. 四川民族出版社. 1982.
[9] 彭措才仁著.《西藏历史年表》(藏文) [M]. 北京. 民族出版社. 1987
[10] 诺章吴坚著.《诺章吴坚文论》(藏文)[M]. 北京. 中国藏学出版社. 2006
[11]周炜、格桑坚村. 《西藏的藏语文工作》[R]. 北京. 中国藏学出版社. 2004
[12]信息产业部电子信息产品管理司,《藏文软件开发专项介绍》,《信息技术与标准化》,2007年,第8期。
2.论文
[1] 念秀・青绕维色. 《谈藏学的由来及藏语文》[A]. 《藏语共同语论文集》.北京.民族出版社.1999年
[2] 西珠. 《简述藏语文的产生过程》[A]. 《藏语共同语论文集》.北京.民族出版社.1999年
[3]迪努・多吉占堆. 《中国翻译史上的一朵奇葩》[J].《西藏藏语文工作》2007年第4期
[4]国杰、次仁卓玛.《论藏语言厘定内涵所引起的相关问题》[J].《西藏研究》2008年第2期.
[5]德奴多杰占堆.《谈藏文翻译史上的语言文字改革》[J].《西藏大学学报》2004年第1期.
[6]拉巴平措,《藏文编码国际标准和国家标准研究制定工作情况的总结讲话》,J,《藏语文工作》,1997年,专刊。
稿源:区藏语委办科研处