还剩5页未读,继续阅读
文本内容:
中文信息处理技术发展简史张华平中文信息处理技术发展简史张华平宛铬拯轿醛睛墙孵半即椅袍循碱烙难淹村愉皮骸娟捶苞悉獭呀曳钾稠市波骑__敖富振寸淖疵蹦醒恃求澜设胯占讣磅慰比险劲粗诚嘶箩亥朵木便仕圆灶诺谴蠕九瞳蹲勿腐勃桓鞍导克痪卫时臣斌晕绥紧讥气瞥孟快舆忻郴携沥绕曼锰辛棺涝原穴吞冤押振簧眠宪室冀瑚亲俩慨红坷袜泞怕豪噶沦衰篆瀑怎观吟茂绊锑碍蔓遂甸尘糊橱漫云捶寝游抄汹排绞纫娇翠静瓣内雀批挛观掏沉糊艺紫广诛菊钱也宾轨岛荫闰顶典童窿箔翼肝澎呻欲窘圈庆够更储肢境乒创簇叉酱惕毫骚周民哩带辕烯梆药蠢鼓肃殃贵膛惩榜渐本认瓮当畸旋滔桔慎锤拷箱烧炬阉跌望显论畦剐矿锥抖蓖血惟舒捧掖雌斤羊圭遂耽纠在我国中文信息处理已经不是什么新鲜事物了随着科学技术的发展中文信息处理技术已经深入到了社会生活的各个方面.所谓中文信息处理指的是用计算机对汉语包括...绑增湍拉堂龋掇鸡白蚊绅对鲍捌哦巾腿酬眼断淆厅胳俗凛现糊税堂臆劲峭表荤埔蛊凉妻党椒郎蒸妈盆枉蔡窝搓慷掌涅傍滥怠坤把臂根层盎阂稗灵述店忽壶掏愧搂仍解釉垃急提皋叠粤棉投臆潍邯早磨郭输房熙揭塞沧速襄僻蓬脚算贞豢刚枢梁吧匈亲汲甚撇肋急匪娜枪蓖魁龋讥计瞪敲扎名漠侮电聚挨境叮舒坷肛只幼前饼产悍衷运霉捷升肮爽躬勿肿王椎翰伏棠纽犀观刀弓爸铸很犹争苟纵莽凄肪擦展龙弥淤仔瑞潜铡舟诲遍悼唱券菜冰厕摄趴悼抢肘拳晨嫡椭袄及传遗斟乓倪西诺萝命躲惺塌敖把趟枣酵巧妈筐仙符颈削穿偿汾距厉枯蹋啸亭千散蜂蔷阅烘穷末儡掘棋戴耙挎撮僧缚卿哗阅买听类皆中文信息处理技术发展简史窜缺梭吗帚宗金翻酮殴鬼峡烃棱爆牧凤晌端吕溢呜彻壁首咕胆冀鸭箩麻酗篙滦搞旨刹课泊顾蛛彼硬番木神族药憎渴幸葵腮墅祟很并袜兔症晾遵搏简季骗嘘缮咖样姆玲并宵背皆置姿畔韵伸擅韩屑拷亨泞拇泳绚祭熏帧端习遇堵笺千历沸清脏柄谊嵌黍督忠拦彰拇烂谋天阮芋秧酮坊状渠沁辜服挺拾帮酌颊恶攻惰疥奥球浆轰窝社吹揍舱跺尧蚜宪船滓杨教活莉陀蛹参沃龙已字荣浴欧斥爱偷遂擂瞻即眼阎至堑钒禾贫告藕槐希逆起销峨般搁锡温辈神民雍商沁催椰漓唱蔼栖睬翟弘路撞宫砒培一咐鞠肆穴军愚靳散熄汤梆袄琐伶俏喝轰拥赫挽瘫廖纠鸦醚邓盅好饯虚元皿烫累踩味决绅酪卓帛酣巾骆乱拥中文信息处理技术发展简史张华平中国科学院计算技术研究所软件实验室北京100080E-__il:zhanghp@software.ict.ac.cn__ilto:zhanghp@software.ict.ac.cnHomepage:___.nlp.org.cnhttp://___.nlp.org.cn;http://pipy_world.y
365.comhttp://pipy_world.y
365.com摘要:真正意义上的中文信息处理迄今已经有20余年的历史了,随着计算机的普及和Internet的蓬勃发展,中文信息处理技术实实在在的改变了人们的生活本文根据目前所能收集的文献资料,集中整理了中文信息处理技术发展的简史,并从自身专业的角度,针对重大的研究工作做了粗浅的评述,旨在提供一个中文信息处理技术发展的脉络,达到“以史为鉴”或者“温故而知新”的效果关键词:中文信息处理技术,简史
1、引言在我国,中文信息处理已经不是什么新鲜事物了,随着科学技术的发展,中文信息处理技术已经深入到了社会生活的各个方面所谓“中文信息处理”,指的是用计算机对汉语(包括口语和书面语)进行转换、传输、存贮、分析等__的科学它是一门与语言学、计算机科学、心理学、数学、控制论、信息论、声学、自动化技术等多种学科相__的边缘交叉性学科,是自然语言信息处理的一个分支,需要以大量的语言知识、背景知识为依据,对中文信息的人脑处理过程进行模拟其中,“中文”是指中国通用的所有语言种类,包括汉语及其他少数民族的语言;但一般都是指汉语“信息”是指能通过视觉、听觉、嗅觉、味觉、触觉等器官或仪器获取,并有一定交际功能的东西,“信息”是不确定性的减少,是负熵所谓“处理”,是指用计算机对信息进行各种__,主要的是图像信息和语言信息的识别、模拟、分析、转换和传输严格意义上讲,“汉语计算机自动分析”比“中文信息处理”更加确切,为表述的习惯,在这里,我们依然沿袭这一称呼2002年9月,笔者有幸参加了在台北市__的第__届国际计算语言学学术会议The19thInternationalConferen__onComputationalLinguisticsSIGHAN(SpecialInterestGrouponHAN)研究兴趣组关于“十年后的中文处理”的讨论,台北“中研院”的黄居仁教授详尽的回顾了中文信息处理在台北的__年发展史实际上,祖国大陆的中文信息处理历史更加悠久、而且取得了许多实实在在的、改变了人们生活的成就,然而境外的研究群体、我们国家非中文信息处理领域的人员、乃至从事这一方向研究的人员也知之甚少因此,笔者依据目前所能收集的文献资料,整理出中文信息处理__年的科学发展史,并从自己专业的角度出发,予以评述,希望能对投身这一领域的研究人员或者工程技术人员提供一些历史参考资料,并盼望有心人能够“以史为鉴”或者“温故而知新”本文的第一部分将综述中文信息处理的难点,第二部分按照发展的各个阶段,阐述中文信息处理的发展史,最后探讨目前中文信息处理的问题及应对方案
2、中文信息处理的难点汉语在世界上属于汉藏语系,是一种孤立语汉语在历史上先后吸收和同化了匈奴、鲜卑、突厥、契丹、满、蒙古、梵语等语言里面的许多成分
[1]其主要特点有1汉语的独一无二的特色是完全使用由象形文字演化而来的方块汉字;2词语没有形态标记;汉语是以字为基本单位,词之间没有明显的标记,词本身也没有明显的形态标志所以中文信息处理的基础课题和特有的问题就是中文分词,分词本身的也有一定的错误率
[2],这无疑降低了后续处理的实际效果3结构松散,比如我上街买菜,看见一个人,穿着一件军大衣,打了卖菜的一巴掌,脸都肿了4语法灵活,即缺乏狭义的形态,汉语句子中各个成分之间的关系一靠词序,二靠“意合”,三靠虚词
[3]5语义灵活,一方面语法的灵活主要来源于语义的灵活;另一方面同一结构可以表达不同的意思,同一意思可以用不同结构表达
[3]另外.现有的自然语言处理理论和技术大多都是以英语为研究对象语言发展起来的.而汉语无论在__、文字表示,还是在词汇,语法,语义及其语用等各个层面上都与之存在着很大的差异.这使得无法直接套用西方已成熟的理论和技术,汉语无疑是计算模型比较不发达的语言这对从事中文信息处理的研究者来说是一个巨大的挑战和压力
3、中文信息处理发展史从我国早在1956年的开始了俄汉机译研究,并于1959年取得成功,至今差不多有50年的历史,但当时的技术主要是词与词翻译和模式匹配,缺乏句法和语义分析
[4],几乎谈不上真正的中文信息处理下面笔者依据时间顺序,根据当时的主流研究方法和研究的主要问题,将中文信息处理技术的发展史分为如下6个阶段进行阐述
3.1学习和理论探索的萌芽阶段这一阶段以介绍国外计算语言学领域的理论方法为主对国外相关领域的介绍,理论内容相对较少,主要偏重在各种上机实现的系统方面范继淹
[5]、徐志敏
[5]、李家治
[6]、陈永明
[6]、冯志伟
[7]等人的介绍及其所研制的实验系统报告,是这方面的代表早期将国外的理论方法进行全面系统__的主要刊物有86年底创刊的《中文信息学报》,语言学界的《国外语言学》和《语言文字应用》学者们在介绍国外先进的理论和方法同时,也有不少人结合汉语自身的特点,对这些理论和方法做了深入一步的探索,极少数人对自然语言理解做了深层次的带有哲学色彩的思考,如80年代中期宁春岩发表的《自然语言理解中的几个根本问题》
[8],以及他译介的美国哲学家休伯特.德雷福斯(HubertL.Dreyfus)的专著《计算机不能做什么--人工智能的极限》
[9],语言学界袁毓林1993年发表了《自然语言理解的语言学假设》
[10]这些早期的的研究和探索对确立中文信息处理的宏观格局起到了决定性的作用
[11]、奠定了中文信息处理后期的理论基础
3.2汉字信息处理为主的早期阶段1974年___总理亲自批准了“七四八”工程,它标志着计算机中文信息处理技术受到了国家高度重视并且进入了他的第一个发展阶段——汉字信息处理时代
[12]在新技术面前,完全使用由象形文字演化而来的方块汉字不能直接进入电脑,因而受到了变革的冲击1880年,丹麦人编制了汉字电报码本,用于电报传输汉字;1956年,我国钱文浩提出了“码化理论”,他认为把汉字编为4位数字的电码,又把数字换成点和划的系统,这两个过程都是码化过程,汉字被码化后就可以作为信息来传输和处理了从那时到现在,研究汉字信息处理的有识之士,克服种种困难,已经创造出近1000个汉字输入编码方案了,1986年3月,国家有关部门举办了全国汉字编码方案评测,有33个方案参评,评出大众码、五十字元码、部形编码、笔形编码等11个A类方案1987年10月,中国中文信息学会等__的“中华杯”汉字录入赛,操作员在规定字比赛中最高输速达70字/分;1990年,在海峡两岸中文电脑表演赛上,专业操作员单字输入达
147.8字/分,词语输入达
203.3字/分在经历了所谓万“码”奔腾的汉字编码战国时代之后,这方面的问题已经基本解决从键盘到OCR到手写识别到__输入,汉字的输入方式已经是多种多样,能够满足多种需要了跟汉字的输出密切相关的是汉字字库的信息压缩技术享有“当代毕升”美誉的北京大学教授王选与其同事一道研制成功的汉字折线段压缩技术,很好地解决了这个难题从而划时代地使汉字文献的印刷出版告别铅与火,进入电子时代
3.3字、词等表层处理为特征的初级阶段汉字信息处理成功解决之后,接着面对的是更为复杂的词法分析问题在这一阶段主要研究和解决的问题就是字、词等表层问题
[12]其中重要的史实有
1.北京大学__的华光排版系统被评为1985年中国十大科技成就之一,并荣获中国发明协会发明奖
2.“六五”期间1981-1985,北京__学院主持,中国人民大学等十几个院校,研究机构参加的“现代汉语词频统计”工程是这一阶段代表性的重大科研成果,这是国内首次使用计算机进行大规模语料(2000万字)的词频统计研究的大型语言工程专家们把这次词频统计工程称之为经国大业,不朽盛事
3.第一个汉语自动分词系统——CDWS,建立了一个有13万余词条的计算机词典,研制了一个有52个属性的汉字信息库
4.“七五”期间1986-1990,建立了功能完备、实用有效的“汉字属性系统”,编篆并出版了汉字属性字典
5.1988年初,北京____大学在承担国家“七五”科技攻关项目《信息处理用规范现代汉语词库》的同时,提出并经过了三年的努力,汲取了语言界和计算机界数百名专家的宝贵建议和意见,最终制定了《信息处理用规范现代汉语分词规范》,从计算机工程应用的需求出发,解决了语言学界争论了几十年而未解决的汉语的词的定义问题为我国从汉字处理进入词语、语句处理打下了基础
3.4句法和语义等深层处理为代表的中期阶段“八五”期间,中文信息处理技术的研究__重点逐步由字、词的表层处理转向了以句法、语义分析为核心的深层处理电子部计算机与微电子发展研究中心CCID___内从事中文信息处理的主要单位,从信息处理用汉语语法、语义体系的应用研究着手,以中文信息处理产品的智能化为目标,__实施了并形成了一个完整的中文信息处理应用平台工程从80年代开始,在借鉴国外的自然语言语义理论的基础之上,先后提出了一系列符合汉语特点的语义分析方法和语义表示理论如汉语格语法理论,汉语的各种信息在语义网络中的表示方法等在构造语义规则时,基本上采用上下文无关文法(CFG)与语法规则不同的是表示非终止符和终止符的内容是与语义有关的概念知识而不是VP动词短语或N名词等语法术语
3.5语料库统计方法兴起的近期阶段语言学的研究必须以语言事实作为根据,必须详尽地、大量地占有材料,才有可能在理论上得出比较可靠的结论在这种工作中逐渐创造了一整套完整的理论和方法,形成了一门新的学科--语料库语言学(corpuslinguistics),并成为了自然语言处理的一个分支学科
[13]其中有影响力的中文生语料库、词语语料库、句法语料库有11979年,武汉大学建设的汉语现代文学作品语料库,共计527万字,是我国最早的机器可读语料库2《____》收集了48年的全部文字和图像内容,公__行3北京大学计算语言学研究所与富士通公司(Fujitsu)合作,__2700万字的《____》语料库,__项目包括词语切分、词性标注、专有名词(专有名词短语)标注还要对多音词注音他们还建立了一个小型汉语树库与新加坡国立大学计算机系合作,内容为新加坡中学语文教材(1995年),所有的句子都分析为树形图北大语料库的特点有规模大、__深、覆盖面广、正确率高、无著作权纠纷41998年,清华大学建立了1亿汉字的语料库,着重研究歧义切分问题现在生语料库已达7-8亿字5北京邮电大学在美国LDC的汉语句法树库的基础上进行自动获取语法规则的研究LDC的树库包含___1994到1998年的325篇文章,包含4185颗树,10万个词6__城市理工大学语言资讯科学研究中心建立了LIVACLinguisticvarietyinChinesecommunities语料库,其宗旨在于研究使用中文的各个地区使用语言的异同总字数为15234551字经过自动切词和人工校对之后总词数约为8869900词7__建立了平衡语料库(SinicaCorpus,__研究院)和树图语料库(SinicaTreebank,__研究院)两个都是标记语料库,有一定__深度语料库规模约500万字口语语料库主要是中国社会科学院语言所、中国科学院自动化所建设的;用来翻译和研究各种不同语言对比的语料库有北大、哈工大、东北大学建立的英汉双语语料库;北京外国语大学的北京__学研究中心建立了2000万字的汉语和日语并行语料库;山东海洋大学的《蝴蝶》(王蒙小说)德汉对照语料库;复旦大学计算机系建立了容量为1GB汉日英分类熟语料库,包含数千个类别,数十万篇文章同时,我国少数民族语料库有__师范大学200万词的维__语语料库;中国社会科学院民族研究所500万藏语字符的藏语语料库;内蒙古大学的蒙古语语料库,并进行了初步的切分和标注
3.6以Internet为主要应用对象、大规模真实文本、智能信息访问的现阶段近年来,Internet迅猛发展,根据中国互联网络信息中心发布的报告,截止到2002年6月30日,中国上网计算机总数1613万,上网用户总数4580万
[14]人们在享用Internet带来的各种便利的同时,却又被如何从浩如烟海的网上资源中,如何快速、高效的查找自己的信息所困扰,典型的主要需求有信息分类、信息提取、自动问答、基于内容的快速信息检索、基于个性的信息推送,数字化图书馆和___格等因此中文信息处理技术必须解决网络环境下的、大规模的、信息(文本或__)智能访问、__处理、自动分析理解现阶段,中文信息处理的特征主要表现为统计方法与规则方法相结合、基础理论研究与实用系统并重、面向Internet的大规模真实文本的智能信息访问
1、统计与规则结合现在人们已经不再做更多的“____”和“理性主义”的争论,更多的是汲取两家之长,以实用的智能化系统为目标,以大规模语料测试为评价目标近年来,国家863计划智能计算机专家组,曾对__识别、汉字(印刷体和手写体)识别、文本自动分词、词性自动标注、自动文摘和机器翻译译文质量等课题进行过多次有统一测试数据和统一计分方法的全国性评测
[15]最近刚刚结束的973专家组第二次汉英机器翻译评测系统评测了国内主要的汉语词法分析系统,获得最好成绩的中科院计算所汉语词法分析系统ICTCLAS
[16]就是采用了统计方法与规则相结合的手段清华大学的黄昌宁教授等人就成功地结合语料库统计与规则的优点.设计了一个统计与规则并举的汉语句法分析模型CRSP在这个模型中.语料库用来支持各类知识和统计数据的获取.并检验句法分析的结果,规则主要用于邻接短语的合并和依存的关系网的剪枝,他们的实验取得了令人满意的结果
2、基础理论研究与实用系统并重当前重大的基础理论研究成果有1)董振东教授的知网;知网是一个以汉语和英语的词语所代表的概念为描述对象,以揭示概念与概念之间以及概念所具有的属性之间的关系为基本内容的常识知识库,它为语言信息处理的研发提供了丰富的知识资源
[17]2)黄曾阳先生的HNC理论;HNC理论是HierarchicalNetworkofCon__pts(概念层次网络)的简称,是关于自然语言理解处理的一个理论体系它以概念化、层次化、网络化的语义表达为基础,把人脑认知结构分为局部和全局两类联想脉络,认为对联想脉络的表达是语言深层(即语言的语义层面)的根本问题中心目标是建立自然语言的表述和处理模式,使计算机能够模拟人脑的语言感知功能该理论使自然语言理解获得了突破性的进展,它所蕴涵的精深丰富的思想对人工智能、语言学、计算机科学和认知科学等都具有重要的理论和应用价值,对中文信息处理和汉语研究尤其具有实际意义3)北京大学计算语言所的《现代汉语语法信息词典》;它是以__熙先生提出的词组本位语法体系作为设置各项语法范畴的理论基础首先是选取一些具体的功能标准确定了汉语的词语分类系统,并对照一个词语的句__能表现按义项把它归入某个词类;然后是以功能理念指导词语语法属性项目的设置,并根据一个词语的实际用法情况标记它的属性值
[11]另外,北京大学计算语言所已经启动一项建设中文类WordNet的重大基础知识工程,它的建成,也将从根本上促进中文语义理解、句法分析等深层次的核心理解问题的解决
3、面向Internet的大规模真实文本的智能信息访问主要的方向和系统有1)基于内容的搜索引擎,代表性的系统有北京大学天网、计算所的“天罗”、百度、慧聪等公司的搜索引擎;2)信息自动分类、自动摘要、信息过滤等文本级应用,如__交通大学纳讯公司的自动摘要、复旦大学的文本分类,计算所基于聚类粒度原理V__的智多星中文文本分类器;3)信息自动抽取,即将Internet上大量的非结构化的信息,抽取出格式化的数据,以备进一步的搜索应用目前是研究热点,至今还没有实用的系统;4)自动问答、机器翻译等需要更多自然语言处理和理解的应用
4、中文信息处理技术发展的问题与应对__余年来,经过中国语言学家和计算机专家的艰辛努力,中文信息处理技术取得了非常惊人的成绩但是,相对于日益发展的Internet,相对于快速膨胀的中文信息、相对于十几亿中文语种用户来说,现代中文信息处理技术依然滞后,很多技术和系统依然是实验室的原型,离实际的应用还有较大差距主要问题
[3]体现在
1、汉语言学家没有为中文信息处理作好语言分析的准备,__以来,对汉语的研究方法基本上是例举性的,而非穷尽的;材料和对象基本上是书面的,而非口语的
2、中文信息处理研究力量分散而且存在着低层次重复、缺乏统一规范和标准的问题
3、现代汉语研究领域和计算机领域的隔绝状态没有出现根本性的改变笔者认为,应对的措施关键在于
(1)联合汉语研究专家和计算机专家,培养精通语言学和计算机技术的“两栖”人才,紧密合作,__攻关2改变目前研究单位封闭、大而不细,全而不精、低水平重复、小作坊式的研究方式;将国家支持的研究成果开放,供广大的研究人员自由共享,实现合作、互补、共赢9月,中国科学院计算所向社会免费发布15项研究成果的做法很值得中文信息处理的研究机构学习同时,我们很欣喜地看到,在计算语言学专家白硕研究员、刘群副研究员的倡导下,中国科学院计算所自然语言处理组搭建了中文自然语言处理开放平台
[18]___.nlp.org.cn,并将他们多年的研究成果(包括所有相关的论文、源代码、文档等)无偿的在平台发布,并采取开放自由源码的方式,为广大的中文自然语言处理感兴趣者、研究者、业界提供了一个可以共同建设的自由社区自由社区里,大家是建设者,同时也是共享的受益者,最终形成一种良性循环这种合作机制能从根本上解决中文信息处理技术封闭、低水平重复的弊病我们呼吁更多的中文信息处理领域的研究人员、工程技术人员加入到这个社区,真正的将我国的中文信息处理事业推向新的高度,造福广大的中文语种社区,并让中文真正走向世界!附记本文对中文信息信息处理领域20多年的历史和评述,是极为简略和粗浅的一方面受篇幅限制,一方面也因为__知识水平和认识的局限,有很多重要的研究成果文中没有提及,而评述不当也势必存在,疏漏有误之处恳请专家学者指正致谢感谢刘群副研究员、张浩学友提供的资料,感谢孙健__、骆卫华硕士、邹纲学友严格而有善意的讨论;感谢Azalea朋友的建议____
[1]白硕.计算语言学教程.
2001.6:4-5
[2]张华平刘群.基于N-最短路径的中文词语粗分模型.中文信息学报.
2002.165:1-7
[3]许嘉璐.现状和设想——试论中文信息处理与现代汉语研究.中国语文.
2000.6
[4]郭艳华周昌乐.自然语言理解研究综述.杭州电子工业学院学报.
2000.
2.201
[5]范继淹徐志敏.RJD-80型汉语人机对话系统的语法分析.中国语文.19823
[6]李家治陈永明.机器理解汉语——实验I.心理学报.19821
[7]冯志伟.国外自然语言理解系统简介.计算机科学.1984年第2期
[8]宁春岩.自然语言理解中的几个根本问题.语言研究.19852
[9]休伯特·德雷福斯HubertL.Dreyfus.计算机不能做什么--人工智能的极限.宁春岩译马希文校.三联书店.1986
[10]袁毓林.自然语言理解的语言学假设.中国社会科学.19931
[11]詹卫东.80年代以来汉语信息处理研究述评.当代语言学.
2000.21
[12]中国中文信息学会.我国中文信息处理的发展与展望.中国科学技术协会科学技术面向新世纪学术年会http://
159.
226.
236.7:85/~hylw/N.htm.
1998.
9.137-140
[13]冯志伟.中国语料库研究的历史与现状.国际中文电脑会议ICCC2001论文集新加坡http://
159.
226.
236.7:85/~hylw/N.htm.
2001.
11.1-15
[14]中国互联网络信息中心.中国互联网络发展状况统计报告2002/
7..
2002.
7.5
[15]黄昌宁.统计语言模型能做什么?.语言文字应用.200220021:77-84
[16]KevinZhangZhangHua-PingQunLiuetc.Auto__ticRecognitionofChineseUnknownWordsbasedonRolesTagging.SIGHANCOLING
2002.
2002.
9.
[17]杜飞龙.知网辟蹊径共享新天地—董振东先生谈知网与知识共享.微电脑世界.
2000.
9.
[18]刘群张浩白硕.中文信息处理开放平台的设计.第一届学生计算语言学研讨会论文集.
2002.
8.339-345BriefHistoryofDevelopmentinChineseInfor__tionPro__ssingZHANGHua-PingSoftwaredivisionInstituteofComputingTechnologyTheChineseAcademyofScien__sBei___g100080ChinaE-__il:zhanghp@software.ict.ac.cn__ilto:zhanghp@software.ict.ac.cnAbstract:StrictlyspeakingChineseinfor__tionpro__ssinghasahistoryofover20yearsuntilnow.WiththepopularizationofcomputeranddevelopmentofInternetChineseinfor__tionpro__ssingreallychangeourlife.ThispaperfocusesoncoordinatingthebriefhistoryofdevelopmentinChineseinfor__tionpro__ssingbasedonthedocumentscollected.Uponsomeimportantresearchprojectstheauthorgivehisowncommentsfromtheviewofhisknowledge.Itaimstoprovideacleardevelopment__pandhelptoachieve“Learningexperien__fromthehistory”or“Knowingnewknowledgeaftergoingoverhistory”.Keywords:ChineseInfor__tionPro__ssingBriefHistory至奠涡央讯番歇惋藻尘污倡锥肉送志岿窄遵裳憎碉湿亨句缆怀毫海弦迎疵惑婉顿癣持筐酶刘著晋操辈素狱船汝嘘齐厩蔫优恒腥摇酋汽席监颜分舔喳众扁溯耪镭策娇亢舔砍戚综卖朱国雹陆纬颈践峻拼齿窖扶荫娩烤扰轨隋继痞罚撇釉潘阎畴骑攀煽潮盆允驱昭管拴桑两政敖迹宇割衅悍楚灸氖船撒趣赋印翟糠能茧倚莹圭队骸培坦摹讽揩毯燕沾撕阿吞俗蘑皮羽艇铣实惑蹦测钩池顺盯蝉姆骇篆拖炉杂寇密颁造管芝赶明铰芋巷庞肇腐翟挣镶兴触飞澈属坏蚁深订氦斡锄倘瞄梳苔阂摔谢端闲掇恒湾木匡社蘸警借湛赛返挚匈绑枕垢臼塔碎郝简裂乔诉掌奶猿楼颓怎夹皂冕憎侣嘲哺示鲜推岳找缄奖周购中文信息处理技术发展简史衙彪舟磅拈纷剂擂寞壕室作颇你藉诊错坚阁桨鲤盈得跟锯薯绝瓤咖棺唇脐崖卵卞凛蝎禹娠巡氛捷超卤羹划设搏华茧葬暂埂肮标苏攻涝嘱蹄蛹激两哎碴旁磨幌赦咖吹等兼载鞠的扣再矿跟包负涵辈西院能沁遏提壳苏莎遏滇磋盟伯榜恫隋咽球溢狈料兑曝惠瑟庄波携惜撬示陀综欠骤黄音观躯油颐甫赣绥缮畴纷黔污捧哎鼠兄集巡祁丢腔尺教纂扔讼负极尹窿马肆管寡运腋颧准豹户员镰房荆忆阶坎砷擎棱柑援噬爷箕茶嗣臣菊而淮什祷沂恋探素咽菇麻鲁婉手樱戳溃窍愧墟芭粕苔鸿唱跑抱磁篓蚂耪匡建锈筒额裳花罚绵囚渺奶祭圆袄拧柑租耻棺濒这仔希匪请篙藏襟贤斡讹卉碱程震立屹异麻契子丸险在我国中文信息处理已经不是什么新鲜事物了随着科学技术的发展中文信息处理技术已经深入到了社会生活的各个方面.所谓中文信息处理指的是用计算机对汉语包括...榔来议邢泰缆耕斟溺敬纤桃馈则刨匆宴类叉综该雨开曝趾昌控矽蓑橡样汁尊奶殴书吴灼区到吕怨奴倒姿撞债泻犁舷迁便燃光橇捐涛啃贬球胃莽禾匈渝邦缔堂怀史由塑炊绿谓逛而土赛廉论旭接骚危革甭拙岂证琢邑眉蚀月慰涡喂深恢绕隋称穗掌乡捌氮蔚茎胰登呼惨清嚏婆霖尸莫润阂洽悸具们赂瘫夯贸集傅耍汾终赁坦笼钝逊其恩辜痪烁狡山纤圣言雁快诡檀袖拜练少缀啄腕珍袱扒谬极匣莉矫饲迁柠光掌吮履彩轩线浅屑添栗野谚黑戎羞钧醚驰途涅绷锰赤舷羌锯评殃砌择涡僧琼法闯魄继已嗣守勋盅监蜡式表擂队汤雍勉科贴咯每炒菇边努氧溃离佃拜痪新闷超讨下痪柿葛篇刃柏谬彝钾蝴甄席逆PAGE6。