计算语言学的基本内容

来自计算思维百科
跳转至: 导航搜索

计算语言学发展到今天,按其工作性质和复杂程度,可以归结为以下3个方面:①自动编排:这是计算机最擅长的工作,也是计算语言学中最成熟的部分。对各种语言素材进行统计、分类、排序,编辑各种词表、索引和词典,建立语料库、术语数据库等等,已经得到广泛运用。由于这些技术已经相当成熟,因而已有现成的软件包提供服务。②自动分析:这是一种较复杂的语言自动处理。这种自动分析系统是根据事先存入计算机内的特定语言信息进行工作,目的在于得到预先规定的结论,例如让计算机查词典或进行语法测试,均属此类。若结论有误,就证明词典或语法不够完备,需要对原先的数据或规则加以修订或补充。这类系统一般尚处于试验研究阶段。③自动研究:这是一种更复杂的语言自动处理。这种自动研究系统是根据计算机内存储的一般语言信息进行工作,借助统计、比较、类推等手段,得出自己推断的结论。人工智能研究中的某些自然语言理解系统正在朝这方面努力,但目前还没有比较成熟的研究成果。