计算语言学的成果

来自计算思维百科
跳转至: 导航搜索

计算语言学可以说是计算机和语言学相结合的产物。这种结合已经得到丰硕的成果,除了上面说到的那些应用课题以外,还表现在对语言学理论和方法的影响上。语言的定义扩展了:语言已不仅是人类重要的交际工具,而且也是人机之间的交际工具。为了满足计算机加工的要求,计算语言学最大的特点就是要求语言的形式化,因为只有形式化,才能算法化、自动化。根据这项要求,制定出一系列面向语言信息处理的自动分析方法,其中包括预示分析法、从属分析法、中介成分体系、优选语义学、扩充转移网络、概念从属论等等。这些自动分析方法,已在机器翻译和自然语言理解的系统中得到应用,并证明有效。语言的形式化是分层进行的。语法的形式化相对来说比较简单,人们已做了不少工作;语义的形式化则是一个复杂的问题,人们进行的工作还不多。而语义形式化问题解决得好坏,将大大影响语言自动加工的成效。因此,继续发掘行之有效的形式结构分析方法和语义分析方法,研究它们之间的关系,以及探讨它们在不同系统中各自使用的限度,这是计算语言学中的重点研究课题。

第五代计算机要求人们赋予它听觉(识别口语)和更强的视觉(自动识别文字),赋予它说话能力(合成言语)和听写能力(语音打字),同时还要求人们赋予它理解自然语言并把某种(或多种)自然语言翻译成另一种(或多种)自然语言的能力。这样,计算语言学工作者又需要提供各种物理参数、语言概率性等方面的数据和各种应用软件,以便同有关的专家、工程师一道共同解决为计算机增添“翅膀”这个重大课题,使之真正成为“万能的智能机器”。

完成上述任务,必须靠整个语言学界的努力和合作。尽管面向机器的语言学有其独特性,在许多方面都要另起炉灶,但是实践证明:传统语言学的基础雄厚与否对解决一些新任务有很大关系,例如传统的英汉对比语言学研究得好,就会给英汉机器翻译提供很多方便。从这个意义上讲,计算语言学只有很好地吸取传统语言学的成果并加以改造,才能得到迅速发展。