模糊翻译(Fuzzy translation)是一种自动机器翻译的应用技巧,利用了模糊逻辑的方式,为有歧义的词语提供可能性较高的搭配;并利用模糊匹配的方式为有多个分词可能的句子作正确的分词。模糊翻译已应用机器翻译当中。
简介歧义作为一种常见的语言现象,是指一个语言形式具有两个或多个以上的意义,或在结构上可做两种或多种的分析,歧义存在语言的各个层面,即词汇层面、语法层面、语音层面和余勇层面1。模糊翻译是一种基于模糊逻辑方法的用于处理机器翻译中语义歧义的方法。主要是为了提高不同语言之间自动机器翻译的准确性。
模糊逻辑模糊逻辑是处理部分真实概念的布尔逻辑扩展,或是研究不确定性(特别是模糊性)推理与知识表示的逻辑基础及其应用的学科。主要包括三个方面:狭义模糊推理、广义模糊推理与模糊(近似)推理。狭义模糊推理是模糊集理论乃至模糊数学的逻辑基础;广义模糊推理为不确定性的处理提供较为完整的逻辑框架;模糊逻辑可应用于智能化电器产品的开发与工业过程控制,这些实际应用的理论基础是模糊推理。
经典逻辑坚持所有事物(陈述)都可以用二元项(0或1,黑或白,是或否)来表达,而模糊逻辑用真实度替代了布尔真值。这些陈述表示实际上接近于日常人们的问题和语意陈述,因为“真实”和结果在多数时候是部分(非二元)的和/或不精确的(不准确的,不清晰的,模糊的)。真实度经常混淆于概率。但是它们在概念上是不一样的;模糊真值表示在模糊定义的集合中的成员归属关系,而不是某事件或条件的可能度(likelihood)。要展示这种区别,考虑下列情节:Bob在有两个毗邻的屋子的房子中:厨房和餐厅。在很多情况下,Bob的状态是在事物“在厨房中”的集合内是完全明确的:他要么“在厨房中”要么“不在厨房中”。但Bob站在门口的时候怎么办呢?它可被认为是“部分的在厨房中”。量化这个部分陈述产生了一个模糊集合成员关系。比如,只有他的小脚趾在餐厅,我们可以说Bob是0.01“在厨房中”。只要Bob站在了门口,就没有事件(如抛硬币)能解决他完全的“在厨房中”或“不在厨房中”。模糊集合是基于集合的模糊定义而不是随机性。
模糊逻辑允许在包含0和1的它们之间集合成员关系值,同于黑和白之间的灰色,在它的语言形式中,有不精确的概念如"稍微"、"相当"和"非常"。特别是,它允许在集合中的部分成员关系。
机器翻译机器翻译是利用计算机实现从一种自然语言到另一种自然语言的自动翻译技术。简单来说,机器翻译是通过将一个自然语言的字辞取代成另一个自然语言的字辞。借由使用语料库的技术,可达成更加复杂的自动翻译,包含可更佳的处理不同的文法结构、辞汇辨识、惯用语的对应等。机器翻译方法公认可以分为基于规则的机器翻译和基于语料库的数据驱动的机器翻译。基于规则的机器翻译由词典、规则库以及各类知识库构成知识源;基于语料库的数据驱动的机器翻译以语料应用为核心,进一步分为统计机器翻译、基于实例的机器翻译和翻译记忆。从人为的翻译来看机器翻译,翻译的过程可被细分如下:
解译来源文字的文意
重新编译此解析后所得的文意至目标语言。
在这看似简单的步骤之后其实是复杂的认知操作。要能解译来源文字的完整意义,一个译者必须能够分析与诠释整段文章的所有特征,必须能够深度的了解其文法、语义、语法、成语等等,相当于了解来源语言的文化背景。译者同时也必须兼备目标语言相同深度的知识。
于是,这对机器翻译便是一项挑战,即:要如何设计一个程式使其能够如同真人一样的“了解(认知)”一段文字,并且能够“创造”一段好似真人实际写作出来的目标语言的文字。
本词条内容贡献者为:
王沛 - 副教授、副研究员 - 中国科学院工程热物理研究所