回复: 刘泽权《红楼梦》句对齐标注问题求解
《红楼梦》中英文语料库是用MMAX工具,对文本进行的人工对齐与标注,所以xusun575的疑惑也就不存在了。换句话说,利用语料库工具进行自动对齐与标注的问题并没有在《红楼梦》中英文语料库中得到解决。
英文译本中的句子大部分是与中文文本一一对应的,所以汉英句子间的对应大部分为一对一的形式,但是也有很多一个汉语句子对应两个或多个英语句子、两个或多个汉语句子对应两个或多个英语句子的情况。因此,实际生成的对应句子集存在以下几种形式:一对一、一对多、多对一和多对多的对齐模式。论文因篇幅所限,所以许多示例都删掉了。