如何快速制作大型句库?

现在网络资源丰富,双语资料随处可得,但如何快速地将这些双语语料进行句级的对齐,创建大型的句库(记忆库)?估计有不少的译员是用Trados的WinAlign来对齐的,其实有一款更加高效的绿色免费版的CAT软件(雪人CAT,下载地址http://www.newhua.com/soft/95861.htm)http://www.newhua.com/soft/95861.htm
其句级的双语对齐功能比Trados的WinAlign有过之而无不及。在此与大家分享一下:

1. 中英文分开的TXT文件的对齐处理
例如:我们欲进行对齐的是两个TXT的文本文件,一个是英文,一个是中文,我们希望能将它们一句一句地对应起来,做成句级对齐的记忆库。
01.jpg


在下图雪人的“导入双语文件”窗口中,分别将这两篇文章读入或用【Ctrl+C】、【Ctrl+V】粘贴过来即可。
02.jpg


按确定按钮后,自动对齐工作即刻完成,如下图:雪人已经将这两个文件中的一句中文、一句英文完整地对齐了,而且准确率非常的高。
03.jpg


2. 对含大量软回车的WORD文档的对齐处理
由于排版等其他原因造成在不该断句的地方转行了,即文章中出现许多软回车。如下图,在“One day the”和“daughter”之间因为有个软回车而转行了,若不处理这些软回车,必然会影响对齐的效果。如果一个一个地手工删除软回车,会很耗时。
04.jpg


但雪人可以自动处理这些软回车,在本不该断句的地方自动接上了,如下图:
05.jpg


3. 中英混排的对齐
有时我们会遇到有些文章是中英混排的,它一段中文、一段英文,或者从网页中粘贴下来的,中英文混在一起,实在难以分成一个中文文件、一个英文文件。对处理这样文章,有没有省时省力的方法呢?如下面的2个图:
06.jpg


07.jpg


这种情况你只要按下【Ctrl+C】键复制后,利用雪人的“双语粘贴”就可以自动分开并进行句级对齐了。

4. 直接导入其他CAT软件译稿制作记忆库
雪人还可以直接导入其他CAT软件生产的译稿文件,将它们制作成一一对应的记忆库。目前可以直接导入的是TRADOS和雅信格式的。

5. 自动对齐后的编辑、导出
目前还没有哪个软件能百分百的准确对齐,所以自动对齐后的编辑、修改是否方便也很重要。雪人提供了非常方便的编辑功能,自动对齐后的原文、译文都可以再修改、编辑。
若断句不准确,将光标插入需要断句的地方,然后按回车键,即可断开,按【Delete】可以连接上下两句。当左右两边对齐后,我们按【F9】键,将左右两句锁定,这时会出现一个“√”,表示这两句已经锁定,锁定后即可左右一起移动。对于某些参考价值不大的句子,可以将它删除或按【F4】键不导出,修改好后,利用右键菜单的导出功能即可将句级对齐的记忆库导出,这样就大功告成了!
08.jpg


它操作简单,对齐效果准确,而且对齐处理后不会打乱原来的行文顺序。无论是纯文本、还是WORD文件其对齐效果一样理想;更妙的是雪人的“双语粘贴”,可以自动区分中英文混排的文章,这个非常的有用。有了这个双语对齐工具,创建百万级的记忆库指日可待!
 
回复: 如何快速制作大型句库?

真像楼上说的要“收费”? 今天俺又想实话实说,不怕得罪人:D:rolleyes:
WinAlign小捣弄还行,大量对齐不实用,地球人都知道。所以,雪人的对齐功能不用拿trados 的Winalign 说事。你的其它高级功能俺不懂,但仅就对齐功能而言,你这个东东看起来很美,其实意义真不大。搞一点北大“柠檬水”差不多的对齐工具还有点意义。

 
回复: 如何快速制作大型句库?

呵呵,有“免费版”的,功能少些;但“标准版”的价格不菲。:eek:
 
回复: 如何快速制作大型句库?

或“另存为”.stp文件,无法用text类工具读取。
 
回复: 如何快速制作大型句库?

免费版的导出格式是STM格式,标准版的可以将句库导出其他的格式。
 
回复: 如何快速制作大型句库?

真像楼上说的要“收费”? 今天俺又想实话实说,不怕得罪人:D:rolleyes:
WinAlign小捣弄还行,大量对齐不实用,地球人都知道。所以,雪人的对齐功能不用拿trados 的Winalign 说事。你的其它高级功能俺不懂,但仅就对齐功能而言,你这个东东看起来很美,其实意义真不大。搞一点北大“柠檬水”差不多的对齐工具还有点意义。

得罪人说不上,因为各人有各人的看法,大家一起讨论,没关系!至于雪人的对齐功能到底有没有用?其对齐效果及处理速度如何?这个没有必要争论,反正有绿色免费版,一试便知!事实胜于雄辩!
 
回复: 如何快速制作大型句库?

真像楼上说的要“收费”? 今天俺又想实话实说,不怕得罪人:D:rolleyes:
WinAlign小捣弄还行,大量对齐不实用,地球人都知道。所以,雪人的对齐功能不用拿trados 的Winalign 说事。你的其它高级功能俺不懂,但仅就对齐功能而言,你这个东东看起来很美,其实意义真不大。搞一点北大“柠檬水”差不多的对齐工具还有点意义。

北大的哪些资源是免费的?即使是研究用,也要掏“天价”的费用。
 
Back
顶部