查看完整版本 : Parallel Corpora和Balanced Corpora
parallel corpus 和balanced corpus之间有什么区别?翻译过来是否前者是平行语料库,后者是平衡语料库?谢谢百忙之中回应!
看来网上大侠们都睡觉去了,我来回答你的问题。
Parallel Corpora涉及不同语言的语料,通常是翻译材料放在一起。
Balanced Corpora涉及不同类型的语料,例如书面语,口语及其细类,而不是
偏向某一(些)类。
xujiajin
2005-07-14, 12:09 AM
以下是引用 清风出袖 在 2005-7-13 19:57:04 的发言:
parallel corpus 和balanced corpus之间有什么区别?翻译过来是否前者是平行语料库,后者是平衡语料库?谢谢百忙之中回应!
你的译文是对的。
parallel corpus通常是由双语或多语的对应语料构成,常常是翻译文本构成。例如:Babel English-Chinese Parallel Corpus (http://bowland-files.lancs.ac.uk/corplang/babel/babel.htm)。平行语料库常被用做对比和翻译研究之用。
balanced corpus主要是指其语料的取样上是均衡的,有代表性的。这种语料可以用作得出有关某种语言特性的一般性的结论。
例如:Lancaster Corpus of Mandarin Chinese
http://bowland-files.lancs.ac.uk/corplang/cgi-bin/conc.pl
以及
Academia Sinica Balanced Corpus of Modern Chinese
http://www.sinica.edu.tw/SinicaCorpus/
xiaoz
2005-07-14, 12:09 AM
A parallel corpus is composed of texts which are translations of each other in different languages. Balance is associated with corpus representativeness.
翻译过来前者是平行语料库,后者是平衡语料库.
xujiajin
2005-07-14, 12:14 AM
Richard我俩又有点打架了。说明我俩还是很认真负责的。
我刚发上去,发现你的也来了。
xiaoz
2005-07-14, 12:27 AM
Have just come back from the University.
I will not be available July 14-17 during the conference of Corpus Lingusitics 2005 in Birmingham.
xujiajin
2005-07-14, 09:43 AM
Waiting for the latest news from you about the CL2005 conference.
xujiajin
2005-07-14, 10:51 PM
力所能及、互通有无。
vBulletin® v3.7.4,版权所有 ©2000-2009,Jelsoft Enterprises Ltd.