利用office手工制作语料库/TM(翻译记忆)

论坛新人求教。
本人新升的专硕,刚拜在语料库方向导师门下。
之前有过工作经验。接触过CAT。
直觉上感觉语料库应该与CAT的TM有一定相关性。
之前也从其他论文中看到使用TRADOS制作语料库的方法。
Trados里有个winalign句段对齐组件。
但手工制作起来更为方便,也更为有趣。
现分享这个方法。见链接百度文库文档或随带附件:http://wenku.baidu.com/view/7873cf0c52ea551810a68775.html
不知这个方法对于制作语料库而言是否可行?有多大价值?
 

附件

  • 如何制作翻译记忆(TM)-老西手工制作法(1).pdf
    318 KB · 浏览: 56
回复: 利用office手工制作语料库/TM(翻译记忆)

论坛新人求教。
本人新升的专硕,刚拜在语料库方向导师门下。
之前有过工作经验。接触过CAT。
直觉上感觉语料库应该与CAT的TM有一定相关性。
之前也从其他论文中看到使用TRADOS制作语料库的方法。
Trados里有个winalign句段对齐组件。
但手工制作起来更为方便,也更为有趣。
现分享这个方法。见链接百度文库文档或随带附件:http://wenku.baidu.com/view/7873cf0c52ea551810a68775.html
不知这个方法对于制作语料库而言是否可行?有多大价值?

平行语料库用手工对齐是一个基础工作,少量的对齐工作手工可以。但是,对齐量大的情况下,手工就吃不消了。
 
回复: 利用office手工制作语料库/TM(翻译记忆)

平行语料库用手工对齐是一个基础工作,少量的对齐工作手工可以。但是,对齐量大的情况下,手工就吃不消了。

恩,谢谢。导师也是这样告诉我的。
 
回复: 利用office手工制作语料库/TM(翻译记忆)

恩,谢谢。导师也是这样告诉我的。

补充一点,创建翻译记忆库的目的在于“有用”,即能够发挥语料的作用,为此,对齐语料的时候,对应单位不宜过长。而用于翻译研究的对应单位考虑的是对应单位之间的合理性。比如,一个跨越好几行的,很长的汉语句子,翻译成6、7个英语句子。从翻译研究角度出发,对应关系为1:7,如果是做翻译记忆库,重在匹配,就没有必要遵循这样的原则。另外,翻译记忆库有一个去重的步骤,那些重复的句子对对于翻译记忆库是没有意义的,但是,在翻译研究中,这种重复的句子对却不能去掉。
 
Last edited:
回复: 利用office手工制作语料库/TM(翻译记忆)

使用文本编辑利器EmEditor,结合强大的正则表达式的查找和替换功能,可以快速制作满足Wordfast和Trados需要的TM。我在给本科生上 计算机辅助翻译 课程,要求每个学生都掌握这个方法,效果很好。
 
回复: 利用office手工制作语料库/TM(翻译记忆)

使用文本编辑利器EmEditor,结合强大的正则表达式的查找和替换功能,可以快速制作满足Wordfast和Trados需要的TM。我在给本科生上 计算机辅助翻译 课程,要求每个学生都掌握这个方法,效果很好。

正则表达式很强大。
 
回复: 利用office手工制作语料库/TM(翻译记忆)

使用文本编辑利器EmEditor,结合强大的正则表达式的查找和替换功能,可以快速制作满足Wordfast和Trados需要的TM。我在给本科生上 计算机辅助翻译 课程,要求每个学生都掌握这个方法,效果很好。

老师能不能在详述啊 非常感谢
 
回复: 利用office手工制作语料库/TM(翻译记忆)

1.研究wordfast的tm格式;
2.在网络(如百度文库)里查找双语对照的资料。譬如:
流动资产 Current assets
货币资金 Cash and cash equivalents
现金 Cash
银行存款 Cash in bank
其他货币资金 Other cash and cash equivalents
外埠存款 Other city Cash in bank
3.使用正则表达式,按照TM格式一次性在中文、英文前面加需要的内容。如下:
20130908~101742 jk 4 ZH-CN 流动资产 EN-US Current assets EL LS
4.把wordfast TM里的文件头信息加入制作的TM前;
5.保存。再用记事本打开,另存为相同文件,改编码为ANSI;
6.成功!
 
回复: 利用office手工制作语料库/TM(翻译记忆)

如果想把wordfast TM 转换为Trados可用的TM,参照以下步骤:
1.将Wordfast TM 导出成TMX格式;
2. 把字符编码改为Unicode格式;
3.打开trados workbench, 导入TM。格式选择“.tmx1.1”
4.成功!
 
回复: 利用office手工制作语料库/TM(翻译记忆)

此方法不仅适用于短语类的TM,双语新闻、双语小说等,一样可以。
 
回复: 利用office手工制作语料库/TM(翻译记忆)

另外,欢迎访问本团队开放的汉英政治平行语料库:
pcpt.cslg.cn
 
回复: 利用office手工制作语料库/TM(翻译记忆)

使用文本编辑利器EmEditor,结合强大的正则表达式的查找和替换功能,可以快速制作满足Wordfast和Trados需要的TM。我在给本科生上 计算机辅助翻译 课程,要求每个学生都掌握这个方法,效果很好。

可否简要说明一下实现步骤?
 
Back
顶部