请问将China Daily网站Bilingual News栏目收录入平行语料库的相关信息

smyle

Collector
目前因项目需要下载了一年的中国日报双语新闻,打算作为平行语料库的一部分,在下载过程中发现一年之前的新闻已无法以常规方式从网站上检索到并下载。
因此想问一下各位坛友是否了解这方面的情况,是否已有人收集整理过其中的文章建库,所收集的新闻属于哪个时间段,是否能够共享?
thx in advance!
 

laohong

管理员
Staff member
回复: 请问将China Daily网站Bilingual News栏目收录入平行语料库的相关信息

China Daily里双语的基本上是英文媒体的新闻翻译成汉语,而联合早报上的可就很多是中文原文翻译成英文的。两个可以互补。
http://www.zaobao.com/bilingual/bilingual.html
 

smyle

Collector
回复: 请问将China Daily网站Bilingual News栏目收录入平行语料库的相关信息

非常感谢两位 这么快就得到回复真是心理热乎乎的
昨天发贴后用Google高级检索功能把China Daily部分研究了一下 欣喜地发现2001 02 03 04都有archive(其中04年的不全,貌似缺8月份之后)地址在http://www.chinadaily.com.cn/english/lt/lt_news_bilingual.html 页面右方

刚才又依照Oscar3所说 发现果然能追溯到05年的11月 我原来下载的界面的确不是这个 谢谢指点~

laohong提到的联合早报链接 我也早在您之前的帖子看到并下载了 在此当面感谢一下 ^_^

不知道别的哪些网站还有高质量双语译文?
 

smyle

Collector
回复: 请问将China Daily网站Bilingual News栏目收录入平行语料库的相关信息

那个链接貌似是因为和谐需要被封了
 

oscar3

高级会员
回复: 请问将China Daily网站Bilingual News栏目收录入平行语料库的相关信息

Yes, many websites are not accessible directly from mainland China. Why not use proxy to escape the blockage?
 

smyle

Collector
回复: 请问将China Daily网站Bilingual News栏目收录入平行语料库的相关信息

With the help of proxy software (Tor), I have downloaded all the bilingual news @freexinwen.

Praise oscar3~

Praise Tor~

^_^
 

jjm

初级会员
回复: 请问将China Daily网站Bilingual News栏目收录入平行语料库的相关信息

也是因项目需要,需下载了数年的中国日报新闻,但是以前的新闻已无法以常规方式从网站上检索到并下载。想问一下各位是否了解这方面的情况,我在哪里可以找到以前的内容?谢谢!
 

smyle

Collector
回复: 请问将China Daily网站Bilingual News栏目收录入平行语料库的相关信息

补充一个
中国国际广播电台网站 也有许多双语文本 虽部分与China Daily重复
除了其网站给的回溯检索外好像有两个检索入口 有一个只能通过过去的页面链接过去

较好的方法是应用google的高级搜索进行全站检索 之后再用flashget等软件集中下载
 
顶部