对大多数用户来说,能用就行,毕竟搞明白制作过程也是需要一些时间的。当然,如果对技术本身感兴趣,或是想处理自己的语料,花点时间研究一下也是值得的。恭喜LaoHong,恭喜,但是我只是能用了,却看不懂事怎么做到的,能不能说说制作方法?谢谢!
请问,注册收费么?还是免费?测试版在这里发布也大约有一年半了,细心的朋友也许已经发现,改进版悄然运行一段日子了(有些方面还得抽空更新),目前主要改动有这样两点:
1、数据大小:以前的版本只放了6个章节做演示,现在的数据是全部120回汉语本 + 霍克思的120回英译本 + 杨宪益夫妇的120回英译本。
2、用户限制:所有用户需要登录才能使用,不过普通用户直接点击guest即可登录,但是只能查看检索结果的前两页。注册用户则可以不受此限制。
注册不收费,但不是每个申请者都会得到full access,因为这取决于申请者提供的研究说明。简单的写成:for research, for study, corpus lover等等,很遗憾地说,那就没必要注册了,建议使用Guest帐户就可以了。希望大家能理解这样做的苦衷。请问,注册收费么?还是免费?
在laohong的 红楼梦 检索页面里,左边填我,同时右边填I, 敲Search就会得到你要的结果。很感兴趣如何输入一种文字的搜索词会自动调出双语的语境来?就是说输入I, 搜索后“我”和"I"各自的例句同时对齐调出??——正在研究我学生口译,所以很急需。可点拨否??
Hongloumeng Parallel Corpus Prototype Query Package
红楼梦汉英翻译平行语料库检索平台
忙了几天,终于把这个检索平台搞出来了,希望大家测试后多提宝贵意见!意见可以留在这里,也可以发到我gmail的邮件里:@前是corpus.laohong,@后是gmail.com。
几点说明
1、测试数据:
这里供测试的数据包括曹雪芹原文的第一、二、三、四、五、六、八、九、十、十一、十二和十三这12个章节;以及上述12个章节的霍克斯的英语译文和上述12个章节的杨氏夫妇的英语译文。目前的测试数据还没有乔利(Joly)和帮赛尔(Bonsell)的。
2、检索方法:
可以分别检索汉语或者英语,也可以同时检索两种语言。作者也可以单独选择霍克斯或者杨氏,或者全选。检索词语或短语时,可以使用通配符,如?(英文问号)或*等。例如,好?可以检索到好人、好处等;the*可以检索到they,there等。
3、检索选项:
可以用鼠标选择要检索的章节、句子特征等信息。按住ctrl键同时用鼠标点选,可以同时选择多个选项。重新选择,请使用Reset按钮。
4、句子语言特征:
由于标注的语料未经整理,句子的语言特征只供参考。注意,如果同时选择某些英汉句子特征去检索的话,搜寻结果可能为零。
这里是测试链接。
谢谢!一点说明:你帖子里引用的内容是很早以前的,现在整个语料库都可以检索,只是普通用户只能看到首两页搜索结果,但这对大多数人来说也已经足够了。如哪位有特殊要求请与本人直接联系。Laohong laoshi,
Millions of thanks for your effort and generous sharing.