搜寻结果

  1. xusun575

    Paraconc附码检索另辟蹊径

    回复: Paraconc附码检索另辟蹊径 谢谢老贺, 把遇到的问题和问题解决的结果拿出来分享,可让他人在思考中受益.好!:D
  2. xusun575

    陈琳老师,您好!好久没有上corpus4u了.今日才见到留言,特回复...

    陈琳老师,您好!好久没有上corpus4u了.今日才见到留言,特回复. 程乙本和戚序本汉英双版本分别对齐《红楼梦》语料已经上传,网上可检索.欢迎使用,并希望提出意见和建议.并非客套,确实希望使用中发现问题. 孙鸿仁
  3. xusun575

    求助:.xls转换成.txt文件时多出了双引号,如何去掉?

    回复: 求助:.xls转换成.txt文件时多出了双引号,如何去掉? 问题解决了没有?
  4. xusun575

    求助:.xls转换成.txt文件时多出了双引号,如何去掉?

    回复: 坚决反对工具理性 畅所欲言,好好说理,时代变了,管好自己,“坚决反对...”大可不必。:D
  5. xusun575

    求助:.xls转换成.txt文件时多出了双引号,如何去掉?

    回复: 求助:.xls转换成.txt文件时多出了双引号,如何去掉? 提供的文本记录太少了.至少应该有三条.我是不会侵权滴:D. 但是,如果你的纪录全是一个field,问题就更简单了:其规律就是第一个引号前和第二个引号后均有换行符即\n 或word ^p(通配符检索状态下为^13),用任一款文本处理工具(或word)的"查找替换"都可以解决,即删除掉引号,,保留换行符即可. 如果多个field,解决思路是同样的,也是同样的简单. 如果还不能解决,你给我用email多发几条纪录,我给你搞个小工具吧.
  6. xusun575

    紧急求助:正则表达式提取

    回复: 紧急求助:正则表达式提取 好象没那么复杂. 发一个样本吧.让我看看.
  7. xusun575

    求助:.xls转换成.txt文件时多出了双引号,如何去掉?

    回复: 求助:.xls转换成.txt文件时多出了双引号,如何去掉? 引号应该是有规律的.你发一个样本上来让我看看吧.解决应该没有问题
  8. xusun575

    求助:.xls转换成.txt文件时多出了双引号,如何去掉?

    回复: 求助:.xls转换成.txt文件时多出了双引号,如何去掉? 用文本处理工具(或用word), 作查找(双引号)替换(为空)即可
  9. xusun575

    对齐语料提取,除了winalign,还有别的好用的工具吗?

    回复: 对齐语料提取,除了winalign,还有别的好用的工具吗? 俺又要得罪人啦: 你是来这里推销雪人,还是真的挺书生气的? 你用过"柠檬水"水软件吗?你了解Mandel的双语语料对齐的设计思路和用途吗? 别给雪人吹牛了, 有机会不用这两位高人出山, 我们就以手工方式和你的雪人PK一下, 如何?:D
  10. xusun575

    对齐语料提取,除了winalign,还有别的好用的工具吗?

    回复: 对齐语料提取,除了winalign,还有别的好用的工具吗? 对少量的完整文本作双语对齐,采用软件辅以人工校对是可以的,但对大批量,目前市面上的软件都是"浮云".即使花钱购买"商业软件"也无法一劳永逸地处理大批量的文本. 再高深的理论(如本帖内的附件"双语语料库段落重组对齐方法研究.pdf" ), 目前似乎仍无法解决双语完整文本句对齐的实际问题. 对齐只是简单劳动.若对完整文本双语对齐感兴趣或有需要,欢迎来绍兴这个小地方交流一下. PS: 需要说明的是,北大有一款(柠檬水)软件,去年曾在本坛秀了一下,非常棒:能对齐的留着,无法对齐的就扔了...
  11. xusun575

    送虎年-《红楼梦》《西游记》《三国演义》都有了。

    回复: 送虎年-《红楼梦》《西游记》《三国演义》都有了。 “保存检索结果”提议很好,谢谢,应该没有问题。
  12. xusun575

    请问如何使用语料库查询英语结构的例子

    回复: 请问如何使用语料库查询英语结构的例子 按照现有的POS体系,SVOC结构查询无解。
  13. xusun575

    送虎年-《红楼梦》《西游记》《三国演义》都有了。

    回复: 送虎年-《红楼梦》《西游记》《三国演义》都有了。 谢谢关注,C友提的要求和建议偶都记在心里啦. P.S. 借回复灌水,让这个帖子浮上去:D
  14. xusun575

    求:熊文新博士主讲的"双语文本的对齐与检索"的材料.

    回复: 求:熊文新博士主讲的"双语文本的对齐与检索"的材料. 谢谢熊博士提供如此详细的回答,您的两篇大作我早已拜读了,收获良多.尽管如此,仍希望您在方便时,能将讲座的PPT发给我.再谢. 我的邮箱:xusun575@126.com
  15. xusun575

    【国家现代汉语语料库】的新检索界面Chinese National Corpus

    回复: 【国家现代汉语语料库】的新检索界面 非常棒,尤其是检索内容允许下载,很大气!
  16. xusun575

    预告:迎虎年,绍兴文理学院-《红楼梦》汉英平行语料库即将网上发布

    回复: 预告:迎虎年,绍兴文理学院-《红楼梦》汉英平行语料库即将网上发布 《红楼梦》《西游记》《三国演义》都有了,还有其它许多共分享。欢迎建议与意见。
  17. xusun575

    送虎年-《红楼梦》《西游记》《三国演义》都有了。

    如题。 corpus.usx.edu.cn 需要说明的是: 《水浒》只是部分,因版本问题有点卡壳了。 《红楼梦》是双底本(戚序本与程乙本)VS双译本(Yangs and Hawkes) 《鲁迅小说》(完全版)现不开放,因有人对这个资源太不友好。:p(其实离开我们的界面并没有什么用处) 其它资源自己看看吧,好东西自己去找找,喜欢就行。真诚建议、口水和拍砖,唯如是,我们方能进步。 大世界版面顺便也改了一下。内容在增添中。检索方式提升已经进入议程。欢迎C友给建议。以后定会有更多的分享。 感谢我们的团队,大世界现在有了点模样。两年建成没问题,但以后完善的工作量会更大。
  18. xusun575

    帮助提取段落的最后一个句子

    回复: 帮助提取段落的最后一个句子 解决的方法应该有两种: 1.用正则非贪婪式提取"<s>.....</s> </p>+段落符"(我没有试) 2.用word高级查询方法(选中'使用通配符'),可分三步: a.查找"(\<\/s\>) (\<s\>)" 替换为"\1^p\2",即在"</s> <s>"其中间加入段落标记(硬回车); b.再查找"\<s\>[!§-¥^13]@\</p\>^13",替换为"^&"(字体红色). c.查找并删除"非红色"任意字符,留下即是你要提取的内容. word确实很强大,三言两语说不清楚.结果见附件吧.
  19. xusun575

    [跪谢]国家语委现代汉语语料库 请问如何下载整篇文章

    回复: [跪谢]国家语委现代汉语语料库 请问如何下载整篇文章 1.有骨气,挺起腰, 不论干什么都不要跪着:D; 2.句对齐平行语料库只能是"一句一句"的; 3.需要"下载整篇的文章"这里是不可能的;若需要,可向库主人问问,但我想一般情况下,不论是站还是跪,非特别关系,都是不会答应的.
  20. xusun575

    急求解:对BNC的标注语料如何纯净化?

    回复: 急求解:对BNC的标注语料如何纯净化? the whole 500 or more can be conveniently detagged by using the same way as i did for your 21 files.
Back
顶部