Latest activity

  • K
    Key 回覆主题: 工具求助
    谢谢答复!
  • A
    anrea 回覆主题: 工具求助
    你可以先用简单的正则表达式或脚本处理提取出的文本,过滤掉那些看起来不像对话的引语。虽然不能完全过滤掉,但可以去除很多明显的非对话内容,从而节省你手动检查的时间。
  • ArthurW
    非常感谢许教授
  • 鹿
    鹿倾文 发布新主题
    各位老师和同学生们,你们好!我想问下有开源的留学生中介语作文语料的库吗?我看全球中介语语料库上好像是不能下载语篇获得文本的,谢谢各位老师和同学们解答啦~:)
  • K
    感谢许教授的分享!
  • xujiajin
    Crown和CLOB语料库从这里可以下载:https://corpus.bfsu.edu.cn/Crown_CLOB.zip 更新的CROWN2021,也可以下载:https://corpus.bfsu.edu.cn/CROWN2021.zip...
  • K
    感谢回复!
  • ArthurW
    一般希望库越大越好,但实际研究中从特别大的库中得到的初步检索结果数量会超出心理预期,此时反而会希望库“不要太大”。对初步结果进行抽样,所谓的thinning,其实是无奈之举,毕竟无论多大的库本质上都是样本,从样本的检索结果中再抽样,无疑会放大遗漏信息的机率。...
  • K
    感谢许教授的耐心解答!
  • xujiajin
    ANC因种种原因未能真正建成。 若想研究英语新闻,当前在线版的NOW corpus(News on the Web)无疑是最全面,体量也是最大的。目前为232亿词次。 https://www.english-corpora.org/...
  • oscar3
    各位,和绍兴文理学院外国语学院老师了解了一下。出现访问跳转的原因是网站使用了Flash建站。在访问的时候,一般的浏览器访问出现跳转。理想的访问方法是安装Adobe Flash Player (https://www.flash.cn/download-wins)
  • K
    Key 发布新主题
    求助各位吧友,最近在做新闻语料的研究,需要ANC,Brown,BNC这类的语料库文件,但不过好多分享的资源都已经失效了。
  • A
    anrea 回覆主题: 求语料库相关练习
    试试 BYU 语料库网站和 Sketch Engine 的免费练习工具。Tony McEnery 的《语料库语言学:方法、理论与实践》也提供了不错的备考练习。
  • xujiajin
    xujiajin 回覆主题: 工具求助
    有一定的人工筛选工作量也属正常。如果量实在过大,可先随机抽取一定行数,之后再筛选。 随机抽取工具,可用:https://corpus.bfsu.edu.cn/BFSU_Text_Randomizer2.zip
  • xujiajin
    xujiajin 回覆主题: 汉语口语语料库
    北语的全球库里应该有:https://qqk.blcu.edu.cn/#/login...
Back
顶部