搜寻结果

  1. xujiajin

    北外语料库团队利用ChatGPT开发的语料库软件及开发过程视频展示

    您可关注雷蕾老师开发的Chinese Readability工具:AlphaReadabilityChinese 1.0 https://github.com/leileibama/AlphaReadabilityChinese/releases/tag/AlphaReadabilityChinese
  2. xujiajin

    AntConc中n-gram使用求助

    未见有比较好的去处长短词块间重复计数的方法。 自然语言处理领域似乎不大理会这一问题。 作为语言学研究者,一般会根据提取出的词块进行手工剔除,舍弃其中语法语义不完整的词块,是否删除具有包含关系的词块,也可一并考虑。
  3. xujiajin

    求助!《红楼梦》汉英平行语料库

    目前线上的确无可用《红楼梦》汉英平行库,你可考虑其他语料。《红楼梦》翻译研究较多,选题不易出新,也难有新见。
  4. xujiajin

    老师们好,请问哪里可以找到2014年至今的外交部例行记者会双语语料库吗

    历年例行记者会均在外交部官方网站。 你设定时间范围进行检索即可获取。 见截图说明。 https://corpus.bfsu.edu.cn/briefings.png
  5. xujiajin

    老师们好,请问哪里可以找到2014年至今的外交部例行记者会双语语料库吗

    这里有2017年至2021年的数据:http://www.nlpir.org/wordpress/2021/10/11/%e4%b8%ad%e5%9b%bd%e5%a4%96%e4%ba%a4%e9%83%a8%e4%be%8b%e8%a1%8c%e8%ae%b0%e8%80%85%e4%bc%9a%e8%af%ad%e6%96%99%e5%ba%93/
  6. xujiajin

    有没有计算STTR较好的测算软件

    谢谢ArthurW的分享。有关MSTTR和MATTR,可见https://cran.r-project.org/web/packages/koRpus/koRpus.pdf 的66页和67页。 MSTTR (Mean Segmental Type-Token Ratio): (1) segments the text into fixed-length segments (e.g., 100 words per segment). (2) For each segment, the TTR is calculated as the ratio of unique words...
  7. xujiajin

    老师们好,请问哪里可以找到2014年至今的外交部例行记者会双语语料库吗

    https://www.fmprc.gov.cn/fyrbt_673021/jzhsl_673025/index.shtml 外交部官网都有。页面顶端English栏目下可找英文版。
  8. xujiajin

    Corpus linguistics 2040: Which data, which methods, which models?

    The workshop is jointly organised by the English Department of the University of Freiburg and the Institut für Deutsche Sprache (IDS) in Mannheim and, as a scoping workshop, designed to explore the major empirical, methodological and conceptual challenges facing our research community. Although...
  9. xujiajin

    各位老师您好,可以求一份LCMC语料库完整的词表吗?

    你可以用LCMC的在线版本生成一个词表:http://114.251.154.212/cqp/lcmc2/ 账号:test 密码:test 另外,你也可以下载更新的汉语语料库,生成参照词表: -ToRCH2009 Corpus (ToRCH2009现代汉语平衡语料库) https://corpus.bfsu.edu.cn/ToRCH2009.zip -ToRCH2014 Corpus (ToRCH2014现代汉语平衡语料库) https://corpus.bfsu.edu.cn/ToRCH2014.zip -ToRCH2019 Corpus...
  10. xujiajin

    有没有计算STTR较好的测算软件

    https://corpus.bfsu.edu.cn/BFSU_Readability_Analyzer_3.zip
  11. xujiajin

    肖老师创建的COTE corpus (COTE Corpus of Translational English)上线

    这个语料库是肖老师建的,他没有授权可以公开这个语料库。
  12. xujiajin

    COTE

    COTE语料库可以在线检索,但不能下载。 http://114.251.154.212/cqp/cote/ 账号:test 密码:test
  13. xujiajin

    求助:【500万微博语料】请问是因为数据太大,所以antconc打不开么?

    没有。 WordSmith中有个Index(索引功能)可以实现上亿此次的检索、词表分析。2GB字节的语料,单机软件不大现实。
  14. xujiajin

    求助:【500万微博语料】请问是因为数据太大,所以antconc打不开么?

    谢谢分享。我看了是500MB,那是肯定无法用AntConc打开的。如果是500万词或许还有可能。
  15. xujiajin

    求助:【500万微博语料】请问是因为数据太大,所以antconc打不开么?

    请提供以下500万微博语料的下载链接,我们也帮着测试一下。
  16. xujiajin

    求一份BFSU PowerConc 1.0 beta25 软件说明书!!!

    https://wenku.baidu.com/view/9b095497657d27284b73f242336c1eb91b373310.html?_wkts_=1732703509349&bdQuery=powerconc%E4%BD%BF%E7%94%A8%E6%95%99%E7%A8%8B https://www.bilibili.com/video/BV1uM411s7zp/
  17. xujiajin

    请教各位老师,有没有可以直接出p值的log-likelihood calculator?

    李老师可能并不一定知道我们已经开发了新版的工具:https://corpus.bfsu.edu.cn/BFSU_Log-likelihood_Calculator_with_ES.zip
  18. xujiajin

    请教各位老师,有没有可以直接出p值的log-likelihood calculator?

    除了那个Excel表格Log Likelihood Calculation Excel Spreadsheet(https://corpus.bfsu.edu.cn/BFSULL.xls),我们现在还开发了界面版的对数似然率工具 BFSU Log-likelihood Calculator with Effect Size(https://corpus.bfsu.edu.cn/BFSU_Log-likelihood_Calculator_with_ES.zip)。...
  19. xujiajin

    求语料库相关练习

    可参考下面这个页面中的“第二章:语料库建设的一般方法”相关资料。 https://corpus.bfsu.edu.cn/info/1084/1873.htm
  20. xujiajin

    语料天涯CorporaAZ重新上线

    欢迎补充“语料天涯”中遗漏的资源信息。我再添加上去。
Back
顶部