搜寻结果

  1. S

    求助语料抽样工具

    明白,谢谢许老师!前几天网站一直打不开,在这个论坛学到很多东西。
  2. S

    求助语料抽样工具

    多谢许教授耐心解答,十分受益。关于您第二条提到的是否开展相应的统计检验或建模,建模参考的是您2023年的《语料库研究方法》。但统计检验这方面的知识还有些欠缺,特别希望许教授能推荐一些相关文献。这也是我一直纠结抽样数量和方法的原因,总是怕前期工作没有做好,影响后续研究的开展。
  3. S

    求助语料抽样工具

    谢谢许教授,您这个工具还有之前北外官网的抽样工具可以解决随机抽样的问题。我具体描述一下我的研究情况: “来”的历时研究,在CCL古汉语语料库中分别检索14个朝代“来”的语料。想在每个朝代的语料结果进行随机抽取。类似于您提到的第二种情况。现在比较纠结如何确定每个朝代随机抽取的量。是14个朝代都抽取同样的量,还是根据每个朝代语料数量的比例确定随机抽取的量。就比如,“来”在周朝出现了500次,在唐朝出现了1500次,在清朝出现了10000次。那么我是应该每个朝代都抽取300条,还是周朝300,唐朝900...这是现在比较迷惑的地方,再次感谢您提供的新的抽样工具。
  4. S

    求助语料抽样工具

    想请教各位老师,除了北外语料库团队开发的concordance sampler用于随机抽样,是否还有分层抽样的工具。研究需要对年代进行分层抽样,在这个地方纠结住了。
  5. S

    目前的大型汉语语料库

    明白了,谢谢许教授
  6. S

    目前的大型汉语语料库

    求助各位老师。目前大型的汉语语料库BCC和CCL,BCC支持词性检索,但很多语料太过口语化,不太准确,感觉缺乏维护。CCL又不能支持词性检索。除了这两个以外,还有什么大型的汉语语料库吗?
  7. S

    关于coll.analysis的一个问题

    感谢许教授的全面解答,对我这种语料库摸索者是莫大的帮助
  8. S

    关于coll.analysis的一个问题

    多谢许教授解答,问题解决了!
  9. S

    关于coll.analysis的一个问题

    求助各位老师,Gries的coll.analysis能否进行中文的搭配强度计算?英语的文本没问题,输入中文文本时就会出现错误。不知道是我的操作有问题还是这个代码不支持中文的文本?
Back
顶部