搜寻结果

S
求助语料抽样工具

明白，谢谢许老师！前几天网站一直打不开，在这个论坛学到很多东西。
- Sun111
- Post #7
- 2025-05-29
- 论坛: 编程与工具开发
S
求助语料抽样工具

多谢许教授耐心解答，十分受益。关于您第二条提到的是否开展相应的统计检验或建模，建模参考的是您2023年的《语料库研究方法》。但统计检验这方面的知识还有些欠缺，特别希望许教授能推荐一些相关文献。这也是我一直纠结抽样数量和方法的原因，总是怕前期工作没有做好，影响后续研究的开展。
- Sun111
- Post #5
- 2025-05-24
- 论坛: 编程与工具开发
S
求助语料抽样工具

谢谢许教授，您这个工具还有之前北外官网的抽样工具可以解决随机抽样的问题。我具体描述一下我的研究情况： “来”的历时研究，在CCL古汉语语料库中分别检索14个朝代“来”的语料。想在每个朝代的语料结果进行随机抽取。类似于您提到的第二种情况。现在比较纠结如何确定每个朝代随机抽取的量。是14个朝代都抽取同样的量，还是根据每个朝代语料数量的比例确定随机抽取的量。就比如，“来”在周朝出现了500次，在唐朝出现了1500次，在清朝出现了10000次。那么我是应该每个朝代都抽取300条，还是周朝300，唐朝900...这是现在比较迷惑的地方，再次感谢您提供的新的抽样工具。
- Sun111
- Post #3
- 2025-05-24
- 论坛: 编程与工具开发
S
求助语料抽样工具

想请教各位老师，除了北外语料库团队开发的concordance sampler用于随机抽样，是否还有分层抽样的工具。研究需要对年代进行分层抽样，在这个地方纠结住了。
- Sun111
- 主题
- 2025-05-23
- 回覆: 6
- 论坛: 编程与工具开发
S
目前的大型汉语语料库

明白了，谢谢许教授
- Sun111
- Post #3
- 2025-03-19
- 论坛: 汉语语料库
S
目前的大型汉语语料库

求助各位老师。目前大型的汉语语料库BCC和CCL，BCC支持词性检索，但很多语料太过口语化，不太准确，感觉缺乏维护。CCL又不能支持词性检索。除了这两个以外，还有什么大型的汉语语料库吗？
- Sun111
- 主题
- 2025-03-18
- 回覆: 2
- 论坛: 汉语语料库
S
关于coll.analysis的一个问题

感谢许教授的全面解答，对我这种语料库摸索者是莫大的帮助
- Sun111
- Post #5
- 2025-01-22
- 论坛: 语料库语言学入门
S
关于coll.analysis的一个问题

多谢许教授解答，问题解决了！
- Sun111
- Post #3
- 2025-01-21
- 论坛: 语料库语言学入门
S
关于coll.analysis的一个问题

求助各位老师，Gries的coll.analysis能否进行中文的搭配强度计算？英语的文本没问题，输入中文文本时就会出现错误。不知道是我的操作有问题还是这个代码不支持中文的文本？
- Sun111
- 主题
- 2025-01-20
- 回覆: 4
- 论坛: 语料库语言学入门

Home
搜索