谢谢许教授,您这个工具还有之前北外官网的抽样工具可以解决随机抽样的问题。我具体描述一下我的研究情况:
“来”的历时研究,在CCL古汉语语料库中分别检索14个朝代“来”的语料。想在每个朝代的语料结果进行随机抽取。类似于您提到的第二种情况。现在比较纠结如何确定每个朝代随机抽取的量。是14个朝代都抽取同样的量,还是根据每个朝代语料数量的比例确定随机抽取的量。就比如,“来”在周朝出现了500次,在唐朝出现了1500次,在清朝出现了10000次。那么我是应该每个朝代都抽取300条,还是周朝300,唐朝900...这是现在比较迷惑的地方,再次感谢您提供的新的抽样工具。