Lily Ray的最近内容

  1. L

    corpus里单个text大小问题

    大家好! 最近也在看论文准备论文,发现很多人在准备语料时提到:单个文本字数太少而将其舍弃,或再合并另一个文本使其变得足够大。而且有人提到在设计语料库时定规则:少于比如说300字的文本不收集。请问对文本大小的规定是出于什么考虑,是出于语汇密度计算的考虑吗?是要遵循文本最小字数的限制还是所有文本大小围绕在一个中值附近?因为比如网页中的文章不像其它印刷品上的文章那样长,就达不到字数要求。 请大家指点迷津!
  2. L

    有关register, genre和style

    从Biber的University Language:A corpus-based study of spoken and written registers中摘出的关于register与genre的区别,从两个角度来分辨: 1. the object of study; 2. the characteristics of language and culture that are investigated. 从第一个角度来说,register用于refer to a general kind of language associated with a domain of use...
Back
顶部