mishacn的最近内容

  1. M

    请教Antconc打开pos文件的问题

    回复: 请教Antconc打开pos文件的问题 好了,明白一些了。只是现在语料库到底是什么格式还是不清楚。纯文本文件也可以排列成各种格式,体现多种数据结构,所以要样本或者清晰的描述才知道如何检索。
  2. M

    请教Antconc打开pos文件的问题

    回复: 请教Antconc打开pos文件的问题 clec里面有元标记和错误标, 是不是会误导tree-tagger呀?另外,中国学生的语言与native speaker的语言不同,也会增加错误率?你不是要手工校对呀?工作量不小。 似乎tree-tagger用的是竖排格式。你不妨发个片断,大家研究一下。
  3. M

    关于wordsmith的tag file的问题

    回复: 关于wordsmith的tag file的问题 最好还是像antconc那样的处理方式,提供几种功能:1)隐藏标记;2)隐藏标记可检索;3)显示标记
  4. M

    关于wordsmith的tag file的问题

    回复: 关于wordsmith的tag file的问题 抱歉了。我把这个问题再说得清楚些。在antconc里,可以设置显示或者隐藏标记(tag),这样就可以在file view里过滤、不显示某些标记。分词、词频统计时,也应该过滤掉标记。在wordsmith里,看它的帮助文件,类似功能需要通过编写tag file实现,而且设置里包括/排除标记文本的选项,比较复杂。不知哪位老师实际使用过相关功能?怎么才能wordsmith里把标记隐藏掉?甚至将首尾标记以及首尾标记之间的文本也隐藏掉? WordSmith 对标记的使用似乎很强。我想,这么多专家在此,或许已经积累了一定经验吧。
  5. M

    关于wordsmith的tag file的问题

    我希望用wordsmith处理clec,tag file应该怎么写?有哪位老师有实际经验、试过?当然,能做clec的tag file,也能做其它标注语料库的,反之亦然。如果有人做其它标注语料库的tag file,也可以在这里分享一下(经验,实际tag file)。
  6. M

    关于wordsmith的tag file的问题 有谁编写过tag file,使用wordsmith处理标注语料库,比如clec, xml版本brown语料库? 能否分享一下(经验,tag file)

    关于wordsmith的tag file的问题 有谁编写过tag file,使用wordsmith处理标注语料库,比如clec, xml版本brown语料库? 能否分享一下(经验,tag file)
  7. M

    请教:TTR解读

    回复: 请教:TTR解读 还是看wordsmith对STTR的定义吧: “Wordlist uses a different strategy for computing this, therefore. The standardised type/token ratio (STTR) is computed every n words as Wordlist goes through each text file. By default, n = 1,000. In other words the ratio is calculated for the first...
  8. M

    请教Antconc的问题

    回复: 请教Antconc的问题 1. 在antconc里使用正则表达式,即勾选上Regex,输入正则表达式:\bask.*\b 2. 选Advanced,勾选 Use context words and horizon,把for加入context words里面 3. 我对horizaon的设置是from 0 to 5R, 如果你需要更在的范围,可以设置为6R, 7R, ...
  9. M

    如何使用语料库?

    回复: 如何使用语料库? 是要问文本自动分类的问题吧?要看些计算语言学的书籍。
  10. M

    antoconc3.2.1可以统计中文语料么

    回复: antoconc3.2.1可以统计中文语料么 完全可以,设置编码,字体。测试过。
  11. M

    ICTCLAS2011免费发布(转)

    回复: ICTCLAS2011免费发布(转) 以前发过一个,不能用。
Back
顶部