cathy诗雨的最近内容

  1. C

    术语,特殊符号的标注问题

    各位老师,想请问哪一个tagger能够较好的区分文本当中出现的technical jargons/proper nouns和common nouns? 标注工具如treetagger, stanford tagger)在标注过程中遇有专有名词出现时(化学,物理,生物学科文本中),这些专业词汇也被标注成common nouns(NN)而不是NP,不知道有什么好的方法改善这个问题啊? 谢谢大家的建议~~
  2. C

    自定义赋码的语料库标注工具?

    同问。。。对这个问题也很感兴趣。
  3. C

    关于收集语料的ethical issues

    想请教大家一个问题: 我近期在收集化工类期刊文本,想建一个该学科的专门语料库。 通过学校买来的期刊数据库(如elsevier)进行搜索并下载。导师要提醒我注意这里是否有ethical的问题,是否要经过permission。我觉得都是公开可下载的文本应该还好,但还是想请教大家近几年语料库研究领域对这个问题是怎么规定的呢?我做的这个研究是否涉及这个问题? 多谢各位的答复!
  4. C

    关于‘风林’文本整理器

    真的非常非常感谢!回复的如此详尽,还解释了表达式的意思。费心了:-)!看来我一定要好好学习怎么写表达式了。。。
  5. C

    求问一个正则表达式

    谢谢大家的回复!:)
  6. C

    求问一个正则表达式

    想请教一下大家,有没有表达‘句尾单词’这样的正则表达式呢(或是一行中最后一个单词?)?如有,该怎样写吖?我是个新手学习这个内容~~~感谢大家的回复。
  7. C

    关于‘风林’文本整理器

    嗯嗯, 非常感谢您的回复。在风林上试了一下,的确是这样。要在上面处理这个问题,也的确很费时间。但因我对正则表达式不太了解,不知您可否方便告知那个表达式应该怎样表达呀?
  8. C

    关于‘风林’文本整理器

    大家好!有个问题想问一下,用风林文本整理器整理文本,发现两个单个单词连到一起,不知道应该怎么处理。感谢经验人士的回复!谢谢!
  9. C

    求助科技英语语料文本清理

    同问,顶一下!求经验分享~~
顶部