搜寻结果

  1. maggieq58

    59893526群 大家一起交流corpus!

    回复: 59893526群 大家一起交流corpus! 其实就是多种选择和交流的方式。你加了群,不是说你就不来论坛了。这个并不矛盾!就好比国内的学术流派,好像总是,你研究这个了,就不属于那个了!我研究语料库,我一样也可以研究转换生成语法。我觉得,不要把一些形式对立化。
  2. maggieq58

    BFSU Collocator1.0参数求解

    回复: BFSU Collocator1.0参数求解 BFSU Collocator 关于Z,MI的计算公式和WORDSMITH中的公式是否完全一致?
  3. maggieq58

    如何为VOA双语新闻做对齐

    回复: 如何为VOA双语新闻做对齐 <seg> </seg> 其实可以不加吧,这个东西我已经试验过,其实比如paraconc对于硬回车本身就可以别为。 也就是说我试验过加了<seg>和没有加这个标记,直接就是硬回车的。效果一样。。。当然标记了<seg>看起来更清晰一些,大家不同意见欢迎交流
  4. maggieq58

    59893526群 大家一起交流corpus!

    回复: 59893526群 大家一起交流corpus! 不错,大家一起交流是不错。
  5. maggieq58

    如何为VOA双语新闻做对齐

    回复: 如何为VOA双语新闻做对齐 对齐还真有需求啊,看来俺以后真的该办一个土法对齐的训练班.不过你那点东西太毛毛雨啦:D 简单、易用、方便,快捷就够了,word 、 excel用的好,殊途同归!没有什么土的,哈哈
  6. maggieq58

    UAM CorpusTool: Text Annotation for the 21st Century...and its free

    回复: UAM CorpusTool: Text Annotation for the 21st Century...and its free 如果想用mmax,貌似需要具备比较高的xml基础,如果是计算机专业的人,他们用这个标注软件,是否会比较容易些那?
  7. maggieq58

    【转载】你怎么知道他是大师

    回复: 【转载】你怎么知道他是大师 能让所有人都服气,就是大师!就这样简单。
  8. maggieq58

    MMAX Annotation Tool

    回复: 刘泽权《红楼梦》句对齐标注问题求解 mmax2一次只能处理一个文件啊?!那在多个文件做语域标注的时候,貌似没有uam方便啊,当然我知道uam是小学生了,mmax是大学生了。呵呵。但在这一点上,是否如我所说这样。本人是新手,说的不对,大家多见谅。
  9. maggieq58

    语料中的图表公式怎么处理?

    回复: 语料中的图表公式怎么处理? 表是可以处理的,因为毕竟在框架之内还是文字,但图就很难处理了。除非你的检索软件还具有ocr光学识别的功能。
  10. maggieq58

    无奇不有:李逵与李鬼

    回复: 无奇不有:李逵与李鬼 统称“网络钓鱼”,见的很多了。
  11. maggieq58

    中国法律法规汉英平行语料库今天发布

    回复: 中国法律法规汉英平行语料库今天发布 本库是否做了词性标注?在线系统是不提供词性检索。这点能否添加上?
  12. maggieq58

    关于claws4格式的问题

    回复: 关于claws4格式的问题 为什么要逼我!?呵呵,说是笨办法真是笨办法。上面的帖子说了,先打了标记就反了。我的办法就是我批量再替换回来!哈哈 比如</p></s> 那我就</s></p>替换。。。。。。真是笨到家了。不过麻烦几下,结果也一样。但聪明人和笨人的区别就在这里了。人家是电扇,我是手动扇风,哈哈
  13. maggieq58

    关于claws4格式的问题

    回复: 关于claws4格式的问题 通过自己的笨办法也算解决了。错中求规律吧。几个步骤下来也算弄出自己想要的。感谢各位了。
  14. maggieq58

    关于claws4格式的问题

    回复: 关于claws4格式的问题 原文本: <p>Although Britain is said to have the oldest democrasy in the world, however in many way this democrasy can be seen to be antiquated, old fashioned and unfair. There has not be whole sale reform of the electral system within Britain since women were granted the vote in...
  15. maggieq58

    关于claws4格式的问题

    回复: 关于claws4格式的问题 我实际操作了下,发现段落尾部不能提前添加</p>,因为这样标注的结果是: (一个文本的最后面)Also weak government, especially within Britains 3 party system where the balance of power would always be held by the Liberal Democrats and the National Parties.</p> <s> Also_RR weak_JJ government_NN1 ,_, especially_RR...
  16. maggieq58

    关于claws4格式的问题

    原本规矩的文本(段落分明)经过claws4标注后,都被分割成一个个独立成行的句子,原来的段落格式都没有了。 1有什么办法可以批量的把这个格式调整成原来段落分明的格式? 2段落标记如何能批量的打好?
  17. maggieq58

    求教:如何使用语料库搜索句型?

    回复: 求教:如何使用语料库搜索句型? 非常感谢答案和回复,已经非常确切了。感谢xusun575的积极帮助和指点。同时也感到您是个非常愿意动脑、动手的人,我实际操作了,很顺利。非常好。 看来我需要学习正则了和一些提取表达式的编写了。总之,非常感谢!
  18. maggieq58

    求教:如何使用语料库搜索句型?

    回复: 求教:如何使用语料库搜索句型? <w *>their</w>的正则表达式 如果可以写出来,我到是想到一个方法。当然这个*号是代替多个字母。 就是类似:nn1 should vbi at1 jj nn1 这个例子。当然咱们的库可能是<nn1> the <vbi> <at1> <jj> <nn1>
  19. maggieq58

    求教:如何使用语料库搜索句型?

    回复: 求教:如何使用语料库搜索句型? 可能是我没说明白,或者我现在没看明白。我说的三个步骤是连续的,不是3个内容。是一个研究内容。所以在做过把语料库中the这个词的pos tag去掉,后如何能在第三步里 WORD查找<w ATI>the</w> 替换成:^&粗体 ??(因为the的词性标记都去掉了。。) 2.如果一个文本中the的所有词性标记都去掉了,但其它的词的词性标记还在。用那个宏,怎么能把所有词都去掉,但还保留the这个词?!我简单看了下hong的代码,好像没发现排除the不删除的命令。 (晚辈我很多不懂,感谢xusun刚才的回复)同时也希望您再次指点。...
  20. maggieq58

    求教:如何使用语料库搜索句型?

    回复: 求教:如何使用语料库搜索句型? 查找所有的<w *>their</w>的正则表达式怎么写? 我写的*就是代替了所有可能的标记。可能是2-3个字母。我的意思是我们要检索的这个词可能是有“兼语”现象。
Back
顶部