lovexchina的最近内容

  1. L

    求助文本对齐后如何进行分词和赋码

    回复: 求助文本对齐后如何进行分词和赋码 一开始其实没想着赋码,但是后来发现用wordsmith无法处理中文文档,制作词表会乱码。在论坛里看了诸位老师以前的帖子后,发现应该是需要分词后进行才能正常处理。所以逼不得已寻找分词工具。但是这样一来顺便还能进行赋码考察词汇密度。 我的对齐文本是一个句子一行。标记用的是节省地方的“/"而不是<>型的xml符号,手工校对后应该问题不大。 我们学院只有硕导里才有研究语料库的,现在带我的本科论文导师没有涉及这个领域,还好在论坛里学了很多,跌跌撞撞地做下去。
  2. L

    求助文本对齐后如何进行分词和赋码

    回复: 求助文本对齐后如何进行分词和赋码 太感谢了,这个省了好多事。本来我打算实在不行,就把文本切分成20-30个子文本,每个文本包含原文的1000行。然后每个子文本用软件提供的demo演示版一个一个处理。这个软件真的帮了很大忙。虽然一开始提示license.dll有问题,查看LOG文件提示许可证过期。但我调了一下系统日期就可以正常使用了。 再次感谢老师。
  3. L

    求助文本对齐后如何进行分词和赋码

    各位老师,我研究《唐璜》和其两个中文译本。现在用Winalign完成了句子层面的对齐。现在我想要分别对中英文文本进行分词和词性赋码,以便进行词性和词汇密度的统计。论坛上推荐ICTCLAS,但是我下载了以后发现完全不会用,似乎需要不少编程知识。对于我这种文科学生来说有点太难了,现学编程也有点来不及因为论文比较紧。各位老师可不可以推荐一下一些可以直接用的中文和英文的文本分词赋码软件呢(类似于.exe软件)?。万分感激。
  4. L

    如何实现语料的一对多平行对齐

    回复: 如何实现语料的一对多平行对齐 谢谢指点,这个程序真心好用。可以检索多达八个译本。就是对齐的时候我还得自己利用paraconc一本本对齐,而且paraconc的拖动条貌似有点问题,每次拖动到某一位置总是会往回缩一点,所以对齐到末尾的时候,拖动不到文本最下边。而Winalign读取txt总报错not from the same node,存成doc或rtf格式读取又非常慢而失去响应。
  5. L

    如何实现语料的一对多平行对齐

    回复: 如何实现语料的一对多平行对齐 啊,是这样啊。感谢指点,是我太贪心了。我还是选双译本对照研究吧。
  6. L

    如何实现语料的一对多平行对齐

    各位老师好。我因论文需要学习语料库知识,现在已经会利用WinAlign进行一对一平行对齐了,但是我的研究题材是一个原文和好几十个译本。所以我想咨询,如何利用WinAlign(或者其他软件,但我没有paraconc)进行1对N(N>20)对齐以便后面实现同时检索呢?谢谢大家。
  7. L

    红楼梦汉英翻译平行语料库检索平台供测试

    回复: 红楼梦汉英翻译平行语料库检索平台供测试 这么好的东西,原来我想自己建一个红楼梦的小型语料库发现其实很困难。但是帖子里这个链接已经打不开了,我换了好几个浏览器都不行,真可惜。
Back
顶部