li_bopr的最近内容

  1. L

    发布一个基于CLAWS4的多核并发语料库批量标注软件

    软件介绍: 能够基于著名的语料库标注软件CLAWS4进行批量的并发标注;能够自动修复原软件的部分错误;能够以多种标注形式存储,能够简化许多操作,普通电脑几分钟对齐数百万词没什么问题。 使用说明: 一、按原CLAWS安装说明安装好Java运行库及CLAWS文件夹,并把WinClawsGUI.exe放到winclaws.exe所有目录; 二、双击WinClawsGUI运行,在界面中点“…”选取语料库文件目录,选择所有语料文本文件的编码(可选GB2312默认编码,或者UTF-8);...
  2. L

    发布一个《英汉汉英双语自动句对齐系统》准确率很高

    英汉汉英双语自动句对齐系统 一套基于在线机器翻译引擎的英汉-汉英篇章到句子自动对齐系统,对齐准确率很高。 功能简介: (1)支持篇章到句子的自动对齐; (2)支持对齐结果的四种编辑方式;a.直接双击后修正;b.出现一对多情况时,需要向上合并;c.直接删除完全错误的句子,d.导出到Excel里编辑; (3)支持对齐结果导出为text,excel,tmx; (4)支持百度、有道两个翻译引擎的切换。因为不同的体裁这两个翻译引擎的辅助对齐结果有时候不一样的; 使用注意事项:...
  3. L

    《语料库语言学》杂志征稿启事

    回复: 《语料库语言学》杂志征稿启事 @xujiajin 老师: 前一段在教授指导下,我开发了CLAWS辅助系统,主要解决了: 1.标注时语料乱码导致CLAWS系统崩溃; 2.批量标注; 3.词性概率; 4.CPU多核多线程并发标注; 5.软件的易用性; 6.中间过程可观测; 7.最终结果可多样化; 8.其他问题等。...
  4. L

    [讨论]有没有自动提取“词块”的工具呢

    回复: [讨论]有没有自动提取“词块”的工具呢 前不久我开发了一个,大规模语料库驱动的collocation抽取工具,速度很快,效果还不错,可以联系卫老师
  5. L

    拜求TnT标注工具包,万分感谢!!

    哪位有TnT标注工具包啊,拜求啊!! 网上让注册并发传真,注册了,我也没地方 发这种国际传真啊,所以请大家帮助了,有的能否 给分享一下,十分感谢! Q:363954866 li_bopr@126.com
  6. L

    在Windows中使用Hunalign免费软件包做双语自动句对齐

    在Windows中使用Hunalign免费软件包做双语自动句对齐 一、介绍 在计算机辅助翻译领域里或者在所有涉及语料库的领域里,经常需要做的事,就是双语译文自动句对齐。SDL提供了一个Winalign对齐工具,在处理很短的对齐时,效果还说得过去,但在处理大量语料时,其经常被人指责为无用的东西。易尔译科技http://www.12fanyi.cn在这里为大家介绍一个效果很好的双语译文自动句对齐工具,以期在您需要时,为您提供一些帮助。 二、用到的软件 1、本软件运行平台为windows XP,windows...
  7. L

    wordsmith 处理中文辅助工具全功能免费版发布,快下载啊

    Wordsmith支持对纯文本、unicode格式中文文档的处理,其要求使用空格表示词的分界。 易尔译科技(http://www.12fanyi.cn) 特为此开发了《wordsmith 处理中文辅助工具》全功能免费使用版,供语料库爱好者以及自然语言处理爱好者下载使用或备用。 使用本程序可将中文语料以字或词为单位切分,切分符为英文空格,最终转换为Unicode格式的文本,可直接使用WordSmith像处理英文一样做相关的中文研究。 下载地址: http://www.12fanyi.cn/post/84.html...
  8. L

    全功能版英文文本批量形态还原工具

    回复: 全功能版英文文本批量形态还原工具 也进来顶一下。
  9. L

    使WordSmith能够真正处理中文的小工具需要不?

    回复: 使WordSmith能够真正处理中文的小工具需要不? 自己的沙发自己坐上先。
  10. L

    使WordSmith能够真正处理中文的小工具需要不?

    使WordSmith能够真正处理中文,转换为unicode编码的辅助工具正在开发中; 中文军事语料库(可用wordsmith检索,共8000篇中文文档)正在制作; 就是不知道大家需要不需要啊,如果顶的多,可能就是有需求量,过两天传上来大伙用用。 另外: 易尔译科技 http://www.12fanyi.cn/ 欢迎大家光临指导。易尔译科技团队建立不久,技术类文章偏多,需要不同的思维注入啊,欢迎语料库同仁,喜欢自然语言处理的同志加入团队一起交流共同提高,期待您的联系(QQ:363954866,验证消息:corpus4u,或者 363954866@qq.com )与支持,谢谢!!
  11. L

    全功能版英文文本批量形态还原工具

    回复: 全功能版英文文本批量形态还原工具 从前下载过的,如果碰到乱码问题,麻烦再下载附件里的EnStemmer.rar解压覆盖。
  12. L

    全功能版英文文本批量形态还原工具

    Corpus4u.org的网友们好,近日易尔译科技http://www.12fanyi.cn/为方便大家针对多文本进行英文文档的批量形态还原,特花了点小时间写了个全功能版英文文本批量形态还原工具,供喜欢搞语料库的同仁们免费使用.没有什么功能限制,欢迎下载或收藏以备不时之需。 程序说明: 本小程序用以对指定目录下的英文文本文档执行批量还原处理,能够识别单词与单词之间的标点或连字符等,保持原文格式。 程序使用.net编写,需要安装.net 2.0框架后才能使用。 易尔译科技 http://www.12fanyi.cn 出品,欢迎访问。 您的回复,是我们继续贡献的动力。。。。...
  13. L

    看看这个小程序是不是能帮大家做一些句子对齐工作

    回复: 看看这个小程序是不是能帮大家做一些句子对齐工作 我们(易尔译科技 www.12fanyi.cn)完成了一个英汉自动对齐软件,思路很简单,效果却很好。 一、用最大熵模型对中英文进行断句,克服简单的用正则使用标点断句的不准;就这一点就能提升不少准确率; 二、加载巨型英汉双语句对库(也是我们自己的),找出最为相似的英文句子,加载他的中文译文(去除虚词)得到字符串A,以A为基点,在中文文本中找汉字重合率最为相似的句子(用到局部最优解,句长,句位等辅助信息); 三、用奥巴马就职演说测试,准确率在98%以上。...
  14. L

    服务于外语教学的1000万词级英汉双语句对库。

    回复: 服务于外语教学的1000万词级英汉双语句对库。 楼主提的很好,现在已经有演示了:http://www.12fanyi.cn/post/48.html
  15. L

    大规模英汉双语句对库(1000万级以上)资源介绍

    易尔译科技(http://www.12fanyi.cn/) 经过一年多的努力,构建了一个较大规模的英汉双语句对库(目前句子级别已经达到100万以上,词级已经达到1000万英文单词以上),现将此资源库作以介绍: 该双语句对库是英文——汉语,汉语对英文形式,采用爬虫自动分析与人工领域选择多种渠道,现已经有法律分类句对库,军事、政治双语句对库分类主题句对库以及未分类的大型综合型句对库,有别于其它公司制作的双语句对库,该句对库有以下特点: 一、采用独特的消重技术,使得英汉、汉语双语句对互相不重复。...
Back
顶部