查看完整版本 : 有关中文语料库检索功能兼容性较强的软件?
谁那里有有关中文语料库检索功能兼容性较强的软件?能否给介绍一下?谢谢赐贴方家!!
[本贴已被 Ocean 于 2005年06月20日 10时20分39秒 编辑过]
xujiajin
2005-06-19, 11:59 PM
请去“精品下载”去下载Xaira
xujiajin
2005-06-20, 12:05 AM
另外,本版的置顶贴里提供的链接都可以在线检索的,很方便的。
现在,concordancer对英文的处理很便利,但对中文都不太好用。主要是汉语字词之间没有空格加以区分,这即经常将的汉语的分词问题。常见的concordancer中里,ConcApp可以检索简体中文的。像MonoConc对经过分词处理的文本也可以检索。Xaira当然是很强大的,只是需要先将ANSI编码的txt文本转换为unicode(UTF-8)编码形式。
hancunxin
2005-06-25, 07:44 PM
怎么转换呢?(Xaira当然是很强大的,只是需要先将ANSI编码的txt文本转换为unicode(UTF-8)编码形式。)
hancunxin
2005-06-25, 09:28 PM
怎么将ANSI 的TXT 文本转换成UNITCODE(UTF-8)?
xujiajin
2005-06-25, 10:46 PM
在notepad,即写字板里“另存为”中可以找到ANSI,然后将其改为UTF-8
xiaoz
2005-06-25, 11:07 PM
why not use Scott's MLCT to convert files at one go?
hancunxin
2005-06-27, 01:12 PM
知道怎么转换了,谢谢xujiajin!
xujiajin
2005-06-27, 01:29 PM
对啊,还是试试MLCT吧,不过记着先要安装java环境。
hancunxin
2005-07-01, 04:26 PM
不耻下问,MLCT 哪儿有,怎么安装java环境。 I AM A BEGINNER.
xujiajin
2005-07-03, 12:24 AM
网上有下载的Java,但太大,差不多100MB左右。我是在超级解霸的某个版本的spport程序中发现了一个javasetup,10MB不到,你看能不能自己找一下。我这里拨号上网,实在没法传给你。抱歉。
MLCT
Free multilingual corpus tool. Functionalities include concordancing, pre-processing corpus, and encoding converstion etc. Strongly recommended. See for yourself.
http://www.lancs.ac.uk/staff/piaosl/research/download/download.htm
xiaoz
2005-07-03, 04:05 AM
Java interpreter (JRE) or developer envirornment (SDK) can be downloaded freely at Sun. If you do not write and compile Java scripts, JRE is sufficient:
http://java.sun.com/j2se/1.5.0/download.jsp
xujiajin
2005-07-04, 02:55 PM
以下是引用 xiaoz 在 2005-7-3 4:05:31 的发言:
Java interpreter (JRE) or developer envirornment (SDK) can be downloaded freely at Sun. If you do not write and compile Java scripts, JRE is sufficient:
http://java.sun.com/j2se/1.5.0/download.jsp
可是我试过下载你说的这个,但是好像是100MB的。
vBulletin® v3.7.4,版权所有 ©2000-2009,Jelsoft Enterprises Ltd.