查看完整版本 : http://corpus.sjtu.edu.cn/
xujiajin
2005-11-10, 09:44 PM
http://corpus.sjtu.edu.cn/DDL/Li/index.HTM
关于本站及声明
语料库、电子文本
语料库索引软件
薛学彦:文本检索软件简介
CBL:文献、论文、期刊
平行语料库研究资源
JDEST上海交大科技英语语料库
语料库软件下载
多谢wzli推荐。
xujiajin
2005-11-10, 11:20 PM
语料库软件下载
语料库索引软件
(仅供教学科研用)
一、赋码软件
Brilltagger
Qtag
TLBtag
二、自由索引软件
Wconcord
Lexas
Concap
Kfngram
Multilingual Concordancer
Paraconc
Tatoe
Wordpilot
Microconcord
Monoconc
Tact
Tactweb
Wordcruncher
Antconc
Antmover
KWIC
三、商业索引软件
Wordsmith Tools 4
Wsmith 3
Concordance
四、文本检索工具、文献工具、互动练习制作
Powergrep
Endnote 8
Hot potatoes 6
asan82
2005-11-11, 04:45 PM
cannot open it
jinshan_wu
2005-11-11, 06:14 PM
无效链接?
xujiajin
2005-11-11, 09:37 PM
Laolee said that the server was not working 24 hours.
The message that I saw was "too many users". So you may try connecting another time.
majorlv511
2005-11-12, 09:02 AM
请问是哪个学校的网址啊? 上海交大么??
armstrong
2005-11-12, 11:23 AM
网页无法显示
armstrong
2005-11-12, 09:04 PM
可以上了。
dwhuang
2005-11-12, 09:19 PM
Hi, Jiajin, thanks for the news.
It's nice to be able to access SJTU, but rather pitifully the JDEST data cannot be available online. I once read the research on hedges in JDEST in Ken Hyland (1998).
xujiajin
2005-11-12, 09:25 PM
The server is waking up and yawning.
xujiajin
2005-11-12, 09:42 PM
Yes, Dawang, I saw a message somewhere that jiaoda planned to make it searchable online.
armstrong
2005-11-12, 10:34 PM
下载了TLBtag 不知道如何使用,哪位会使用请赐教。
谢谢!
ineedgerf
2005-11-12, 10:53 PM
这里原来提供的链接暂时关闭。很抱歉。
有什么问题请直接和我联系 (ineedgerf@gmail.com)。
xujiajin
2005-11-12, 11:36 PM
http://corpus.htu.cn/laolee/download.htm
我这里可以连上。
armstrong
2005-11-13, 10:06 AM
可以连上了。谢谢!
下载了TLBtag 和Q-tag却不会使用,哪位前辈会使用请赐教。
ineedgerf
2005-11-13, 07:49 PM
QTAG 3.0 README
The program is contained in the executable jar file qtag.jar, the
English resource file is BLT.dat, and it is described in BLT.txt.
Use it as follows:
- input.txt is a plain text file (can contain SGML mark-up) which
is tokenised (ie words and punctuation separated by spaces).
java -jar qtag.jar BLT.dat < input.txt > output.txt
- output.txt will now contain the tagged text.
How to create your own resource files:
- you need a pre-tagged corpus for training the tagger.
The format of this corpus has to be as follows:
* one token followed by its tag (separated by spaces)
* one pair per line
For example:
The det
cat noun-sing
sat verb-past
on prep
the det
mat noun-sing
. punct
- run the LexiconCreator to generate a resource file from this:
java -cp qtag.jar qtag.LexiconCreator catparse.dat < cat.txt
- use it with "java -jar qtag.jar catparse.dat < mytext.in > mytext.out":
<w pos="det">The</w>
<w pos="noun-sing">cat</w>
<w pos="verb-past">sat</w>
<w pos="prep">on</w>
<w pos="det">the</w>
<w pos="noun-sing">mat</w>
<w pos="punct">.</w>
使用Qtag需要 java 虚拟环境;TOSCA/LOB 是在 DOS 下运行的,需要一些设置。仔细看看里面的说明就什么都明白了。
ineedgerf
2005-11-14, 05:08 PM
我在 15 楼提供的链接暂时关闭。待进一步整理后再放开。对不起!
[本贴已被 作者 于 2005年11月14日 17时15分25秒 编辑过]
greatlion
2005-11-25, 08:56 AM
我打开了,哈哈,真是丰富阿.感谢
2812657
2006-02-27, 09:30 AM
现在才看到这个帖子,惭愧呀
还是打不开那个网址,难过呦。
armstrong
2006-02-27, 03:19 PM
前一段时间还可以打开,现在打不开了。
seanxpq
2006-03-08, 10:53 PM
无法显示网页
您正在查找的页当前不可用。 网站可能遇到支持问题,或者您需要 调整您的浏览器设置。
hancunxin
2006-03-09, 10:07 AM
是呀,好失望呀,我一眼也没有看呢!
asan82
2006-03-10, 01:43 PM
我也是啊:(
marilei
2006-09-30, 05:04 PM
我上了若干次,永远都是找不到服务器http://corpus.sjtu.edu.cn/
vBulletin® v3.7.4,版权所有 ©2000-2009,Jelsoft Enterprises Ltd.