PDA

查看完整版本 : http://corpus.sjtu.edu.cn/


xujiajin
2005-11-10, 09:44 PM
http://corpus.sjtu.edu.cn/DDL/Li/index.HTM
关于本站及声明
语料库、电子文本
语料库索引软件
薛学彦:文本检索软件简介
CBL:文献、论文、期刊
平行语料库研究资源
JDEST上海交大科技英语语料库
语料库软件下载


多谢wzli推荐。

xujiajin
2005-11-10, 11:20 PM
语料库软件下载
语料库索引软件
(仅供教学科研用)

一、赋码软件

Brilltagger
Qtag
TLBtag

二、自由索引软件

Wconcord
Lexas
Concap
Kfngram
Multilingual Concordancer
Paraconc
Tatoe
Wordpilot
Microconcord
Monoconc
Tact
Tactweb
Wordcruncher
Antconc
Antmover
KWIC

三、商业索引软件

Wordsmith Tools 4
Wsmith 3
Concordance

四、文本检索工具、文献工具、互动练习制作

Powergrep
Endnote 8
Hot potatoes 6

asan82
2005-11-11, 04:45 PM
cannot open it

刘语料
2005-11-11, 04:51 PM
cannot open it.

jinshan_wu
2005-11-11, 06:14 PM
无效链接?

xujiajin
2005-11-11, 09:37 PM
Laolee said that the server was not working 24 hours.

The message that I saw was "too many users". So you may try connecting another time.

majorlv511
2005-11-12, 09:02 AM
请问是哪个学校的网址啊? 上海交大么??

清风出袖
2005-11-12, 09:15 AM
上海交通大学语言工程研究所

armstrong
2005-11-12, 11:23 AM
网页无法显示

armstrong
2005-11-12, 09:04 PM
可以上了。

dwhuang
2005-11-12, 09:19 PM
Hi, Jiajin, thanks for the news.
It's nice to be able to access SJTU, but rather pitifully the JDEST data cannot be available online. I once read the research on hedges in JDEST in Ken Hyland (1998).

xujiajin
2005-11-12, 09:25 PM
The server is waking up and yawning.

xujiajin
2005-11-12, 09:42 PM
Yes, Dawang, I saw a message somewhere that jiaoda planned to make it searchable online.

armstrong
2005-11-12, 10:34 PM
下载了TLBtag 不知道如何使用,哪位会使用请赐教。
谢谢!

ineedgerf
2005-11-12, 10:53 PM
这里原来提供的链接暂时关闭。很抱歉。

有什么问题请直接和我联系 (ineedgerf@gmail.com)。

刘语料
2005-11-12, 10:57 PM
无法找到网页.

xujiajin
2005-11-12, 11:36 PM
http://corpus.htu.cn/laolee/download.htm
我这里可以连上。

armstrong
2005-11-13, 10:06 AM
可以连上了。谢谢!

刘语料
2005-11-13, 10:27 AM
可以连上了。

刘语料
2005-11-13, 03:46 PM
下载了TLBtag 和Q-tag却不会使用,哪位前辈会使用请赐教。

ineedgerf
2005-11-13, 07:49 PM
QTAG 3.0 README

The program is contained in the executable jar file qtag.jar, the
English resource file is BLT.dat, and it is described in BLT.txt.

Use it as follows:
- input.txt is a plain text file (can contain SGML mark-up) which
is tokenised (ie words and punctuation separated by spaces).

java -jar qtag.jar BLT.dat < input.txt > output.txt

- output.txt will now contain the tagged text.

How to create your own resource files:
- you need a pre-tagged corpus for training the tagger.
The format of this corpus has to be as follows:
* one token followed by its tag (separated by spaces)
* one pair per line
For example:
The det
cat noun-sing
sat verb-past
on prep
the det
mat noun-sing
. punct

- run the LexiconCreator to generate a resource file from this:
java -cp qtag.jar qtag.LexiconCreator catparse.dat < cat.txt

- use it with "java -jar qtag.jar catparse.dat < mytext.in > mytext.out":

<w pos="det">The</w>
<w pos="noun-sing">cat</w>
<w pos="verb-past">sat</w>
<w pos="prep">on</w>
<w pos="det">the</w>
<w pos="noun-sing">mat</w>
<w pos="punct">.</w>

使用Qtag需要 java 虚拟环境;TOSCA/LOB 是在 DOS 下运行的,需要一些设置。仔细看看里面的说明就什么都明白了。

刘语料
2005-11-13, 08:08 PM
huge thanks, ineedgerf.

ineedgerf
2005-11-14, 05:08 PM
我在 15 楼提供的链接暂时关闭。待进一步整理后再放开。对不起!

[本贴已被 作者 于 2005年11月14日 17时15分25秒 编辑过]

greatlion
2005-11-25, 08:56 AM
我打开了,哈哈,真是丰富阿.感谢

2812657
2006-02-27, 09:30 AM
现在才看到这个帖子,惭愧呀
还是打不开那个网址,难过呦。

armstrong
2006-02-27, 03:19 PM
前一段时间还可以打开,现在打不开了。

刘语料
2006-03-07, 09:50 PM
打不开那个网址.

seanxpq
2006-03-08, 10:53 PM
无法显示网页
您正在查找的页当前不可用。 网站可能遇到支持问题,或者您需要 调整您的浏览器设置。

hancunxin
2006-03-09, 10:07 AM
是呀,好失望呀,我一眼也没有看呢!

asan82
2006-03-10, 01:43 PM
我也是啊:(

marilei
2006-09-30, 05:04 PM
我上了若干次,永远都是找不到服务器http://corpus.sjtu.edu.cn/