如何制作Range词表?

许博士:
我自己制作的一份单词表,但不知如何将其变成符合语料库要求的格式,能否指点一下。 谢谢!!
 
回复: 如何制作单词表

对不起,没有表述清楚,我做的词汇表已经转换成txt纯文本格式,但格式不符合range要求.请指点.
 

xujiajin

管理员
Staff member
回复: 如何制作单词表

可以利用http://www.lextutor.ca/familizer/上的辅助工具,将原始词表上传,每个单词就会以Range词族表的形式给出,例如store会变成store stored stores storing storage。当然,仍然需要进行相应的校对和补充。接下来我们需要把族长(head word)顶格放置,余下的每个词一行,词前加一个tab符。即:
store
stored
stores
storing
storage
这个时候,我们利用Word中的替换功能,将所有的回车(^p)都替换成“空格+0+^p”。这样就完成了Range词表的制作。从而得到如下形式的词表:
store 0
stored 0
stores 0
storing 0
storage 0
最后需要将词表文件依次存成BASEWRD1.txt、BASEWRD2.txt、BASEWRD3.txt的形式,替换Range软件里原有的词表。如果词表超过三个,比如有5个词表,在运行时则需要相应将窗口下方【Number of Baseword Files】后面框了的数值相应调整。
 

清风出袖

高级会员
回复: 如何制作单词表

可以利用http://www.lextutor.ca/familizer/上的辅助工具,将原始词表上传,每个单词就会以Range词族表的形式给出,例如store会变成store stored stores storing storage。当然,仍然需要进行相应的校对和补充。接下来我们需要把族长(head word)定格放置,余下的每个词一行,词前加一个tab符。即:
store
stored
stores
storing
storage
这个时候,我们利用Word中的替换功能,将所有的回车(^p)都替换成“空格+0+^p”。这样就完成了Range词表的制作。从而得到如下形式的词表:
store 0
stored 0
stores 0
storing 0
storage 0
最后需要将词表文件依次存成BASEWRD1.txt、BASEWRD2.txt、BASEWRD3.txt的形式,替换Range软件里原有的词表。如果词表超过三个,比如有5个词表,在运行时则需要相应将窗口下方【Number of Baseword Files】后面框了的数值相应调整。
谢谢了许博士,原来有更加简便的手段来制作适用于range 的 词表,谢谢您不吝赐教,我也跟着受益了。
 

xujiajin

管理员
Staff member
回复: 如何制作Range词表?

其实,做一个好的Range词表很不容易的,按照上面的方法做完后,一定要逐词校对。还要保证没有词表内和词表间没有重复的词。
 

patricx

高级会员
回复: 如何制作Range词表?

把elemma改造成了一个baselist,但是貌似还是有缺陷,导入range运行发现很多错误,但又不知道哪里有问题。

附件下载后改后缀为.rar然后解压缩。
 

附件

stream

普通会员
回复: 如何制作Range词表?

如果想知道一篇文章中四级词汇有多少,是不是把四级词汇表上传,然后再按照许老师说的步骤去制作此表?另外,这个方法是不是适用wordprofiler的词表制作呢?请指教!
 

xusun575

高级会员
回复: 如何制作Range词表?

把elemma改造成了一个baselist,但是貌似还是有缺陷,导入range运行发现很多错误,但又不知道哪里有问题。

附件下载后改后缀为.rar然后解压缩。
我看了一下.你的做法确实是错误的:约15,000个"词族"(见附件)怎么能放在一个词表中?.看一看paul nation词表的规则,思考一下再制作吧.
 

附件

patricx

高级会员
回复: 如何制作Range词表?

我对paul nation词表的规则的确没搞懂啊,他做了三个词表“basewrd1”,“basewrd2”和“basewrd3”,分别放了一些词族,而且head词后面的family member是用tab键相区别的,尤其是后面的“0”和“1”我不知道具体指什么,阅读paul nation写的操作说明,也没发现线索。
 

xujiajin

管理员
Staff member
回复: 如何制作Range词表?

每个单词后面的数字0是词表的初始频数值 。如果需要,在软件中加以设置,软件运行中相应的词每被匹配一次,数字会被加1。这一设计原是Paul Nation用来测试和改进词表的,对通常的词汇分析并无意义。
 
回复: 如何制作Range词表?

[FONT=宋体] [/FONT] [FONT=宋体]分享一下我在使用中的心得,许博说的[/FONT][FONT=宋体]接下来我们需要把族长([/FONT]head word[FONT=宋体])顶格放置,余下的每个词一行,词前加一个[/FONT]tab[FONT=宋体]符[/FONT][FONT=宋体]这个工作完全可以通过选择[/FONT]family in tabs[FONT=宋体]这个选项直接就生成每词一行的一个词表。[/FONT]
[FONT=宋体]abbreviate [/FONT]
[FONT=宋体] abbreviated [/FONT]
[FONT=宋体] abbreviates [/FONT]
[FONT=宋体] abbreviating [/FONT]
[FONT=宋体] abbreviation [/FONT]
[FONT=宋体] abbreviations [/FONT]
[FONT=宋体] [/FONT]
[FONT=宋体]然后再用许博教的方法在[/FONT]word[FONT=宋体]中完成替换,其中因为多了一个换行因此多了一个[/FONT]0[FONT=宋体],[/FONT]
[FONT=宋体]
[FONT=宋体]abbreviate 0 [/FONT]
[FONT=宋体] abbreviated 0 [/FONT]
[FONT=宋体] abbreviates 0 [/FONT]
[FONT=宋体] abbreviating 0[/FONT]
[FONT=宋体] abbreviation 0[/FONT]
[FONT=宋体] abbreviations 0[/FONT]
0
然后仍然用替换的方法把所有的0替换掉就可以了。[/FONT]​
 

seanxpq

corpus explorer
回复: 如何制作Range词表?

请问family in tabs是哪个软件或哪里的功能?谢谢。
 
顶部