PDA

查看完整版本 : How to write a thesis based on spoken data?


zhmabel
2005-06-16, 12:04 PM
各位大侠,特别是这个论坛上发布很多帖子的精英们,本人现在就要着手进行硕士的毕业论文了,可是由于这几年来都不太勤于学业,以至现在不知道如何进行,连开题都难以定夺。本人导师是研究语料库的,很希望其弟子能够在口语方面有所研究,可是我现在都还不知道口语有哪些方面可以着手创造出一篇论文出来,所以请教各位,帮在下一把了!!!

[本贴已被 xujiajin 于 2005年09月10日 21时08分01秒 编辑过]

xujiajin
2005-06-16, 01:26 PM
1、你手头有现成的口语语料吗?
2、你导师希望在哪个具体的小点上有所研究?

xujiajin
2005-06-16, 02:33 PM
做口语语料研究是十分辛苦的。当然你如果有现成的语料,特别是完全转写和校对好的文字脚本在自然更好。

不过通常的硕士论文可以做一个小规模的研究,比如几次广播电视上的interview或者talk show节目之类的。

Haiyang
2005-06-16, 04:37 PM
可以基于MICASE做,语料网上应该有的。

xujiajin
2005-06-16, 07:31 PM
MICASE倒是可以用用,http://www.lsa.umich.edu/eli/micase/index.htm
MICASE中主要是学术口语。

xiaoz
2005-06-16, 08:40 PM
I am using the demographically sampled component of the BNC (ca. 4 million words).

xujiajin
2005-06-16, 09:07 PM
But that part of BNC, let alone the entire BNC, is not available to the common user.

xiaoz
2005-06-16, 09:49 PM
The British Library server provides 20 days' free trial per usename via SARA. When one username expires, register another. 40 days is enough for data collection for an MA project, right?

xujiajin
2005-06-19, 12:02 AM
This trial use of BNC is great!

xujiajin
2005-06-19, 12:10 AM
Most researches on spoken corpora are primarily based on transcripts. If we want to get the most of the speech in its actual context, we have to go back to the sound files/recordings.

清风出袖
2005-06-19, 11:35 PM
great idea!

xujiajin
2005-06-20, 12:09 AM
This is what distinguishes text-/transcript-based research from audio-based research. And most recently multimodal (text, audio, video, gesture etc) information is integrated and analyzed simultaneously.

xiaoz
2005-06-20, 04:09 AM
Indeed, much extra-linguistic information is lost in transcription. That's why the transcripts of some existing audio/video corpora are time stamped and linked to the digital audio/video chunks (e.g. the LDC Santa Barbara corpus, and the SCOTS corpus http://www.scottishcorpus.ac.uk/).

However, a spoken corpus composed of transcripts properly marked up with some most common extra-lingusitic features can be used for many purposes in lingusitic inquiry.

xujiajin
2005-06-20, 09:56 AM
Another way out is to annotate the audio sound directly, marking up the phonetic, phonological, paralinguistic features together with the verbatim orthographic transcript. This way of annotation can be well done by Praat (www.praat.org).

[本贴已被 作者 于 2005年06月20日 10时02分25秒 编辑过]

xiaoz
2005-06-20, 05:43 PM
But a spoken corpus annotated with ponological, phonetic, and prosodic features is still composed of enriched "transcripts". In lingusitic analysis - as opposed to language engineering (e.g. voice recognition and speech-to-text synthesis), corpora of such transcripts are usually sufficient for most purposes.

xujiajin
2005-06-20, 09:28 PM
when we come to the analysis of situational features of linguistic facts, esp. the interactive attitudinal features, tones of voice and other prosodic features have to be taken into account.

take "yes" for example, "yes" with a rising tone and a falling tone and in some cases a reluctant (prolonged, first falling then rising) tone carry rather different communicative content.


[本贴已被 作者 于 2005年06月21日 00时59分39秒 编辑过]

xiaoz
2005-06-21, 06:13 AM
True. That's why most spoken corpora are marked up with pauses indicating duration, events, vocals while some corpora of transcripts are even annotated with prosodic features such as tones and prolonged pronunciations. These are all transcribed corpora. Unless you are dealing with audio/video recordings directly, you are using transcribed spoken corpora.

hancunxin
2005-06-27, 12:43 PM
哪儿有语料库光盘卖?

xujiajin
2005-06-27, 01:26 PM
国际上有一个ICAME Corpus collection 的光盘,其中包含很多语料库。你可以到google上搜一下。

国内只有一个CLEC现在出售,该光盘附在杨惠中、桂诗春的书后。

中文的语料库倒是有一些可以在线检索的,具体的见“汉语语料库”版的置顶贴。

asan82
2005-07-02, 02:47 PM
I'm doing a research on contrastive study of english and chinese relative clauses for my MA degree.I wanted to use some intuition-based data,but my tutor suggested the corpus-based data was better( "more authoritative , more reliable"). The problem is that I never used corpus before and don't know how to use it. I bought a book related to corpus linguistics but find of little help.Perhaps I'm not that techonology-minded.Would anyone give me a hand?

xiaoz
2005-07-02, 07:42 PM
A common failure of existing books on corpora is that they focus only on why but not how, or only related to a particular corpus (e.g. the BNC or ICE-GB). I believe our new corpus book will change this situation by discussing why and giving demonstrations that lead readers step by step through each of the six case studies using difference corpora and tools.

xujiajin
2005-07-03, 12:06 AM
That's great.

xujiajin
2005-07-03, 12:15 AM
以下是引用 asan82 在 2005-7-2 14:47:00 的发言:
I'm doing a research on contrastive study of english and chinese relative clauses for my MA degree.I wanted to use some intuition-based data,but my tutor suggested the corpus-based data was better( "more authoritative , more reliable"). The problem is that I never used corpus before and don't know how to use it. I bought a book related to corpus linguistics but find of little help.Perhaps I'm not that techonology-minded.Would anyone give me a hand?


汉语方面你可以用LCMC(兰开斯特汉语语料库),英语方面你可以用FLOB
FLOB and Frown are one million word balanced corpora for modern written British and American English (the 1991 updates of LOB and Brown).

They are now freely available (only on the corpus4u site) for searching using our WebConc

http://www.ling.lancs.ac.uk/corplang/cgi-bin/FreiburgConC.pl

If you have a copy of Xaira, you can also access FLOB by opening the coprus with your xaira Client using the following as the corpus name

http://www.ling.lancs.ac.uk/corplang/flob/flob.xcorpus

Lancaster Corpus of Mandarin Chinese
http://bowland-files.lancs.ac.uk/corplang/cgi-bin/conc.pl

xujiajin
2005-07-03, 12:17 AM
其他的汉语语料库在这里再贴一下吧:
Academia Sinica Balanced Corpus of Modern Chinese
http://www.sinica.edu.tw/SinicaCorpus/

Peking University Modern Chinese Corpus
http://ccl.pku.edu.cn/ccl_corpus/xiandaihanyu/

Xiamen University corpora (registration required but free)
http://xmuoec.com/gb/hanyu/hanyu/data/corpus/index.htm

Beijing Language and Culture University corpus
http://202.112.195.8:8089/ccir_login?input=*

Lancaster Corpus of Mandarin Chinese
http://bowland-files.lancs.ac.uk/corplang/cgi-bin/conc.pl

Leeds Chinese corpus
http://corpus.leeds.ac.uk/query-zh.html

PFR People's Daily corpus (01/1998)
http://bowland-files.lancs.ac.uk/corplang/pdcorpus/pdcorpus.htm

PH corpus (Xinhua newswire data 1990-1991)
http://bowland-files.lancs.ac.uk/corplang/phcorpus/phcorpus.htm

People's Daily 2000 corpus
http://bowland-files.lancs.ac.uk/corplang/pdc2000/default.htm

Peking University Ancient Chinese Corpus
http://ccl.pku.edu.cn/ccl_corpus/jsearch/index.jsp?dir=gudai

Sinica corpus of early Chinese
http://www.sinica.edu.tw/Early_Mandarin/

Sheffield Corpus of Chinese for Diachronic Linguistic Study
http://www.shef.ac.uk/scc/

动态语法
2005-07-04, 08:50 AM
以下是引用 zhmabel 在 2005-6-16 12:04:06 的发言:
各位大侠,特别是这个论坛上发布很多帖子的精英们,本人现在就要着手进行硕士的毕业论文了,可是由于这几年来都不太勤于学业,以至现在不知道如何进行,连开题都难以定夺。本人导师是研究语料库的,很希望其弟子能够在口语方面有所研究,可是我现在都还不知道口语有哪些方面可以着手创造出一篇论文出来,所以请教各位,帮在下一把了!!!


您还没说您打算研究中文还是英文呢。

xujiajin
2005-07-04, 10:51 AM
火车不是推的,论文不是造的。这种思想要不得。基于语料库的研究尤其要求耐心、责任心和钻研精神。静下心来好好想想有什么可以做的,再跟导师讨论讨论。有问题当然也欢迎拿到这里来切磋切磋。大家共同学习、提高。

zhmabel
2005-07-04, 11:57 AM
多谢各位好心人的帮助和建议,上次求助疏忽了一些问题,我是英语专业的学生,所以要进行英语语料库的研究,导师给了我一些高校四六级口语考试的VIDEO,希望能将其TRANSCRIPT作为自己研究的语料,可是大家应该了解TRANSCRIPT的工作是很艰巨的,我想想要把那些听都听不是很明白的口语转写下来就头疼,我想放弃这个方法,不知道还有没有其他的办法呢!

动态语法
2005-07-04, 12:50 PM
是不是导师想让你帮助转写语料?如果不是而自己又对那些语料不感兴趣,
可以利用网上已有的英语语料,把时间更多地用到研究问题上面。

xujiajin
2005-07-04, 02:05 PM
以下是引用 zhmabel 在 2005-7-4 11:57:30 的发言:
多谢各位好心人的帮助和建议,上次求助疏忽了一些问题,我是英语专业的学生,所以要进行英语语料库的研究,导师给了我一些高校四六级口语考试的VIDEO,希望能将其TRANSCRIPT作为自己研究的语料,可是大家应该了解TRANSCRIPT的工作是很艰巨的,我想想要把那些听都听不是很明白的口语转写下来就头疼,我想放弃这个方法,不知道还有没有其他的办法呢!


如果是自己整理语料,转写这些工作是跳不过去的,这是你后续工作的基础。
否则,就只有,像动态语法说的那样,用现成的语料了。

xiaoz
2005-07-05, 07:04 AM
我觉得转写这些素材另行建库意义不大。南大文秋芳教授课题组已开发了一个英语专业口语库即将出版。

可以考虑用Santa Barabara Corpus of Spoken American English Corpus。该库已出版的Parts1-5共46个文件可在TalkBank免费下载。或者使用ICE各子库中的口语材料,也是免费的,但要与UCL项目组联系取得解压下载文档的密码。

xujiajin
2005-07-05, 02:39 PM
http://talkbank.org/data/

zhmabel
2005-07-06, 10:17 AM
昨晚偶给导师打电话表达了自己不想转写口语的念头,说转写太难了,可是被导师驳回了,说转写又有多难啊,还不是有人做的很好吗,唉,偶就无话可说了!!!可是即便我不畏艰难,花了很多时间去转写,也不知道写口语哪方面的东西啊,请大家帮忙想几个可以研究的TOPIC吧,偶想在这几天就把题目给定下来,不然开题报告就完不成了!因为要转写的是大学生四六级的口语考试, 内容无非是自我介绍和两三个同学一组的交流对话,不知道能从中挖掘些什么东西出来?今晚就和导师见面了,现在脑子里一点概念都没有呢,不过偶想争取能说服导师不要转写,那就最好了,呵呵!

zhmabel
2005-07-06, 10:24 AM
以下是引用 xiaoz 在 2005-7-5 7:04:28 的发言:
我觉得转写这些素材另行建库意义不大。南大文秋芳教授课题组已开发了一个英语专业口语库即将出版。

可以考虑用Santa Barabara Corpus of Spoken American English Corpus。该库已出版的Parts1-5共46个文件可在TalkBank免费下载。或者使用ICE各子库中的口语材料,也是免费的,但要与UCL项目组联系取得解压下载文档的密码。

感觉你你说的都好专业啊,怎么有点看不懂呢?这些库我都没听过呢,我目前都还没有现成的口语语料库,不知道怎么弄的到啊?

xiaoz
2005-07-06, 10:42 AM
Download the Santa Barabara Corpus of Spoken American English here (select SBCSAE):

http://talkbank.org/data/Conversation/

Download the completed components of ICE (International Corpus of English) at the ICE home hosted at University College London:

http://www.ucl.ac.uk/english-usage/ice/

You will be licensed so that you can get passwords to unzip the downloaded corpora. See the corpus website for details.

zhmabel
2005-07-06, 10:49 AM
以下是引用 xujiajin 在 2005-7-5 14:39:49 的发言:
http://talkbank.org/data/

打开之后里面的压缩文件下载下来,只有一部分可以看到,而且不是转写的语料本身,好象是转写者自己关于一些口语问题的观点和看法。哪里有转写的语料可以看啊,不知道转写是怎么转写的,有没有什么标准和模式呢?

zhmabel
2005-07-06, 11:07 AM
好象要下载什么软件才可以看到里面的东西吧?CLAN是个什么工具啊,经常见到,是要下载这个吧?

zhmabel
2005-07-06, 11:23 AM
下载了CLAN,好复杂啊,都不知道怎么安装上去,唉,语料库真把我害苦了啊 !

xiaoz
2005-07-06, 11:24 AM
You can download and use CLAN to view those files if you will. But you can also load them into a concordancer.

xiaoz
2005-07-06, 12:00 PM
以下是引用 zhmabel 在 2005-7-6 11:23:51 的发言:
下载了CLAN,好复杂啊,都不知道怎么安装上去,唉,语料库真把我害苦了啊 !


Sigh...

zhmabel
2005-07-06, 01:15 PM
终于可以看到下载的东东了,可是转写的材料怎么那么复杂啊,很多符号和标志,看都看不懂,不知道都代表什么意义呢?

xujiajin
2005-07-06, 08:23 PM
以下是引用 zhmabel 在 2005-7-6 10:17:56 的发言:
昨晚偶给导师打电话表达了自己不想转写口语的念头,说转写太难了,可是被导师驳回了,说转写又有多难啊,还不是有人做的很好吗,唉,偶就无话可说了!!!可是即便我不畏艰难,花了很多时间去转写,也不知道写口语哪方面的东西啊,请大家帮忙想几个可以研究的TOPIC吧,偶想在这几天就把题目给定下来,不然开题报告就完不成了!因为要转写的是大学生四六级的口语考试, 内容无非是自我介绍和两三个同学一组的交流对话,不知道能从中挖掘些什么东西出来?今晚就和导师见面了,现在脑子里一点概念都没有呢,不过偶想争取能说服导师不要转写,那就最好了,呵呵!


显然你导师没有做过转写。
建议你还是关注考生在用词和语法上的错误吧,然后跟书面语CLEC的情况对照一下?
举个例子,看看口语中学生们起承转合词使用的情况与书面语有何不同?
仅供参考。希望有用。

xiaoz
2005-07-06, 09:05 PM
以下是引用 zhmabel 在 2005-7-6 13:15:42 的发言:
终于可以看到下载的东东了,可是转写的材料怎么那么复杂啊,很多符号和标志,看都看不懂,不知道都代表什么意义呢?



See the following link for the SBCSAE markup scheme
http://www.ldc.upenn.edu/Projects/SBCSAE/transcription/csae-conventions.html#markup

zhmabel
2005-07-07, 12:30 PM
以下是引用 xujiajin 在 2005-7-6 20:23:58 的发言:


显然你导师没有做过转写。
建议你还是关注考生在用词和语法上的错误吧,然后跟书面语CLEC的情况对照一下?
举个例子,看看口语中学生们起承转合词使用的情况与书面语有何不同?
仅供参考。希望有用。


谢谢你的建议!昨天已和导师确定了论文大致的方向,转写是必需的。真的有点太巧合了!我定的方向跟你所说的建议基本上是一样的。我昨天也是临时想到的一个话题,就是大学生口语连接语的使用情况对语句连贯性的影响。这也只是大概的一个方向,具体的研究角度和理论我都还没有想好,反正导师同意了我这个方向,说可以对此进行研究!看你还能对这个问题给些相关的建议吗?

zhmabel
2005-07-07, 12:45 PM
再跟大家说说我的基本想法吧,大家来给点意见和建议!!!研究课题是大学生口语中连接语(不知道这样下这个定义是不是最适合的),也就是起到起承转合作用的一些词或短语,包括连词,语气助词如WELL等等,对于句子连贯性的作用。我想通过对于语料的研究证明中国学生和NATIVE SPEAKER在使用这个连接语方面存在很大差异,比如用词的局限性,总是喜欢用AND等,或者不太会应用这类的词语而导致停顿,语句不连贯等。这应该是个对比研究,国外的语料就打算用BNC中的口语预料,中国的口语语料就自己转写了。我希望最后这个研究能够反馈到教学上,对教学有一定的意义。至于这个意义目前也还没有想清楚。

zhmabel
2005-07-07, 12:50 PM
以下是引用 xiaoz 在 2005-7-6 21:05:17 的发言:


See the following link for the SBCSAE markup scheme
http://www.ldc.upenn.edu/Projects/SBCSAE/transcription/csae-conventions.html#markup


谢谢提供的网站。导师说转写不一定要有那么复杂的附码和标注,过多的标注对我们的研究也没有什么意义,只要基本上把话语转写下来,是自己的研究需要用的就可以了。所以就不必要担心各种规则和要求了,毕竟也只是为了做一篇论文而已,不需要过于讲究了。

xujiajin
2005-07-07, 01:47 PM
以下是引用 zhmabel 在 2005-7-7 12:30:38 的发言:
以下是引用 xujiajin 在 2005-7-6 20:23:58 的发言:


显然你导师没有做过转写。
建议你还是关注考生在用词和语法上的错误吧,然后跟书面语CLEC的情况对照一下?
举个例子,看看口语中学生们起承转合词使用的情况与书面语有何不同?
仅供参考。希望有用。


谢谢你的建议!昨天已和导师确定了论文大致的方向,转写是必需的。真的有点太巧合了!我定的方向跟你所说的建议基本上是一样的。我昨天也是临时想到的一个话题,就是大学生口语连接语的使用情况对语句连贯性的影响。这也只是大概的一个方向,具体的研究角度和理论我都还没有想好,反正导师同意了我这个方向,说可以对此进行研究!看你还能对这个问题给些相关的建议吗?


要多多开动脑筋啊。多读多想。
再者,我们毕竟不是你的导师啊。

xujiajin
2005-07-07, 01:50 PM
以下是引用 zhmabel 在 2005-7-7 12:45:05 的发言:
再跟大家说说我的基本想法吧,大家来给点意见和建议!!!研究课题是大学生口语中连接语(不知道这样下这个定义是不是最适合的),也就是起到起承转合作用的一些词或短语,包括连词,语气助词如WELL等等,对于句子连贯性的作用。我想通过对于语料的研究证明中国学生和NATIVE SPEAKER在使用这个连接语方面存在很大差异,比如用词的局限性,总是喜欢用AND等,或者不太会应用这类的词语而导致停顿,语句不连贯等。这应该是个对比研究,国外的语料就打算用BNC中的口语预料,中国的口语语料就自己转写了。我希望最后这个研究能够反馈到教学上,对教学有一定的意义。至于这个意义目前也还没有想清楚。


(1) Abraham, Werner (ed.). 1991. (2) Aijmer, Karin. 2002. (3) Andersen, Gisle and Thorstein Fretheim (eds.). 2000. (4) Andersen, Gisle. 2001. (5) Blakemore, Diane. 2002. (6) Brinton, Laurel. 1996. (7) Couper-Kuhlen, Elizabeth and Bernd Kortmann. 2000. (8) Fischer, Kerstin. 2000. (9) Ford, Cecilia. 1993. (10) Hansen, Maj-Britt Mosegaard. 1998. (11) Jucker, Andreas and Yael Ziv (eds.). 1998. (12) Schiffrin, Deborah. 1987.

12本关于discourse marker的专著,你到google上搜一下吧

xujiajin
2005-07-07, 01:52 PM
你去看看我们贴的He Anping: On the discourse marker so
以及何安平及徐曼菲等关于small words的文章

xiaoz
2005-07-07, 09:11 PM
Losts of studies of spoken English discourse have been published on the basis of the London-Lund Corpus.

zhmabel
2005-07-07, 10:42 PM
以下是引用 xujiajin 在 2005-7-7 13:52:21 的发言:
你去看看我们贴的He Anping: On the discourse marker so
以及何安平及徐曼菲等关于small words的文章

我要研究的SUBJECT不应该称做discourse marker 或small words吧,主要是起到话语连贯作用的一些连接语,或许可以叫做connecting words or utterances?因为目前还没有去看相关书籍,也不知道该怎么下定义。导师建议先看看discourse analysis这本书以及和discourse相关书籍。

xiaoz
2005-07-07, 11:00 PM
Ocean is studying connectors in academic written English. I think your topic is similar but in spoken English. If you ask him, he may give some advice.

xujiajin
2005-07-07, 11:52 PM
以下是引用 zhmabel 在 2005-7-7 22:42:54 的发言:
以下是引用 xujiajin 在 2005-7-7 13:52:21 的发言:
你去看看我们贴的He Anping: On the discourse marker so
以及何安平及徐曼菲等关于small words的文章

我要研究的SUBJECT不应该称做discourse marker 或small words吧,主要是起到话语连贯作用的一些连接语,或许可以叫做connecting words or utterances?因为目前还没有去看相关书籍,也不知道该怎么下定义。导师建议先看看discourse analysis这本书以及和discourse相关书籍。


关于这些你所谓的连接词的定义非常不统一,很多人都把它们放到discourse marker中去,但也有很多人不同意。我也不同意这么一概而论。再看看文献吧。

zhmabel
2005-07-11, 07:06 PM
请大家帮个忙:关于我论文的subject连接词或连接语的english definition到底该用哪一个比较合适??列举一些我在书上看到的关于起连接作用词的definition:connectors, logical connectors, conjunctions, connectives, transitional words, conjunctive markers, cohesive markers.
大家认为选哪一个作为我论文的subject比较准确呢?

tiger
2005-07-12, 05:52 PM
建议选择一个常用的,对之进行定义。

zhmabel
2005-07-12, 11:14 PM
Ocean 在研究written english中的连接词用的是connector,不知道我在口语中是不是也可以这样用。我看书上一般用conjuntion比较多一点。但是conjunction的定义是不是又稍微狭隘的一点呢,它不包括一些起连接作用的副词吧,比如consequently,in the meantime?!

xujiajin
2005-07-12, 11:18 PM
我对这些定义有过review,所以知道一二。我关心的是你所关注的所谓连接词是哪些,这些我们会给你一个相对准确的英文,因为你上所举的那些应为说法的所指并不都一样。

zhmabel
2005-07-12, 11:28 PM
我所谓的连接词就是具有连接意义的词,启承转合的关系啊,反正只要是可以用作连接用的啊,使句子之间比较连贯的词或者短语啊。不知道说清楚了没有?

xujiajin
2005-07-12, 11:59 PM
在我所见的文献中基本上不用connector这个词。虽然它的意思是清楚的。
鉴于你所讲的,我建议你用connective。这个在学界还是用的较多的。可以说sentence connective,discourse connective等。

另外,我特别希望你还是就每一大类举几个例子我们再来看看比较好。
当然,你所说的启承转合用connective来概括一定没有问题。我不清楚,你涉及不涉及到Actually, Obviously, Strictly, Well, I mean, you know, oh,如果有的话我们则需要另做他论了。

zhmabel
2005-07-13, 12:28 AM
Halliday的衔接理论中连接词用的就是conjunction,但这表示的是一种显性的连接,还有一些隐性的连接可以用诸如well, OK,alright之类的词,有些人就称这种词为discourse marker。所以目前不知道有没有一个统一的说法,把凡是可以起到连接作用的词给一个统称呢?

zhmabel
2005-07-13, 12:36 AM
以下是引用 xujiajin 在 2005-7-12 23:59:42 的发言:
另外,我特别希望你还是就每一大类举几个例子我们再来看看比较好。
当然,你所说的启承转合用connective来概括一定没有问题。我不清楚,你涉及不涉及到Actually, Obviously, Strictly, Well, I mean, you know, oh,如果有的话我们则需要另做他论了。


我应用的理论应该是Halliday的衔接理论,他关于连接词conjunction分了四类:additive(and ,or, ...), adversative(but, however...), causal(so, consequently...)and temporal(then, at last...).这些是肯定要包括的,但是我还想要包括你所说的那些具有连接意义的副词或副词性短语,所以就不知道怎么把他们合在一起了。

xiaoz
2005-07-13, 12:48 AM
I think what you wish to study is disjuncts and conjuncts in Quirk et al 1985.

xujiajin
2005-07-13, 10:47 AM
现在总算清楚一点了,我想你不必去照搬halliday and hasan(1976)的分类,因为他们是基于书面语的。

而你所说的Oh,well等毫无疑问是属于discourse marker的,这点应该没有争议。参见Schiffrin (1987) Discourse Markers. CUP. 以及我前面提到过的十来本专著。

Quirk et al 1985 disjuncts and conjuncts的两分法还算清楚,可是他们其中还想并不包含oh,well,you know,i mean这种;另外,disjuncts and conjuncts的分法使用得并不广泛。

zhmabel
2005-07-13, 12:48 PM
halliday and hasan(1976)的分类虽然是基于书面语的,但是用在口语中应该也是没有问题啊,基本上是相通的。至于discourse marker,范围又太广泛了一些,所以现在还是没有一个结论啊?!

zhmabel
2005-07-13, 01:00 PM
如果实在没有办法,就只有舍弃discourse marker中有连接意义的词了,而专门研究Halliday所谓的conjunction了!

zhmabel
2005-07-18, 09:19 AM
本人的开题报告终于搞定了,功夫不负有心人啊,在此多谢各位的帮忙了!

majorlv511
2005-08-01, 06:49 PM
花了很多时间读完了这个题目的所有帖子,一是出于对这个题目的兴趣,因为我的导师也是语料库方向的,刚去英国开了2005语料库会议,也给我说了做语料库方向. 二是觉得这么多EXPERTS真的很热心,很希望在今后也能得到你们的指点与帮助

xiaoz
2005-08-01, 06:54 PM
哦,原来是张阳的学生。

以下是引用 majorlv511 在 2005-8-1 18:49:20 的发言:

花了很多时间读完了这个题目的所有帖子,一是出于对这个题目的兴趣,因为我的导师也是语料库方向的,刚去英国开了2005语料库会议,也给我说了做语料库方向. 二是觉得这么多EXPERTS真的很热心,很希望在今后也能得到你们的指点与帮助

动态语法
2005-08-02, 01:25 AM
这位同学可以考虑邀请你的导师来这里上网。其他同学也可以邀请你们的导师
(例如顾曰国,桂世春,王克非,何安平,杨惠中,冯志伟,张普,宋柔,孙茂松,罗振声, 俞士汶、朱学锋,詹卫东等先生)来加入讨论,大家共同受益。

以下是引用 xiaoz 在 2005-8-1 18:54:54 的发言:
哦,原来是张阳的学生。

以下是引用 majorlv511 在 2005-8-1 18:49:20 的发言:

花了很多时间读完了这个题目的所有帖子,一是出于对这个题目的兴趣,因为我的导师也是语料库方向的,刚去英国开了2005语料库会议,也给我说了做语料库方向. 二是觉得这么多EXPERTS真的很热心,很希望在今后也能得到你们的指点与帮助

xujiajin
2005-08-02, 01:32 AM
支持楼上的提议。
大家一起帮忙邀请吧。因为有的专家的email我手头也没有。您有的话,不妨email告诉我,或者你直接向他们发出要请。

说明一下,上面有些专家已经是我们论坛的注册会员了。只是不经常上线而已。还有一些可能是公务缠身,无暇来此“陋”坛。

总之,大家有力出力吧。

wzli
2005-08-02, 09:08 AM
We have just developed the "College Learner Spoken English Corpus" (COLSEC), a sister corpus of the COLEC (College Learner English Corpus), and the CD-ROM of which will be published together with our book by Shanghai Foreign Languages Education Press in October this year. Hope it helps. That will save you months of drugeries.

动态语法
2005-08-02, 09:14 AM
以下是引用 wzli 在 2005-8-2 9:08:21 的发言:
We have just developed the "College Learner Spoken English Corpus" (COLSEC), a sister corpus of the COLEC (College Learner English Corpus), and the CD-ROM of which will be published together with our book by Shanghai Foreign Languages Education Press in October this year. Hope it helps. That will save you months of drugeries.


Thanks for the information, and welcome to Corpus4U!

xiaoz
2005-08-02, 09:15 AM
Great news indeed! Thanks.

majorlv511
2005-08-02, 10:16 AM
Richard knows my supervisor??
i just began to study something for this subject,and i only know a little about it.

majorlv511
2005-08-02, 10:21 AM
[quote]以下是引用 xiaoz 在 2005-8-1 18:54:54 的发言:
哦,原来是张阳的学生。

Richard knows my supervisor??

i just began learning a little about this subject,
sorry for my superficial understanding.

[本贴已被 作者 于 2005年08月02日 10时22分56秒 编辑过]

xiaoz
2005-08-02, 10:26 AM
Come on, you behave yourself very well. Just speak out what you think. We are discussing, aren't we?


以下是引用 majorlv511 在 2005-8-2 10:21:36 的发言:
[quote]以下是引用 xiaoz 在 2005-8-1 18:54:54 的发言:
哦,原来是张阳的学生。

Richard knows my supervisor??

i just began learning a little about this subject,
sorry for my superficial understanding.

[本贴已被 作者 于 2005年08月02日 10时22分56秒 编辑过]

majorlv511
2005-08-03, 04:39 PM
thanx, Dr Xiao
it is a great honour for me to be here, learning from you, experts in corpus linguistics

i will try my best.

hyoga527
2005-09-01, 09:42 PM
从头看到尾,卧虎藏龙啊,害怕。我毕业论文(硕)想对招聘面试的过程做分析,语料都是汉语的(只有一个英语,不是考官和应聘者母语,这个倒无所谓),英语的根本找不到。要是有那位高手可以给我出个主意就好了。不然我就想拿汉语的做了。可是到时候是翻译是不翻译呢?不翻译的话论文里还要插一堆汉语。翻译的话就不是真实语料的转写了,停顿语调什么的都没法处理。

xiaoz
2005-09-01, 10:05 PM
In reply to No. 77 -

Unclear what you want to study, some linguistic features in such a corpus, or an analysis of "moves" of job interviews from the perspective of discourse analysis.

动态语法
2005-09-02, 12:12 AM
以下是引用 hyoga527 在 2005-9-1 21:42:07 的发言:
从头看到尾,卧虎藏龙啊,害怕。我毕业论文(硕)想对招聘面试的过程做分析,语料都是汉语的(只有一个英语,不是考官和应聘者母语,这个倒无所谓),英语的根本找不到。要是有那位高手可以给我出个主意就好了。不然我就想拿汉语的做了。可是到时候是翻译是不翻译呢?不翻译的话论文里还要插一堆汉语。翻译的话就不是真实语料的转写了,停顿语调什么的都没法处理。


The translation thing is just a technical detail.

First of all, ask your advisor what the rules are specific to your program/school.
If your advisor doesn't care or doesn't know, find some journal articles on Chinese
that are written in English, and see what they did with the Chinese examples, then
you'll know what to do.

superbin
2006-03-07, 12:13 AM
****,真正的免费电影下载站,并且每日大批量更新!
**********
呵呵,大家研究累了就看看电影吧

[本贴已被 xiaoz 于 2006年03月07日 00时28分30秒 编辑过]

xiaoz
2006-03-07, 12:29 AM
Warning: Please refrain yourself from posting rubbish!


以下是引用 superbin 在 2006-3-7 0:13:17 的发言:
****,真正的免费电影下载站,并且每日大批量更新!
**********
呵呵,大家研究累了就看看电影吧

[本贴已被 xiaoz 于 2006年03月07日 00时28分30秒 编辑过]

violeeying
2008-05-30, 04:05 PM
你好,我打算从语料库的角度,采用本族语者口语语料库(LLC)和中国学习者英语口语语料库(COLSEC)两种类型的语料库,来对话语标记语WELL的使用频数,搭配,位置,特别是语用功能进行分析和比较,试图说明中国英语学习者和英语的本族人在使用WELL时的异同,从而指出中国英语学习者有待改进和提高的部分。但我不知道从来没有接触过语料库,不知道该从哪里获取。能否给予指教?不胜感谢!

yhwt_8365
2008-06-06, 10:02 AM
你能找到国外的口语语料库吗、许多都是要花钱的

chengdanjixue
2008-06-09, 10:17 PM
这无疑是个很好的网站。我对于语料库却很是费解,语料库不是一个给人们的研究带来方便的么,可为什么一定要搞那么复杂啊?我想利用,可是要么打不开网页;好不容易打开了,下载不了;打开了也下载了,可又没法运行;打开了也下载了也能运行了,却不会用。我知道这只怪我自己水平低,对电脑对软件对语料库知之甚少,可难道语料库只是给高水平的专家学者用的吗?!专家学者不是由低水平的学习者走过的吗?!
论文现在迫在眉睫,我却还是没有头绪,发发牢骚,诸君见谅吧。