corpus driven/based/assisted

看到好多关于corpus-driven 和corpus-based 的讨论,
弱问corpus-based 和 corpus-assisted 有什么区别?谢谢~
 
都是描述语料库手段在一份研究中的地位的

相当于蛋炒饭中的蛋的角色,如果蛋很多就是corpus-driven(简直就是滔滔江水,让人身不由己);如果蛋较少就是corpus-based,如果蛋很少或难以描述蛋与饭的比例关系就是corpus-assisted咯。
 
在www.bing.com中搜索下的3个频率的横向对比是……

www.bing.com中搜索下的3个频率的横向对比是……

corpus-driven有19,200条
corpus-based有147,000条
corpus-assisted有4,420条
所以,corpus在86%的情况下是based,11%的情况下是driven,近3%的情况下是assisted

corpus-driven: (查询结果的总量在页面底部)
http://cn.bing.com/search?q="corpus...=-1&sk=&cvid=06a6daacc4314f4d91ded7afe8aa23ad

corpus-based: (查询结果的总量在页面底部)
http://cn.bing.com/search?q="corpus...=-1&sk=&cvid=06a6daacc4314f4d91ded7afe8aa23ad

corpus-assisted: (查询结果的总量在页面底部)
http://cn.bing.com/search?q="corpus...=-1&sk=&cvid=06a6daacc4314f4d91ded7afe8aa23ad
 
回复: corpus driven/based/assisted

这跟比例没有关系吧,参考:
McEnery, T., & Hardie, A. (2011). Corpus linguistics: Method, theory and practice. Cambridge University Press.
6.6 Corpus-as-theory versus corpus-as-method
 
回复: 都是描述语料库手段在一份研究中的地位的

相当于蛋炒饭中的蛋的角色,如果蛋很多就是corpus-driven(简直就是滔滔江水,让人身不由己);如果蛋较少就是corpus-based,如果蛋很少或难以描述蛋与饭的比例关系就是corpus-assisted咯。
呵呵,很形象,容易理解。
梁茂成的区别是“在Sinclair的影响下,Tognini-Bonelli(2001:99)首次对“基于语料库”和“语料库驱动”的研究范式进行了区分。在她看来,“基于语料库”的研究范式利用语料库对已有的理论或假设进行探索,目的在于验证或修正已有理论,而“语料库驱动”的研究范式则以语料库作为出发点和唯一观察对象,对语言中的各类现象进行全新的界定和描述。” (http://www.cssn.cn/yyx/yyx_hyzcq/201310/t20131026_612763.shtml)
 
回复: corpus driven/based/assisted

谢谢楼上各位的回复~~

我感觉corpus-driven 和corpus-based还是能理解的,前者主张从且仅从语料库能得出对语言的描述(代表实践:在Firth影响下的Sinclair, M.Stubbs等的研究);后者是把语料库和其他各种语言学理论及方法相结合, 实现对特定问题的描述(代表实践:P.Baker等和CDA结合的做法)——这样总结可以吗?

corpus-assisted的说法我是在A.Partington的文章里瞄到的,我不太确定我是否把握了Partington的这个术语和corpus-based之间的关系@@ 是不是能说,corpus-based和corpus-assisted在本质上并没有太多不同?
 
回复: corpus driven/based/assisted

在google books能读到这一节,看这个表述,是不是可以说,

使用corpus-based这个术语的研究者,更偏向CDA等把discourse看成社会实践的分析;
使用corpus-assisted这个术语的研究者,更偏向把discourse看成比句子大的语言单位,也就是说,沿袭text analysis的视点?

可是,除了看待discourse的视点不同,除了对context的理解略不同,除了前者更强调社会意义和政治意义外,其实based和assisted,在方法意义上没啥大区别,能这么说吗?



这跟比例没有关系吧,参考:
McEnery, T., & Hardie, A. (2011). Corpus linguistics: Method, theory and practice. Cambridge University Press.
6.6 Corpus-as-theory versus corpus-as-method
 
回复: corpus driven/based/assisted

corpus-driven 和corpus-based 我的理解和你的差不多,corpus-assisted抱歉没有看过你说的文章不清楚,不过从字面上来理解我觉得只要用到了corpus都能叫assisted呢= =

在真正做的过程中,其实没有太区分driven还是based,通常都叫based,以及严格意义上的driven已经不多见了吧应该。
 
回复: corpus driven/based/assisted

corpus-driven 和corpus-based 我的理解和你的差不多,corpus-assisted抱歉没有看过你说的文章不清楚,不过从字面上来理解我觉得只要用到了corpus都能叫assisted呢= =

在真正做的过程中,其实没有太区分driven还是based,通常都叫based,以及严格意义上的driven已经不多见了吧应该。


晚上又翻了几页Partington,一觉醒来好像突然想明白了,虽然Partington本人没有主张这样的区分,但我觉得能不能这样看:

如果我有一个语料库做观察对象,我没有特定的语料要观察,我任由语料库工具生成的concordance、frequency等数据来引导我的描述——corpus driven

如果我有特定的语料要观察(比如,一篇社论),一般来说我还有一个语料库作参考,我任由语料库工具针对特定语料生成的concordance、frequency等数据来引导我的描述,并不时consult参考语料库——corpus based

如果我有特定的语料要观察(比如,一篇社论),我主动选取我认为可能有分析价值的元素(比如,某个词),然后consult参考语料库,利用语料库工具得到concordance、frequency等结果,分析得到semantic prosody,回过去再看这个词如何影响对特定语料的理解——corpus assisted

这样如何?感觉实际操作中based和assisted的方法都会用到,所以似乎真没必要把这两者截然分开。
 
回复: corpus driven/based/assisted

晚上又翻了几页Partington,一觉醒来好像突然想明白了,虽然Partington本人没有主张这样的区分,但我觉得能不能这样看:

如果我有一个语料库做观察对象,我没有特定的语料要观察,我任由语料库工具生成的concordance、frequency等数据来引导我的描述——corpus driven

如果我有特定的语料要观察(比如,一篇社论),一般来说我还有一个语料库作参考,我任由语料库工具针对特定语料生成的concordance、frequency等数据来引导我的描述,并不时consult参考语料库——corpus based

如果我有特定的语料要观察(比如,一篇社论),我主动选取我认为可能有分析价值的元素(比如,某个词),然后consult参考语料库,利用语料库工具得到concordance、frequency等结果,分析得到semantic prosody,回过去再看这个词如何影响对特定语料的理解——corpus assisted

这样如何?感觉实际操作中based和assisted的方法都会用到,所以似乎真没必要把这两者截然分开。
……嘛,搞这么复杂。。

可是如果有明确的research question,一定是奔着主题去的,不会存在没有特定语料要观察,还有生成检索行一定是首先要知道检索哪个或者哪类词。如果有不确定的地方,那一定是research question还没确定,question没确定下来就不用急着检索了。

所以说,还是要看research question是什么,怎么用语料可以解决问题就怎么用,管他based还是driven还是assisted~
 
回复: corpus driven/based/assisted

……嘛,搞这么复杂。。

可是如果有明确的research question,一定是奔着主题去的,不会存在没有特定语料要观察,还有生成检索行一定是首先要知道检索哪个或者哪类词。如果有不确定的地方,那一定是research question还没确定,question没确定下来就不用急着检索了。

所以说,还是要看research question是什么,怎么用语料可以解决问题就怎么用,管他based还是driven还是assisted~

生成concordance的确一定有检索词,但是列出frequency最高的那些词是不需要预先设置检索词的。。。。。。

driven和based很多时候都是先列frequency最高的词,剔掉functional只留content,然后从后者中选择检索词去生成concordance的。。。。。这两步是有先后顺序的,主观选择是否先于检索行的生成,其实是很关键的。。。。。。。

我也不是那么在意一定要分清based和assisted,我只是希望自己的论文选择了最合适的关键词而已:)
 
回复: corpus driven/based/assisted

McEnery, T., Hardie, A., & Baker, P. (2006). A glossary of corpus linguistics. Edinburgh: Edinburgh University Press.

p.49 corpus-based Tognini-Bonelli (2001) makes a useful distinction
between corpus-based and corpus-driven investigations.
The former uses a corpus as a source of
examples to check researcher intuition or to examine the
frequency and/or plausibility of the language contained
within a smaller data set. The researcher does not
question pre-existing traditional descriptive units and
categories. A corpus-driven analysis is a more inductive
process: the corpus itself is the data and the patterns in
it are noted as a way of expressing regularities (and
exceptions) in language. A corpus-driven analysis tends
to only use minimal theoretical presuppositions about
grammatical structure.
 
回复: corpus driven/based/assisted

McEnery, T., Hardie, A., & Baker, P. (2006). A glossary of corpus linguistics. Edinburgh: Edinburgh University Press.

p.49 corpus-based Tognini-Bonelli (2001) makes a useful distinction
between corpus-based and corpus-driven investigations.
The former uses a corpus as a source of
examples to check researcher intuition or to examine the
frequency and/or plausibility of the language contained
within a smaller data set. The researcher does not
question pre-existing traditional descriptive units and
categories. A corpus-driven analysis is a more inductive
process: the corpus itself is the data and the patterns in
it are noted as a way of expressing regularities (and
exceptions) in language. A corpus-driven analysis tends
to only use minimal theoretical presuppositions about
grammatical structure.

这样定义区分based和driven感觉是比较清楚的~

我回头又去看了Baker的著作,发现其实所谓的based也是有主动选词的,所以是否主动选词确实不是based和assisted的区别所在。
 
Back
顶部