基于R语言的语料粘贴器

李亮1975重庆

语料库快乐军政委
基于R语言的语料粘贴器​

【功能】启动之后,你不断复制的文本都被自动收集与累积,直到你复制“#”这个符号到粘贴板就自动退出程序且把累积的文本都存入粘贴板,你粘贴就出来了;适合阅读的时候,把重要的字词句或文本片段进行自动累积;适合语料收集的时候,把复制的语篇进行累积;


【提醒】一旦启动则自动清空粘贴板且每次收集到你刚刚复制的内容也会立即清空粘贴板,所以,启动这个程序就别忘了粘贴板是“无法粘贴,但可以复制”的;


【退出】你复制一下“#”,这个符号一进入粘贴板,本R程序就自动退出了,而累积的文本们都乖乖躺在粘贴板上的;


【操作】安装R程序,或者下载我推出的“R免安装版”,把本代码放到d盘根目录,启动R之后,输入下面指令,回车即可……

source("d:/autoclip.txt")
或者你输入下面这行,回车也行……
source("d:\\autoclip.txt")

一旦用上面的指令启动了本程序,你就可以把R的窗口最小化,去网页浏览器边浏览边复制,或打开Doc或PDF文件进行边阅读边复制了,等你复制够了累了,就复制一下“#”井号,R程序就自动关闭退出了,你就“收网”看看今天的收获吧!

【启发】R语言具备高级通用编程能力,虽然不能生成独立的EXE,但,它也有较为丰富的Windows操纵函数,粘贴板控制函数writeClipboard()和readClipboard()就是一对典型;


【源码】

writeClipboard("");
collected=c();
while(1)
{
Sys.sleep(0.2);
tmp=readClipboard();
if(tmp=="#") { writeClipboard(paste(collected,sep="\r\n")); break; }
if(tmp!="")
{
collected=c(collected,tmp);
writeClipboard("");
}
}
quit(save="no");


【源码解析】

第1行是清空粘贴板,为后续操作打下基础;
第2行是新建collected这个变量,用来累积信息;
Sys.sleep(0.2)与tmp=readClipboard()是设置每隔0.2秒就读取一下粘贴板;
c(x,y)这个函数的全称是combine,就是把两个变量进行“向量合并”;
quit()就是退出R主程序,save="no"是指定R主程序退出的时候不要保存当前状态;
【下载】
你复制上面的“源码”保存为txt文件,也等于是程序了;如果有论坛帐号也可以从附件下载已经上传的TXT
 

附件

  • autoclip.txt
    293 bytes · 浏览: 4
回复: 基于R语言的语料粘贴器

非常感谢!的确是很实用、很强大、很方便的文本收集利器!
 
Back
顶部