如何在python中调用R?这其中包括了如何调用R的对象(函数和包),R和python的对象如何互相转换,以及如何调用R的脚本(外界参数的输入)。python提供了一个模块rpy2,可以较好地完成这项工作。
一、安装rpy2
rpy2的网址:http://rpy.sourceforge.net/index.html
可以使用easy_install安装,# easy_install rpy2
注意事项:
(1)如果是源代码编译安装R,需要在configure步骤加入后缀 --enable-R-shlib。
(2)需要安装python-devel包。
二、python调用R对象
1、使用rpy2.robjects包的r对象
调用方法如下,以下robject.r的调用方法实际上是开启了一个R的交互进程,只需要将R的代码写入一个字符串内(注1),接着调用R即可:
importrpy2.robjectsasrobjects
此时,有三种方法调用R对象:
第一种:robjects.r['pi']
第二种:robjects.r('pi')(这种方法从某种程度上讲是万能的,因为可以将任意大小和长度的R代码写成一个python字符串,之后通过robjects.r('Rcode')调用执行。)
第三种:robjects.r.pi(这种方法对于名称中有“点号”的变量会出问题,比如data.frame/read.csv等,所以推荐使用第一种方法)
相关推荐:《Python教程》
以下是一个创建和使用R函数(自己创建的函数或者R内置函数)。注意:最后一种方法,对于对付一些特殊的格式很管用:
#creatanRfunction >>>robjects.r( ''' f<-function(r){pi*r} .''' ) >>>robjects.r['f'](3) [9.424778] #internalfunctioninR >>>robjects.r['ls']() #anotherinternalfunction >>>l=robjects.r['letters'] >>>len(l) >>>robjects.r['paste'](l,collapse='-') #analternativewayofgetting'paste'functioninR #evaltheRcode >>>coder='paste(%s,collapse="-")'%(l.r_repr()) >>>robjects.r(coder)
对于一些特殊的R对象比如list和matrix,如果python要调去其中的部分数据,可以通过其rx()和rx2()方法操作。对于list,可以查看其name属性,以获得列表个个元素名称。rx()和相当于"["操作(注意取出的是R的list对象),而rx2()相当于"[["操作。一个例子:
>>>tmp=r("list(a=matrix(1:10,nrow=2),b='Hello')") >>>printtmp $a [,1][,2][,3][,4][,5] [1,]13579 [2,]246810 $b [1]"Hello" >>>tmp.names <StrVector-Python:0x8afdc8c/R:0x8ce0a70> ['a','b'] >>>tmp.rx('a') <ListVector-Python:0x8afd86c/R:0x8cf71c0> [Matrix] a:<class'rpy2.robjects.vectors.Matrix'> <Matrix-Python:0x8b013cc/R:0x97de388> [1,2,3,...,8,9,10] >>>tmp.rx(1) <ListVector-Python:0x8b010cc/R:0x8cf7100> [Matrix] a:<class'rpy2.robjects.vectors.Matrix'> <Matrix-Python:0x8b017cc/R:0x97de388> [1,2,3,...,8,9,10] >>>tmp.rx2(1) <Matrix-Python:0x8b01b4c/R:0x97de388> [1,2,3,...,8,9,10] >>>tmp.rx2('a').rx(1,1)#firstelementof'a' <IntVector-Python:0x8b01acc/R:0x8cf6fa0> [1] >>>tmp.rx2('a').rx(1,True)#firstrowof'a' <IntVector-Python:0x8b01f2c/R:0x965ffd8> [1,3,5,7,9]
注意事项:
如果函数有警告(warnings),在ipython等IDE上能够执行,但是如果是脚本或者与网页服务器交互,则会产生错误。
解决办法:
(1)鲁莽的解决很简单,强行忽略R的警告,options(warn = -1)或者R代码放入函数中suppressWarnings()。
(2)第二种办法,如果是自己代码中使用了warning()函数,则将warning信息换成字符串,之后单独输出。
如果R的函数参数用到向量,有两种解决办法:
(1)使用robject.**Vector()函数(见下)先将python对象转换成R对象,然后带入函数;
(2)直接使用python对象,一个例子:
>>>fromrpy2.robjectsimportr >>>a=r['matrix'](range(10),nrow=2) >>>printa [,1][,2][,3][,4][,5] [1,]02468 [2,]13579
2、python对象转换成R对象
通常,可以将python的list对象,转换成为R的vector对象,之后直接使用R函数调用。相应的函数是robjects.StrVector()/robjects.IntVector()/robjects.FloatVector()/robjects.complexVector()/robjects.FactorVector()/robjects.BoolVector()/,这些函数将python列表转化成R的字符/整数/浮点/复数/因子/布尔向量。robjects.ListVector()将python的字典转换成R的列表。
具体转换可见http://rpy.sourceforge.net/rpy2/doc-2.2/html/vector.html#creating-vectors
比如:
>>>testmatrix=robjects.IntVector([1,2,3,4]) >>>robjects.r['matrix'](testmatrix,nrow=2) #anotherdynamicargumentsexample >>>x=robjects.IntVector(range(10)) >>>y=robjects.r.rnorm(10) >>>kwargs={'ylab':'foo/bar','type':'b','col':'blue','log':'x'} >>>robjects.r.plot(*args,**kwargs) >>>
注意事项:
使用vector系列函数时,输入的只能是python的列表,而不能是数字或者字符串。
3、载入和使用R包
使用rpy2.robjects.packages.importr对象,调用方法是
>>>fromrpy2.robjects.packagesimportimportr >>>base=importr('base') >>>stats=importr('stats') >>>affy=importr('affy') >>>stats.rnorm(10) 如果想引用一个包中的隐变量,也很简单,只要载入包,然后所有r命令化成成字符串,之后引用即可(这种方法是万能的),比如 >>>fromrpy2.robjects.packagesimportimportr >>>importr('hwriter') >>>a=r('hwriter:::hwrite.table(matrix(1:10,2))') >>>print(a) [1]"<tableborder="1">n<tr>n<td>1</td><td>3</td><td>5</td><td>7</td><td>9</td></tr>n<tr>n<td>2</td><td>4</td> <td>6</td><td>8</td><td>10</td></tr>n</table>n"
4、导入R脚本
使用R的source函数:
fromrpy2.robjectsimportr r.source('testrscript.r')
5、转换R对象为全局变量
因为使用函数robjects.globalenv()将对象转换成全局变量,特别是遇到python找不到一个R对象时(此时R对象可能通过r('Rcode')调用),留意将R对象转变成全局变量。
三、R对象转换成python对象
推荐使用tuple( )或者list( )函数,将R对象转换成tuple或者list。
>>>a=r('c(1,2,3)') >>>a <FloatVector-Python:0x904746c/R:0x9114978> [1.000000,2.000000,3.000000] >>>str(a) '[1]123n' >>>tuple(a) (1.0,2.0,3.0) >>>list(a) [1.0,2.0,3.0] >>>b=r('matrix(1:6,2,3)') >>>b <Matrix-Python:0x9039c6c/R:0x9114710> [1,2,3,4,5,6] >>>printb [,1][,2][,3] [1,]135 [2,]246 >>>tuple(b) (1,2,3,4,5,6) >>>list(b)