Project Icon

reticulate

R与Python互操作的全面解决方案

reticulate是一个实现R和Python全面互操作的包。它支持在R中调用Python、导入模块、在R Markdown中使用Python代码块,以及在R会话中交互使用Python。该包能够转换R和Python对象,并支持不同版本的Python环境。通过在R会话中嵌入Python会话,reticulate实现了高性能的无缝互操作。这个工具能够显著简化同时使用R和Python的数据科学工作流程。

R 与 Python 的接口

R-CMD-check

reticulate 包提供了一套全面的工具,用于实现 Python 和 R 之间的互操作性。该包包括以下功能:

reticulated python
  • 通过多种方式从 R 调用 Python,包括 R Markdown、执行 Python 脚本、导入 Python 模块,以及在 R 会话中交互式使用 Python。

  • 在 R 和 Python 对象之间进行转换(例如,R 和 Pandas 数据框之间,或 R 矩阵和 NumPy 数组之间)。

  • 灵活绑定不同版本的 Python,包括虚拟环境和 Conda 环境。

Reticulate 在 R 会话中嵌入了一个 Python 会话,实现了无缝、高性能的互操作性。如果你是一个在工作中使用 Python 的 R 开发者,或者是一个同时使用两种语言的数据科学团队成员,reticulate 可以显著简化你的工作流程!

入门

安装

从 CRAN 安装 reticulate 包:

install.packages("reticulate")

Python 版本

默认情况下,reticulate 使用名为 "r-reticulate" 的独立 Python 虚拟环境。

你可以使用 use_python() 函数指定其他 Python 版本,例如:

library(reticulate)
use_python("/usr/local/bin/python")

use_virtualenv()use_condaenv() 函数允许你指定虚拟环境或 Conda 环境中的 Python 版本,例如:

library(reticulate)
use_virtualenv("myenv")

有关更多详细信息,请参阅 Python 版本配置 文章。

Python 包

你可以使用标准的 shell 工具(如 pipconda)安装所需的 Python 包。或者,reticulate 包含了一套用于在虚拟环境和 Conda 环境中管理和安装包的函数。有关更多详细信息,请参阅 安装 Python 包 文章。

调用 Python

有多种方法可以将 Python 代码集成到你的 R 项目中:

  1. R Markdown 中的 Python — R Markdown 的新 Python 语言引擎,支持 R 和 Python 之间的双向通信(R 代码块可以访问 Python 对象,反之亦然)。

  2. 导入 Python 模块import() 函数允许你导入任何 Python 模块,并直接从 R 调用其函数。

  3. 执行 Python 脚本source_python() 函数允许你执行 Python 脚本,就像使用 source() 执行 R 脚本一样(脚本中定义的 Python 函数和对象可以直接在 R 会话中使用)。

  4. Python REPLrepl_python() 函数在 R 中创建一个交互式 Python 控制台。你在 Python 中创建的对象可以在 R 会话中使用(反之亦然)。

以下将详细解释每种技术。

R Markdown 中的 Python

reticulate 包为 R Markdown 提供了一个 Python 引擎,具有以下特性:

  1. 在嵌入 R 会话的单个 Python 会话中运行 Python 代码块(Python 代码块之间共享变量/状态)

  2. 打印 Python 输出,包括来自 matplotlib 的图形输出。

  3. 使用 py 对象从 R 访问在 Python 代码块中创建的对象(例如,py$x 可以从 R 访问在 Python 中创建的 x 变量)。

  4. 使用 r 对象从 Python 访问在 R 代码块中创建的对象(例如,r.x 可以从 Python 访问在 R 中创建的 x 变量)

提供了许多 Python 对象类型的内置转换,包括 NumPy 数组和 Pandas 数据框。例如,你可以使用 Pandas 读取和处理数据,然后使用 ggplot2 轻松绘制 Pandas 数据框:

请注意,只要安装了 reticulate,R Markdown 中的 reticulate Python 引擎默认就会启用。

有关更多详细信息,请参阅 R Markdown Python 引擎 文档。

导入 Python 模块

你可以使用 import() 函数导入任何 Python 模块并从 R 中调用它。例如,以下代码导入 Python 的 os 模块并调用 listdir() 函数:

library(reticulate)
os <- import("os")
os$listdir(".")
 [1] ".git"             ".gitignore"       ".Rbuildignore"    ".RData"
 [5] ".Rhistory"        ".Rproj.user"      ".travis.yml"      "appveyor.yml"
 [9] "DESCRIPTION"      "docs"             "external"         "index.html"
[13] "index.Rmd"        "inst"             "issues"           "LICENSE"
[17] "man"              "NAMESPACE"        "NEWS.md"          "pkgdown"
[21] "R"                "README.md"        "reticulate.Rproj" "src"
[25] "tests"            "vignettes"

可以通过 $ 运算符访问 Python 模块和类中的函数和其他数据(类似于你与 R 列表、环境或引用类交互的方式)。

导入的 Python 模块支持代码补全和内联帮助:

有关从 R 中与 Python 对象交互的更多详细信息,请参阅 从 R 调用 Python

执行 Python 脚本

你可以使用 source_python() 函数执行任何 Python 脚本,就像使用 source() 执行 R 脚本一样。例如,如果你有以下 Python 脚本 flights.py

import pandas
def read_flights(file):
  flights = pandas.read_csv(file)
  flights = flights[flights['dest'] == "ORD"]
  flights = flights[['carrier', 'dep_delay', 'arr_delay']]
  flights = flights.dropna()
  return flights

那么你可以执行该脚本并按如下方式调用 read_flights() 函数:

source_python("flights.py")
flights <- read_flights("flights.csv")

library(ggplot2)
ggplot(flights, aes(carrier, arr_delay)) + geom_point() + geom_jitter()

有关源Python代码的更多细节,请参阅source_python()文档。

Python REPL

如果你想交互式地使用Python,可以调用repl_python()函数,它在R会话中提供了一个嵌入式Python REPL。在Python REPL中创建的对象可以通过reticulate导出的py对象从R中访问。例如:

在Python REPL中输入exit可以返回R提示符。

请注意,Python代码也可以使用r对象(如r.flights)访问R会话中的对象。有关使用嵌入式Python REPL的更多详细信息,请参阅repl_python()文档。

类型转换

在调用Python时,R数据类型会自动转换为相应的Python类型。当值从Python返回到R时,它们会被转换回R类型。类型转换如下:

RPython示例
单元素原子向量标量1, 1L, TRUE, "foo"
无名列表或多元素原子向量列表c(1.0, 2.0, 3.0), c(1L, 2L, 3L)
有名列表字典list(a = 1L, b = 2.0), dict(x = x_data)
矩阵/数组NumPy ndarraymatrix(c(1,2,3,4), nrow = 2, ncol = 2)
数据框Pandas DataFramedata.frame(x = c(1,2,3), y = c("a", "b", "c"))
函数Python函数function(x) x + 1
NULL, TRUE, FALSENone, True, FalseNULL, TRUE, FALSE

如果返回的是自定义类的Python对象,则会返回该对象的R引用。你可以像使用R引用类实例一样调用该对象的方法和访问其属性。

学习更多

以下文章涵盖了使用reticulate的各个方面:

  • 从R调用Python — 描述了从R访问Python对象的各种方法,以及用于更高级交互和转换行为的可用函数。

  • R Markdown Python引擎 — 提供了在R Markdown文档中使用Python代码块的详细信息,包括如何从R代码块调用Python代码,反之亦然。

  • Python版本配置 — 描述了在R会话中确定reticulate使用哪个Python版本的设施。

  • 安装Python包 — 关于从PyPI或Conda安装Python包,以及使用virtualenvs和Conda环境管理包安装的文档。

  • 在R包中使用reticulate — 在R包中使用reticulate的指南和最佳实践。

  • R和Python中的数组 — 关于R和Python中数组差异及其对转换和互操作性影响的高级讨论。

  • Python入门 — 为R用户介绍Python。

为什么叫reticulate?

根据维基百科上关于网纹蟒的文章:

网纹蟒是一种在东南亚发现的蟒蛇。它们是世界上最长的蛇类和最长的爬行动物……学名reticulatus是拉丁语,意为"网状"或"网纹",指的是其复杂的颜色图案。

根据韦氏词典对reticulate的定义:

1:类似网络或网状;特别是:具有横穿的脉络、纤维或线条的网状叶。2:涉及依赖于包含多样交配群体的基因重组的进化变化。

该包使你能够将Python代码reticulate(编织)到R中,创造一个将两种语言交织在一起的新型项目。

项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

白日梦AI

白日梦AI提供专注于AI视频生成的多样化功能,包括文生视频、动态画面和形象生成等,帮助用户快速上手,创造专业级内容。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

讯飞绘镜

讯飞绘镜是一个支持从创意到完整视频创作的智能平台,用户可以快速生成视频素材并创作独特的音乐视频和故事。平台提供多样化的主题和精选作品,帮助用户探索创意灵感。

Project Cover

讯飞文书

讯飞文书依托讯飞星火大模型,为文书写作者提供从素材筹备到稿件撰写及审稿的全程支持。通过录音智记和以稿写稿等功能,满足事务性工作的高频需求,帮助撰稿人节省精力,提高效率,优化工作与生活。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号