OpenAI 项目介绍
OpenAI 是一家成立于 2015 年,总部位于美国旧金山的非营利人工智能研究组织。其宗旨是推动数字智能发展,以造福全人类并促进社会进步。OpenAI 致力于研发可以自主思考和行动的 AI(人工智能)程序和系统,其使命是确保 AI 的安全和负责任的使用,带来社会公益、经济增长等多方面的公共利益。这包括对通用 AI 安全、自然语言处理、应用强化学习方法、机器视觉算法等重要话题的前沿研究。
OpenAI API 的应用
OpenAI 的 API 可以应用于几乎所有涉及自然语言或代码的理解和生成的任务。OpenAI 提供了各种各样的模型,适用于不同任务,并且支持用户微调定制模型。这些模型可以用于从内容生成到语义搜索和分类的各种应用。
如何安装
OpenAI 可以通过 Swift Package Manager(Swift 包管理工具)进行安装。通过在 Package.swift
文件中添加 OpenAI 作为依赖项,可以轻松将其集成到 Swift 应用程序中。
dependencies: [
.package(url: "https://github.com/MacPaw/OpenAI.git", branch: "main")
]
使用示例
要使用 OpenAI API,首先需要从 OpenAI 组织获取 API 密钥。请注意 API 密钥的保密性! 不要与他人共享或在客户端代码(如浏览器或应用中)中公开。生产环境请求应通过自身的后端服务器路由,后端服务器可以从环境变量或密钥管理服务中安全加载 API 密钥。
初始化
一旦拥有了 API 密钥,可以初始化 OpenAI
类,它是 API 的入口点。
let openAI = OpenAI(apiToken: "YOUR_TOKEN_HERE")
任务:补全 (Completions)
在给定提示时,模型会返回一个或多个预测补全,用户可以通过提供自己的查询来请求补全结果。
let query = CompletionsQuery(model: .textDavinci_003, prompt: "What is 42?", temperature: 0, maxTokens: 100)
openAI.completions(query: query) { result in
// 处理结果
}
图片生成
OpenAI 的 Dall-E 系统可以根据人工描述生成图像,并拥有广泛的潜在应用。此功能让设计、动画、插画及工程领域等都受益匪浅。
创建图像
用户可以输入一段文本描述,AI 模型会根据描述生成图像。
let query = ImagesQuery(prompt: "White cat with heterochromia sitting on the kitchen table", n: 1, size: "1024x1024")
openAI.images(query: query) { result in
// 处理结果
}
音频服务
OpenAI 提供音频转文本及翻译两项服务,支持多种音频格式。
音频转录
可以将音频转录成文本,例如以下示例将音频文件转录为文本。
let data = Data(contentsOfURL:...)
let query = AudioTranscriptionQuery(file: data, fileName: "audio.m4a", model: .whisper_1)
openAI.audioTranscriptions(query: query) { result in
// 处理结果
}
贡献指南
对于希望贡献到项目的开发者,OpenAI 提供了一些贡献指南,包括清晰命名 PR(Pull Request)和分支,使用约定的提交说明的原则等等。
使用文档和示例
此处展示的 OpenAI 项目不仅展示了前沿的人工智能技术,也为开发者和用户提供了强大的工具套件,使其能够探索和实现 AI 在日常应用中的潜力。