Project Icon

swift

基于多项先进技术的开源AI语音交互系统

Swift是一个开源的AI语音交互系统,集成了多项先进技术。系统使用Groq技术实现OpenAI Whisper的语音转写和Meta Llama 3的文本生成,通过Cartesia的Sonic模型进行语音合成,并采用VAD技术进行语音检测。项目基于Next.js框架和TypeScript开发,在Vercel平台部署。Swift旨在提供高效的AI语音交互能力。

swift - 轻量级基础架构,专为深度学习开发者打造的训练与推理框架
GithubSWIFT在线工具多模态大模型开源项目模型培训深度学习
SWIFT平台支持超过300种大型语言模型与50多种多模态模型的训练、微调和部署。提供NEFTune、LoRA+、LLaMA-PRO等先进的训练技术及适配器库,针对各种研发和生产环境。同时,平台提供Gradio web-ui及深度学习课程助力初学者快速上手。
SwiftOpenAI - Swift开源库,全面集成OpenAI、Azure、AIProxy及流媒体支持
APIGithubSwiftOpenAIiOSopen sourceswift开源项目
SwiftOpenAI是一个开源的Swift库,设计用于与OpenAI的API轻松交互,支持所有OpenAI端点。新增对Azure、AIProxy及助手流API的支持,用户只需API Key即可访问音频转录、翻译、生成、聊天、图像处理等功能。通过Swift Package Manager安装,简化集成,提供网络错误代码处理示例,方便开发者优化代码。
ms-swift - 支持300+模型训练和轻量级微调的高效框架
GithubLLMModelScopeSWIFT多模态模型开源项目轻量级训练
SWIFT是一款高效框架,支持超过300个大语言模型和50多个多模态大模型的训练、推理、评估和部署。它集成了NEFTune、LoRA+和LLaMA-PRO等先进技术,适用于研究和生产环境。框架还提供了易用的Gradio web-ui界面和详细文档,非常适合初学者和资深开发者使用。最新版本增加了对多种前沿模型和加速算法的支持,适用于广泛的应用场景。
SwiftOpenAI - Swift社区开发的OpenAI API集成SDK
DALL·EGPT-4GithubOpenAI APISwiftSwiftOpenAI开源项目
SwiftOpenAI项目提供了功能强大且易于使用的Swift SDK,帮助开发者轻松集成OpenAI的高级AI模型,如GPT-4、GPT-3等。项目包含详细的安装指南和代码示例,供开发者快速实现图像生成、音频转换和聊天回复等功能。特别强调API密钥的安全存储,提供了实际使用案例,适合希望在应用中利用AI技术的Swift开发者。
openai-whisper - Next.js实现的自动语音识别,支持实时转录和录音回放
GithubNext.jsopenai-whisper实时转录开源项目自动化转录语音识别
本项目是基于OpenAI Whisper的自动语音识别系统webapp,使用Next.js框架开发。它能自动录音并上传至服务器进行转录和翻译,然后将结果返回前端。支持录音回放以验证输出效果,同时可通过设置消除背景噪音和调整录音暂停时间。项目仍在开发中,提供多种配置选项,适合需要快速实现语音转录功能的开发者。
awesome-whisper - 开源AI语音识别技术
AIGithubOpenAIWhisper开源项目语音识别音频转录
Whisper是OpenAI开发的开源AI语音识别系统,支持多种语言和平台,具备高精度和实时处理能力,并适用于开发者和企业进行高效集成。
langchain-swift - 适用于多个Apple平台的Swift AI库
GithubLangChainOpenAISwift开源项目本地模型聊天机器人
langchain-swift是一个纯客户端的Swift库,不需要服务器,并支持iOS、macOS、watchOS和visionOS(测试版)。它提供本地模型、聊天机器人、QA机器人和数据检索,通过配置OpenAI、Supabase、百度OCR等多种API接口来增强功能。该库优化了不同Apple平台上的AI模型性能,旨在为开发者提供高效全面的AI解决方案。
SwiftGPT - SwiftUI开发的GPT-3.5 Turbo和DALL·E 2集成iOS应用
ChatGPTDALL·E 2GithubOpenAISwiftUIiOS开源项目
该SwiftUI应用集成了OpenAI的GPT-3.5 Turbo和DALL·E 2系统,提供智能对话和高质量图像生成功能。实现方式通过ChatGPTSwift和OpenAIKit库,用户需在API.swift文件中输入OpenAI API密钥。此项目支持iOS 14及更高版本,使用Swift语言编写,便于在iOS平台上开发和应用最新的AI技术。
Swift-AI - 使用Swift编写的深度学习库,专为苹果平台优化
GithubSwift AI开源项目手写识别深度学习神经网络苹果平台
Swift AI是一个全面使用Swift编写的深度学习库,适用于所有苹果平台,且即将拓展到Linux平台。该库涵盖了适用于人工智能和科学研究的多种工具集,例如专门针对苹果硬件进行优化的全连接神经网络。通过项目示例,您能够直观了解如何有效利用这些工具。
WhisperKit - Swift语音识别框架实现Apple设备本地推理
Apple设备CoreMLGithubSwiftWhisperKit开源项目语音识别
WhisperKit是一个集成OpenAI Whisper模型和Apple CoreML框架的Swift语音识别包。该框架支持Apple设备上的本地推理,具有自动选择适用模型、自定义模型部署等功能。WhisperKit提供音频转录API和命令行工具,便于开发者使用和测试。作为开源项目,WhisperKit欢迎社区贡献,不断优化其性能和功能。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

问小白

问小白是一个基于 DeepSeek R1 模型的智能对话平台,专为用户提供高效、贴心的对话体验。实时在线,支持深度思考和联网搜索。免费不限次数,帮用户写作、创作、分析和规划,各种任务随时完成!

Project Cover

白日梦AI

白日梦AI提供专注于AI视频生成的多样化功能,包括文生视频、动态画面和形象生成等,帮助用户快速上手,创造专业级内容。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

讯飞绘镜

讯飞绘镜是一个支持从创意到完整视频创作的智能平台,用户可以快速生成视频素材并创作独特的音乐视频和故事。平台提供多样化的主题和精选作品,帮助用户探索创意灵感。

Project Cover

讯飞文书

讯飞文书依托讯飞星火大模型,为文书写作者提供从素材筹备到稿件撰写及审稿的全程支持。通过录音智记和以稿写稿等功能,满足事务性工作的高频需求,帮助撰稿人节省精力,提高效率,优化工作与生活。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

Trae

Trae是一种自适应的集成开发环境(IDE),通过自动化和多元协作改变开发流程。利用Trae,团队能够更快速、精确地编写和部署代码,从而提高编程效率和项目交付速度。Trae具备上下文感知和代码自动完成功能,是提升开发效率的理想工具。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号