利用Whisper将音频转化为文本,使用GPT-3.5进行文本分析,并通过DALL·E生成个性化电竞标志
该应用利用Whisper将音频转化为文本,使用GPT-3.5进行文本分析,并通过DALL·E生成个性化电竞标志。应用基于Jetpack Compose和OpenAI Kotlin在Tenerife GG活动中展示了AI的实际应用。
Tenerife GG(enerator) 是一个由人工智能支持的电竞标志生成器。这款安卓应用程序是在一次学术性活动“Tenerife GG”上开发的,旨在作为一个应用实例,展示如何整合和利用三种不同的人工智能模型来生成电竞标志。
该项目使用了以下人工智能模型:
同时,这个项目利用了 Jetpack Compose 进行用户界面设计,并通过 OpenAI Kotlin 库与OpenAI的模型进行交互。
要使用这款应用,用户需要在 OpenAI平台 生成一个API Key。在使用之前,需要将这个密钥添加到项目中的 conf/Env.kt
文件中:
const val OPENAI_API_KEY = "MI_KEY"
用户可以下载项目并在 Android Studio 中打开。配置好必要的API Key便可开始运行程序。此外,还有一个可供安装的应用程序文件(APK)供用户快速体验使用。在使用之前,需要在设备上允许安装第三方应用。
在应用中,用户需要输入以下信息以生成所需的标志:
用户可以通过以下方式增加标志生成的细节:
用户可以选择:
项目还有一个完整的创建应用过程的视频教程,有兴趣者可以观看以便更好地理解整个开发流程。
项目开发者鼓励大家通过社交媒体和开发者社区加入讨论和贡献。用户还可以在 GitHub 上支持项目,通过“☆ Star”给予肯定。
这个项目不仅展示了人工智能在电竞领域的应用潜力,同时通过开放性和社区协作推动了技术创新和学习。
AI Excel全自动制表工具
AEE 在线 AI 全自动 Excel 编辑器,提供智能录入、自动公式、数据整理、图表生成等功能,高效处理 Excel 任务,提升办公效率。支持自动高亮数据、批量计算、不规则数据录入,适用于企业、教育、金融等多场景。
基于 UI-TARS 视觉语言模型的桌面应用,可通过自然语言控制计算机进行多模态操作。
UI-TARS-desktop 是一款功能强大的桌面应用,基于 UI-TARS(视觉语言模型)构建。它具备自然语言控制、截图与视觉识别、精确的鼠标键盘控制等功能,支持跨平台使用(Windows/MacOS),能提供实时反馈和状态显示,且数据完全本地处理,保障隐私安全。该应用集成了多种大语言模型和搜索方式,还可进行文件系统操作。适用于需要智能交互和自动化任务的场景,如信息检索、文件管理等。其提供了详细的文档,包括快速启动、部署、贡献指南和 SDK 使用说明等,方便开发者使用和扩展。
开源且先进的大规模视频生成模型项目
Wan2.1 是一个开源且先进的大规模视频生成模型项目,支持文本到图像、文本到视频、图像到视频等多种生成任务。它具备丰富的配置选项,可调整分辨率、扩散步数等参数,还能对提示词进行增强。使用了多种先进技术和工具,在视频和图像生成领域具有广泛应用前景,适合研究人员和开发者使用。
全流程 AI 驱动的数据可视化工具,助力用户轻松创作高颜值图表
爱图表(aitubiao.com)就是AI图表,是由镝数科技推出的一款创新型智能数据可视化平台,专注于为用户提供便捷的图表生成、数据分析和报告撰写服务。爱图表是中国首个在图表场景接入DeepSeek的产品。通过接入前沿的DeepSeek系列AI模型,爱图表结合强大的数据处理能力与智能化功能,致力于帮助职场人士高效处理和表达数据,提升工作效率和报告质量。