Project Icon

Qmedia

专为内容创作者设计的开源AI搜索引擎

QMedia是一个开源的多媒体AI搜索引擎,专为处理和整合文本、图片及短视频内容而设计。此搜索引擎支持本地部署,便于在保护隐私的同时进行有效的内容搜索和问答处理。

项目介绍:QMedia

QMedia 是一个专为内容创作者设计的开源多媒体 AI 内容搜索引擎。它支持多种信息提取方法,包括文本、图像和短视频内容。通过整合非结构化的文本、图像和短视频信息,QMedia 构建了一个多模态 RAG 内容问答系统,以开源的方式分享和交流 AI 内容创作的理念。

主要功能

内容卡片

内容会以卡片形式展示,包括图片、文本和视频内容。这一展示方式受到 XHS 网页版本的启发,使用 Typescript、Next.js、TailwindCSS 和 Shadcn/UI 技术栈实现。主要功能模块包括:

  • RAG 搜索/问答服务
  • 图片/文本/视频模型服务 这些模块可以根据用户资源独立部署,也可嵌入到其他系统中进行内容提取。

多模态内容 RAG

该功能支持图片、文本和短视频资料的搜索。根据用户查询,从内容中提取有用信息并生成高质量回答,展示内容来源,并通过内容卡片分解图片、文本和短视频信息。 此外,支持谷歌内容搜索。

纯本地多模态模型

支持在本地部署各种类型的模型,独立于 RAG 应用层,从而易于替换不同的模型。提供本地模型生命周期管理,支持手动或自动发布以减少服务器负载。

  • 语言模型:支持本地 Ollama 模型切换,如 llama3:8b-instruct 和 llama3:70b-instruct。
  • 特征嵌入模型:包括 CLIP 编码器 (图像嵌入) 和 BGE 编码器 (文本嵌入)。
  • 图像模型:包括文本 OCR 识别(QAnything)。
  • 视频模型:支持视频转录及基于 LLM 的短视频内容总结。

安装说明

QMedia 服务根据资源可用性选择本地或云端模型服务部署。具体安装步骤包括以下服务:

  • mm_server:多模态模型服务,涉及模型的部署和 API 调用。
  • mmrag_server:内容搜索和问答服务,支持内容卡片的展示与查询、多模态数据 RAG 检索服务。
  • qmedia_web:网页服务,使用 TypeScript、Next.js、Tailwind CSS 和 shadcn/ui 构建。

使用方式

组合使用

可以将 mm_serverqmedia_webmmrag_server 组合使用,用于网页内容展示、内容 RAG 搜索和问答、模型服务等。 启动服务后,mmrag_server 会读取伪数据,通过 mm_server 提取和组织信息,存储在数据库中,然后进行检索和 Q&A。

独立模型服务

可单独启动 mm_server 以提取图像/文本/视频信息,提供独立的图像编码、文本编码、视频转录提取以及图像 OCR 服务。

未来计划

  • 推出图像/文本/短视频内容分析及流行内容分解功能
  • 支持相似图片/文本/视频的搜索
  • 推出卡片图像/文本内容生成工具
  • 支持短视频内容编辑功能

许可证

QMedia 基于 MIT 许可证发布。

鸣谢

感谢 QAnything 提供了强大的 OCR 模型,感谢 llava-llama3 提供了先进的视觉理解模型。

项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

白日梦AI

白日梦AI提供专注于AI视频生成的多样化功能,包括文生视频、动态画面和形象生成等,帮助用户快速上手,创造专业级内容。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

讯飞绘镜

讯飞绘镜是一个支持从创意到完整视频创作的智能平台,用户可以快速生成视频素材并创作独特的音乐视频和故事。平台提供多样化的主题和精选作品,帮助用户探索创意灵感。

Project Cover

讯飞文书

讯飞文书依托讯飞星火大模型,为文书写作者提供从素材筹备到稿件撰写及审稿的全程支持。通过录音智记和以稿写稿等功能,满足事务性工作的高频需求,帮助撰稿人节省精力,提高效率,优化工作与生活。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号