#开放源代码
milvus - 支持嵌入相似性搜索与AI应用的开源的云原生向量数据库
Github开源项目AI应用向量数据库Milvus嵌入相似搜索开放源代码
Milvus是一个开源向量数据库,专为提高嵌入相似性搜索和AI应用的效率。2.0版本采用云原生设计,支持存储与计算分离,全无状态组件提升弹性与灵活性。主要功能包括毫秒级查询、简化非结构化数据管理、高可靠性、强扩展性和混合搜索等。已有超过1000家企业用户和27000+ GitHub星标,并受到活跃的开源社区支持。
Darwin - 材料科学、化学和物理领域的LLaMA模型
Github开源项目LLaMA开放源代码DarwinAI带动科学研究科学文献
Darwin是一个开源项目,致力于在科学文献和数据集上预训练和微调LLaMA模型,特别针对材料科学、化学和物理领域。Darwin整合了结构化和非结构化的科学知识,提升了语言模型在科学研究中的效率。基于7B LLaMA模型,Darwin在实验带隙预测和金属分类任务中表现优异,超过了Fine-tuned GPT3.5和专用机器学习模型。尽管仍在开发中,Darwin在解决科学问题方面已展现出巨大潜力。
embedditor - 开源向量搜索优化工具,编辑GPT嵌入
Github开源项目GPT向量搜索嵌入开放源代码Embedditor
Embedditor是一款开源嵌入预处理编辑器,简便如微软Word,帮助编辑GPT/LLM嵌入,优化向量搜索并显著降低嵌入和存储成本。提高检索内容的关联性和准确性,支持自动化预处理,去除噪音信息和常用词汇。特性包括添加元数据、标记和筛选嵌入部分,提供美观的HTML标记和多种文件格式保存。本地部署,最大化数据控制并降低30%成本。
graphbrain - AI领域的开源工具,用于自动语义提取与文本理解
人工智能Github开源项目Python开放源代码Graphbrain语义超图
Graphbrain是一个AI开源软件库和科研工具,旨在实现自动语义提取和文本理解,探索和推理知识。此项目由欧盟研究委员会资助,作为socsemics项目的一部分,关注在线公共空间的碎片化。Graphbrain利用语义超图概念,结合符号AI与统计/连接主义机器学习方法,旨在提升研究的可理解性和可重复性,尤其适用于计算社会科学、认知科学和人文学科的研究。
kandinsky-3 - 开放源代码的俄罗斯文化文本到图像扩散模型
Github开源项目模型扩散模型文本生成图像Huggingface开放源代码俄罗斯文化Kandinsky 3.0
Kandinsky 3.0是一个开放源代码的文本到图像扩散模型,注重生成与俄罗斯文化相关的图像。相较于Kandinsky2-x系列,该模型使用了更丰富的数据集,并通过增大文本编码器和扩散U-Net模型的规模,提升了文本理解和图像质量。Kandinsky 3.0包括基本型和修补型两种模型,经过不同步数的训练,提供高质量的图像生成。
相关文章