Project Icon

phi-1_5

13亿参数的语言模型展现卓越性能

Phi-1.5是微软开发的13亿参数Transformer语言模型,在10亿参数以下模型中展现近乎最先进的性能。它未经指令微调,主要用于研究语言模型的安全性和改进。该模型支持多种任务,包括文本生成和代码编写,适用于问答、聊天和编程场景。然而,用户应注意其输出可能存在偏见或不准确,仅供研究参考。

Yi-1.5-9B-32K - 中型开源模型性能显著提升
GithubHuggingfaceYi-1.5开源模型开源项目模型算术推理编程性能语言理解
Yi-1.5-9B-32K作为中型开源模型,以其在语言理解、推理及阅读理解上的出色表现而著称。经过3.6T预训练和多样化微调,其在编码、数学和指令遵循能力上较前版有大幅提升,适合需要高效开源AI解决方案的用户。
Qwen1.5-14B - 基于Transformer的多语言大模型 支持32K上下文长度
GithubHuggingfaceQwen1.5多语言支持大规模预训练开源项目模型自然语言处理语言模型
Qwen1.5作为Qwen2的预览版,是一个支持多语言的大规模语言模型。该模型提供多种规模版本,支持长文本理解,具备增强的聊天能力和改进的多语言处理功能。模型在技术架构上采用了先进的Transformer结构,并针对自然语言和代码处理进行了优化。
Qwen2-1.5B - 优秀性能和多语言能力的开源大语言模型
GithubHuggingfaceQwen2多语言能力大语言模型开源项目性能评估模型自然语言处理
Qwen2-1.5B是一款开源大语言模型,具有1.3B非嵌入参数。它在自然语言理解、生成、多语言处理、编程、数学和推理等领域表现优异。该模型在MMLU、GSM8K等多项基准测试中取得了优秀成绩,展现了较强的多语言能力。Qwen2-1.5B采用改进的Transformer架构,为进一步微调和应用奠定了基础。
Phi-3-Vision-MLX - 为Apple Silicon优化的多模态AI框架
AI框架Apple SiliconGithubPhi-3-MLX开源项目视觉模型语言模型
Phi-3-MLX是一个为Apple Silicon优化的AI框架,整合了Phi-3-Vision多模态模型和Phi-3-Mini-128K语言模型。该框架提供简洁接口,支持文本生成、视觉问答和代码执行等AI任务。项目特性包括批量处理、模型量化和LoRA微调,并可通过API扩展功能。Phi-3-MLX为开发者提供了高效灵活的AI工具,专为Apple Silicon设备设计。
Qwen1.5-72B-Chat - 支持多语言的720亿参数开源语言模型
GithubHuggingfaceQwen1.5人工智能多语言支持大语言模型开源项目模型自然语言处理
Qwen1.5-72B-Chat作为Qwen2的预发布版本,集成了从5亿到720亿参数的8种规模模型。模型采用Transformer架构和SwiGLU激活函数,支持32K上下文长度和多语言处理。通过Hugging Face框架即可部署使用,同时提供GPTQ、AWQ等多种量化版本,可满足不同场景需求。
t5-3b - 统一多语言自然语言处理任务的创新模型
GithubHuggingfaceT5-3B多任务学习开源项目文本到文本转换模型自然语言处理预训练模型
T5-3B是一个拥有30亿参数的多语言自然语言处理模型。它采用创新的文本到文本框架,统一处理机器翻译、文档摘要、问答和分类等多种NLP任务。该模型在C4语料库上预训练,并在24个任务中进行评估,展现出优秀的多语言和多任务处理能力。T5-3B为NLP领域的迁移学习研究提供了新的思路和可能性。
Phi-3.5-mini-instruct-GGUF - Microsoft Phi-3.5-mini模型的GGUF格式多位宽量化版本
GGUFGithubHuggingfacePhi-3.5开源项目文本生成本地部署模型量化模型
此项目提供Microsoft Phi-3.5-mini-instruct模型的GGUF格式量化版本。GGUF是llama.cpp团队推出的新格式,取代了GGML。支持2-bit至8-bit多种量化位宽,兼容多个GGUF支持工具,如llama.cpp和LM Studio。这些工具具备GPU加速和Web界面,便于本地部署和使用大型语言模型。
pythia - 大语言模型训练过程知识演化分析开源项目
GithubPythia可解释性研究大语言模型学习动态开源项目模型训练
Pythia是一个开源项目,旨在分析大语言模型训练过程中的知识演化。该项目提供完整的模型、数据和代码,包含154个训练检查点,支持研究人员深入探索学习动态和因果关系。Pythia是业界首个支持全面复现和学习动态分析的模型套件,为大语言模型的可解释性研究提供了重要工具。
t5-base - 多语言自然语言处理的统一文本转换模型
GithubHuggingfaceT5模型多任务学习开源项目文本到文本转换模型自然语言处理迁移学习
T5-base是一个具有2.2亿参数的语言模型,将NLP任务统一为文本到文本格式。该模型在机器翻译、摘要、问答和分类等任务中表现优异,支持多种语言。T5-base采用创新的预训练方法,结合无监督和有监督任务,在24个NLP任务中进行了评估,为NLP研究和应用提供了强大支持。
SciPhi-Mistral-7B-32k - 基于Mistral-7B-v0.1增强科学推理与教育能力的AI模型
GithubHuggingfaceSciPhi-Mistral-7B-32kTransformer大语言模型开源项目教育能力模型科学推理
SciPhi-Mistral-7B-32k是从Mistral-7B-v0.1微调而来的大型语言模型,通过四轮微调和超过十亿个token的数据集,实现了卓越的科学推理及教育能力。其特点包括采用变压器架构、组内查询注意力、滑窗注意力,并支持字节回退BPE分词器。SciPhi-Self-RAG-Mistral-7B-32k当前可用,具体细节可查看相关文档。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号