Project Icon

bigyi-15b

合并模型技术的进步:探索创新设计

Bigyi-15b融合了若干预训练语言模型,利用mergekit工具及passthrough合并方法,以01-ai/Yi-9B为核心,具备4k上下文处理能力。此模型增强了在多应用场景中的表现,比如复杂数值计算与自然语言生成,同时优化了信息匹配准确性。

BayLing - 跨语言对齐与指令遵循的多语言大模型
BayLingGithub交互翻译多语言大语言模型开源项目指令跟随
BayLing是一个开源的多语言大规模语言模型,专注于跨语言对齐和指令遵循。该模型在英汉双语生成、指令执行和多轮交互方面表现优异,可在16GB显存的消费级GPU上运行。BayLing支持翻译、写作、创作和建议等多种任务,为用户提供多语言智能辅助。
Llama3-8B-Chinese-Chat-GGUF-4bit - 支持中英文交流的跨语言模型功能
GithubHuggingfaceLlama3-8B-Chinese-Chat功能升级开源项目模型语言模型
Llama3-8B-Chinese-Chat提供了优化的语言模型,以支持中英文用户的交互。最新的v2.1版本的模型提升了角色扮演、函数调用和数学计算功能,并减少了中文回答中夹杂英文的现象。用户可以通过GitHub和HuggingFace平台获取使用指南,提供在线演示和多种模型版本以满足不同用户的需求。
Multi-LLM-Agent - 多模型协作系统提升小型语言模型工具学习效能
GithubMulti-LLM Agentα-UMi人工智能大语言模型工具学习开源项目
α-UMi是一个创新的多模型协作系统,将语言模型能力分解为规划、调用和总结三个组件。通过全局到局部的渐进式微调策略和灵活的提示设计,该系统显著提升了小型语言模型在工具学习任务中的表现,甚至超越了某些大型闭源模型。α-UMi为复杂AI任务提供了新的高效解决方案。
Baichuan2 - 开源大语言模型
Baichuan 2Github大语言模型开源开源项目推理和部署模型微调
Baichuan 2,新一代开源大语言模型,拥有基于2.6万亿Tokens训练的7B与13B版本,展现卓越性能于多语言、法律及医疗领域。开发者经官方审核后,可免费商用。详情见技术报告《Baichuan 2: Open Large-scale Language Models》。
h2o-danube3-500m-base - 500M参数的大规模语言模型,支持离线文本生成
GPTGithubH2O.aiHuggingface大语言模型开源项目模型模型架构转化器
由H2O.ai推出的h2o-danube3-500m模型,是一个大规模语言模型,采用Llama 2架构调整及500M参数设计。模型支持原生离线运行,尤其适用于手机设备,并集成Mistral分词器,拥有32,000词汇量及8,192长度的上下文生成能力。在支持transformers库的环境中,模型可在GPU设备上有效运行,并且支持量化和多GPU分片处理。重要提醒用户在使用模型生成的内容时保持审慎态度并自行承担责任。
Ministral-3b-instruct-GGUF - 更高效的量化语言模型,为文本生成带来显著性能提升
Apache 2.0GithubHuggingfaceNLPtransformers开源项目模型模型量化语言模型
Ministral-3b-instruct-GGUF是一个基于llama.cpp的高效量化模型,专为Ministral系列的3B参数设计优化,并从Mistral-7B进行微调。它使用混合数据集,主要用于英语文本生成。通过量化技术,该模型在保持精度的同时,显著减少了存储和计算需求,理想应用于高效文本生成场景。项目遵循Apache 2.0许可协议,以确保合规使用。
pythia-1.4b-deduped-v0 - 开源语言模型套件助力可解释性研究
EleutherAIGithubHuggingfacePythia开源项目机器学习模型自然语言处理语言模型
Pythia-1.4B-deduped是EleutherAI推出的开源语言模型,旨在推动AI可解释性研究。该模型在去重后的Pile数据集上训练,提供143个均匀分布的检查点,便于研究人员分析模型训练过程。虽然不以下游任务性能为主要目标,Pythia-1.4B-deduped在多项评估中仍表现出色,与同规模模型相当或更优。模型采用Apache 2.0许可,可用于进一步研究、微调和部署。
Phi-3-medium-4k-instruct - 轻量级多任务语言模型
GithubHuggingfacePhi-3大语言模型开源项目指令微调推理能力模型自然语言处理
Phi-3-medium-4k-instruct是一个14B参数的轻量级开源语言模型,在常识、语言理解、数学和编码等多项基准测试中表现优异。该模型采用高质量合成数据和公开数据训练,经过指令微调和安全优化,支持4K上下文长度。它适用于内存/计算受限环境和低延迟场景,可广泛应用于商业和研究领域。
Llama-3.1-8B - Meta推出的多语言大型语言模型 支持128K超长上下文
GithubHuggingfaceLlama 3.1Meta人工智能多语言大语言模型开源项目模型
Llama-3.1-8B是Meta公司推出的多语言大型语言模型,采用优化的Transformer架构,支持128K超长上下文。该模型在8种语言中进行预训练和指令微调,在通用对话和多语言任务上表现优异。Llama-3.1-8B适用于助手式聊天、自然语言生成等商业和研究场景,并提供自定义商业许可证。用户在遵守使用政策的前提下可广泛应用该模型。
Xwin-LM-7B-V0.2 - 优化大语言模型对齐技术,显著提升性能
AlpacaEvalGithubHuggingfaceXwin-LM大语言模型对齐技术开源项目强化学习模型
Xwin-LM项目开发并开源大语言模型对齐技术,涵盖监督微调、奖励模型等多种方法。基于Llama2构建的版本在AlpacaEval评测中表现卓越,超过GPT-4。最新的Xwin-LM-7B-V0.2和13B-V0.2在与GPT-4的比较中分别达到59.83%和70.36%胜率。项目不断更新以提高模型的稳定性和可重复性。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号