Project Icon

granite-8b-code-base-4k

多语言代码处理和优化的开源模型

Granite-8B-Code-Base-4K是IBM Research推出的开源代码生成模型,旨在跨多种编程语言执行代码生成、解释与修复任务。采用两阶段训练策略处理海量数据以提升模型的理解能力和任务执行效率,适用于软件开发中的多种应用场景。

granite-3.0-2b-instruct - 提供多语言支持的文本生成模型,适用于构建智能助手
GithubGranite-3.0-2B-InstructHuggingface多语言支持开源项目文本生成模型模型架构训练数据
Granite-3.0-2B-Instruct是由IBM开发的文本生成模型,支持十二种语言,包括中文。模型在基础模型Granite-3.0-2B-Base的基础上经过细调优化,结合开放源码和内部合成数据集。它能够执行文本分类、提取、问答及代码相关任务,采用decoder-only架构。适用于多领域的人工智能助手构建,但在非英语任务的性能可能不如英语任务。
CodeGeeX4 - 开源多语言代码生成模型的新突破
AI编程CodeGeeX4Github代码生成多语言模型开源开源项目
CodeGeeX4-ALL-9B是一个基于GLM-4-9B训练的多语言代码生成模型。它提供代码补全、生成、解释等多项功能,并支持网络搜索、函数调用和仓库级代码问答。作为参数量低于10B的代码生成模型中性能最佳的一款,CodeGeeX4-ALL-9B在多个公开基准测试中表现优异,在某些方面甚至超越了参数量更大的通用模型,体现了其在推理速度和模型性能之间的出色平衡。
granite-guardian-hap-38m - IBM开源轻量级文本毒性检测模型实现大语言模型安全防护
GithubHuggingfaceRoBERTa内容审核开源项目性能优化文本检测模型模型分类
Granite-Guardian-HAP-38m是一个用于检测英文文本有害内容的轻量级二分类模型。通过4层神经网络架构设计,模型参数量仅为3800万,较RoBERTa模型显著缩减规模。该模型支持CPU部署运行,具备低延迟推理能力,适用于大语言模型的安全防护以及批量文本处理场景。实测显示,模型在维持分类准确率的同时达到了理想的性能指标。
aiXcoder-7B - 多语言代码生成模型 提高开发效率与代码质量
AI编程GithubaiXcoder-7B代码生成大语言模型开源项目模型训练
aiXcoder-7B是一个支持多种编程语言的代码生成模型。该模型在代码补全、理解和生成方面表现优异,经过1.2万亿唯一标记的训练,采用了针对实际代码生成场景的预训练任务和上下文信息设计。aiXcoder-7B提高了代码补全和生成的效率与准确性,未来还将优化测试用例生成和代码调试等功能,为开发者提供更全面的编程支持。
codegen-2B-multi - 提供多语言程序合成的自回归语言模型
CodeGenGithubHuggingface多编程语言开源项目机器学习模型模型程序合成自动生成代码
CodeGen-Multi 2B模型是一种自回归语言模型,经过多个编程语言的大规模数据集预训练,能够合成可执行代码。模型以CodeGen-NL 2B为基础,并在多语言数据上进一步训练,能够从自然语言和编程语言中提取特征。模型在主要代码生成基准上经过评估,可用于从注释生成代码或完成部分代码。用户可借助AutoModelForCausalLM功能加载模型,适用于多种编程语言。
codegemma-7b-it - 自然语言代码生成与对话专家
CodeGemmaGithubHuggingface代码完成代码生成对话生成开源项目模型评估方法
CodeGemma项目集合了7B和2B参数的开源代码模型,专注代码补全、生成及对话功能,尤其突出自然语言转代码的能力。codegemma-7b-it变体特别在指令生成方面展示了优异表现。借助FIM技术和依赖关系图打包技术,模型增强了与真实应用的契合度。此外,该项目注重伦理与安全,符合Google政策标准,适用于代码生成、学习和技术交流,兼容多种编程语言。
codegen-350M-multi - 支持多种编程语言的程序合成模型
CodeGenGithubHuggingface多语言模型开源项目模型程序合成行业应用训练数据
CodeGen-Multi 350M是一种程序合成模型,旨在生成可执行代码。其预训练数据来自GitHub的多语言代码库,包括C、C++、Go、Java、JavaScript和Python等。模型具备350M个参数,可以高效生成和补全代码。适用于HumanEval和MTPB等基准测试,为程序合成任务提供了良好的支持。
starcoder2-3b - 多语言代码生成模型 专注17种主流编程语言
GithubHuggingfaceStarCoder2代码生成开源项目机器学习模型编程语言自然语言处理
StarCoder2-3B是一个基于30亿参数训练的代码生成模型,专注于17种主流编程语言。该模型采用分组查询注意力和滑动窗口技术,具有16384个token的上下文理解能力。StarCoder2-3B可根据上下文生成代码片段,适用于多种代码生成和补全任务,但生成的代码可能需要进一步优化。模型在大规模多语言代码数据集上训练,旨在提供灵活的编程辅助功能。
starcoder2-15b-GPTQ - 支持600多种编程语言的大规模代码生成模型
GithubHuggingfaceStarCoder2代码生成开源项目机器学习模型深度学习自然语言处理
starcoder2-15b-GPTQ是一个经GPTQ量化的15B参数代码生成模型,支持600多种编程语言。它采用分组查询注意力机制和滑动窗口注意力,具有16,384个token的上下文窗口,在4万亿以上token上训练。模型可生成代码片段,但可能存在缺陷,使用时需谨慎。提供多种精度和量化版本,适应不同硬件需求。
gritlm - 采用生成代表性指令微调技术的先进语言模型
Generative Representational Instruction TuningGithubGritLM嵌入开源项目生成语言模型
本页面详细介绍了生成代表性指令微调(GRIT)技术,该技术训练大型语言模型同时处理生成和嵌入任务。GritLM 7B在大规模文本嵌入基准测试(MTEB)中树立了新标杆,并在多种生成任务中表现出色。GritLM 8x7B在开放生成语言模型中表现最佳,同时在嵌入任务中保持领先。GRIT结合生成和嵌入训练,无性能损失,并提高了检索增强生成(RAG)的速度超过60%。代码和模型均已免费开放,欢迎社区贡献和使用。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

稿定AI

稿定设计 是一个多功能的在线设计和创意平台,提供广泛的设计工具和资源,以满足不同用户的需求。从专业的图形设计师到普通用户,无论是进行图片处理、智能抠图、H5页面制作还是视频剪辑,稿定设计都能提供简单、高效的解决方案。该平台以其用户友好的界面和强大的功能集合,帮助用户轻松实现创意设计。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号