Project Icon

naturalcc

弥合编程与自然语言的序列建模工具包

NaturalCC是一个开源的序列建模工具包,旨在缩小编程语言与自然语言之间的差距。它支持代码生成、补全、摘要等多项软件工程任务。该工具包采用模块化设计,集成了多个大型代码模型,支持多GPU训练和高效推理。NaturalCC还提供了预处理的基准数据集和评估工具,为代码智能研究与开发提供了全面的解决方案。

nccl - 优化GPU间通信的高性能库
GPU通信GithubNCCLNVIDIA并行计算开源项目深度学习
NCCL是NVIDIA开发的开源GPU通信库,为深度学习和高性能计算优化了全归约、广播等通信模式。它在PCIe、NVLink等平台上实现高带宽,支持单节点和多节点GPU应用。NCCL可用于任意数量的GPU,适配单进程和多进程(如MPI)环境,为AI和科学计算提供高效的通信解决方案。该项目提供简易的构建安装方法和灵活的编译选项,方便开发者根据需求优化性能。
deepseek-coder-33b-instruct - 多语言支持的AI编程模型
DeepSeek CoderGithubHuggingface人工智能代码模型开源项目模型深度学习自然语言处理
DeepSeek Coder是一款基于33B参数的AI代码模型,在2T tokens的代码和语言数据上训练而成。该模型支持多种编程语言,提供卓越的代码补全和填充功能。在多个基准测试中表现出色,能够进行项目级代码补全。DeepSeek Coder支持商业使用,开发者可通过简洁的Python接口调用模型,生成高质量代码。
nncf - Neural Network Compression Framework:高效神经网络推理压缩算法
GithubNeural Network Compression FrameworkONNXOpenVINOPyTorchTensorFlow开源项目
Neural Network Compression Framework (NNCF) 提供一套后训练和训练时的优化算法,用于在 OpenVINO 中优化神经网络推理,保证最小的精度损失。NNCF 支持 PyTorch、TensorFlow 和 ONNX 等模型,并提供示例展示不同压缩算法的使用案例。NNCF 还支持自动化模型图转换、分布式训练和多种算法的无缝组合,支持将压缩后的 PyTorch 模型导出为 ONNX 检查点及将 TensorFlow 模型导出为 SavedModel 格式。
mynlp - 高性能和可扩展的中文自然语言处理工具包
GithubMynlp中文NLP安装开源项目模型词典
mynlp是一个高性能且可扩展的中文自然语言处理工具包,支持通过Maven和Gradle轻松安装。用户可根据需求选择核心词典、词性标注、命名实体识别、拼音切分等模型资源,mylnp-all依赖包涵盖大部分常用资源。该项目参考了多个优秀开源项目并结合多种算法,适用于广泛的应用场景。详情请访问mynlp在线文档。
CodeLlama-13b-hf - Meta开发的13B参数通用代码生成和理解模型
Code LlamaGithubHuggingface人工智能模型代码生成开源项目机器学习模型自然语言处理
CodeLlama-13b-hf是Meta开发的13B参数大型语言模型,专注于代码生成和理解。作为Code Llama系列的基础版本之一,该模型支持代码补全和填充功能。它采用优化的transformer架构,于2023年上半年训练完成,适用于商业和研究用途。这一通用代码合成工具能有效处理多种编程任务,为开发者提供代码辅助功能。
CodeGeeX4 - 开源多语言代码生成模型的新突破
AI编程CodeGeeX4Github代码生成多语言模型开源开源项目
CodeGeeX4-ALL-9B是一个基于GLM-4-9B训练的多语言代码生成模型。它提供代码补全、生成、解释等多项功能,并支持网络搜索、函数调用和仓库级代码问答。作为参数量低于10B的代码生成模型中性能最佳的一款,CodeGeeX4-ALL-9B在多个公开基准测试中表现优异,在某些方面甚至超越了参数量更大的通用模型,体现了其在推理速度和模型性能之间的出色平衡。
ml4code.github.io - 机器学习在大规模代码和自然语言处理中的应用综述
Github大代码开源项目文献综述机器学习自然性
ml4code.github.io 是一个关于机器学习在大规模代码和自然语言处理研究领域的综合性资源网站。该项目提供最新研究综述,涵盖领域前沿发展。作为一个动态更新平台,它不仅提供静态研究回顾,还鼓励研究者通过创建 Markdown 文件贡献工作和分类法。这种开放协作模式使其成为该领域最新进展的实时反映。这个开源项目托管在GitHub上,旨在成为机器学习应用于代码分析和自然语言处理的权威参考资源。
codegen-2B-multi - 提供多语言程序合成的自回归语言模型
CodeGenGithubHuggingface多编程语言开源项目机器学习模型模型程序合成自动生成代码
CodeGen-Multi 2B模型是一种自回归语言模型,经过多个编程语言的大规模数据集预训练,能够合成可执行代码。模型以CodeGen-NL 2B为基础,并在多语言数据上进一步训练,能够从自然语言和编程语言中提取特征。模型在主要代码生成基准上经过评估,可用于从注释生成代码或完成部分代码。用户可借助AutoModelForCausalLM功能加载模型,适用于多种编程语言。
deepseek-coder-6.7b-instruct - 多语言代码生成与补全的开源AI模型
DeepSeek CoderGithubHuggingface人工智能代码模型开源项目机器学习模型自然语言处理
deepseek-coder-6.7b-instruct是一个基于2T代码和自然语言数据训练的开源AI代码模型。该模型支持多种编程语言,提供1.3B至33B不同规模版本,在HumanEval等多个基准测试中表现优异。它具有16K窗口大小和填空任务能力,支持项目级代码补全和插入。这个模型适用于各种代码生成和补全任务,为开发者提供了强大的编程辅助工具。
EasyContext - 优化语言模型上下文长度至百万级的开源项目
EasyContextGithub开源项目注意力机制训练技巧语言模型长上下文模型
EasyContext 是一个开源项目,致力于优化语言模型的上下文长度至 100 万个标记。项目结合序列并行、Deepspeed zero3 卸载和 Flash attention 等技术,实现了对 Llama2-7B 和 Llama2-13B 模型的全参数微调。通过最小化硬件需求,EasyContext 展示了长上下文扩展的可行性,并提供简洁的实现代码和评估结果,为自然语言处理研究和开发提供了有价值的资源。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号