Project Icon

open-calm-3b

基于日语数据集的解码器语言模型

OpenCALM是由CyberAgent开发的语言模型,利用日语数据集进行训练,支持文本生成和自然语言处理。该模型使用GPT-NeoX库编写,提供多种规模的架构选择,如small、medium和large。open-calm-3b版本拥有2.7B参数,采用Transformer架构,提升了语言生成质量,适用于大规模日语语料库处理。

openchat-3.6-8b-20240522 - 基于Llama 3架构的混合数据训练语言模型
GithubHuggingfaceOpenChat 3.6人工智能开源技术开源项目机器学习模型语言模型
OpenChat-3.6-8b-20240522是基于Llama 3架构开发的8B参数规模语言模型。模型采用混合质量数据训练方法,支持8192个上下文长度,可通过OpenChat包或OpenAI兼容API部署。适用场景包括代码开发、对话交互等通用任务,在基准测试中显示出相对同规模模型的性能优势。模型在复杂推理、数学运算等方面存在一定局限,且可能出现信息幻觉现象。
COKAL-DPO_test-v2-13b - 采用LLaMA2架构的13B规模自动回归语言模型
COKAL-DPO_test-v2GithubHuggingfacetransformers开源项目模型模型开发训练数据集语言模型
模型由韩国公司Media Group Saramwa Soop与Marker合作开发,基于LLaMA2变压器架构,具备文本生成能力。基础模型为COKAL_pre_DPO_Test_v1-13b,采用DPO及SFT私有数据集训练,适用于多种文本生成任务。该研究项目由韩国科学技术信息通信部和光州广域市资助,旨在推动人工智能产业集群发展。
calme-2.2-llama3-70b - 采用DPO精调提升文本生成基于Meta-Llama-3-70B-Instruct的高效量化模型
GithubHuggingfaceMeta-Llama-3-70B-Instruct开源项目文本生成机器学习模型模型微调自然语言处理
模型通过DPO精调优化文本生成,基于Meta-Llama-3-70B-Instruct开发,性能在多个基准测试中表现杰出,如IFEval 82.08、HellaSwag 86.22及GSM8k 88.25分。其量化特性提升效能,适宜多种应用场景。
open_llama_3b - 开源复现LLaMA架构的大型语言模型
GithubHuggingfaceOpenLLaMA人工智能大语言模型开源开源项目模型自然语言处理
OpenLLaMA是一个开源项目,旨在复现LLaMA大型语言模型。它基于Apache 2.0许可,提供了7B和3B模型(1万亿标记训练)以及13B模型预览版(6000亿标记训练)。项目发布了PyTorch和JAX格式的预训练权重,并与原始LLaMA进行了性能对比。OpenLLaMA使用RedPajama数据集训练,整体性能与LLaMA和GPT-J相当,部分任务表现更佳。
Llama-3-Open-Ko-8B - 高性能开源韩语大型语言模型
GithubHuggingfaceLlama-3开源AI开源项目模型自然语言处理语言模型韩语预训练
Llama-3-Open-Ko-8B是一个基于Llama-3-8B进行持续预训练的开源韩语语言模型。该模型使用60GB以上的去重文本训练,包含超过17.7B个token,采用优化的Transformer架构,支持8k上下文长度。它适用于商业和研究目的,可用于助手式聊天等多种自然语言生成任务。开发者使用时需遵循相关许可和负责任的AI开发原则。
MiniCPM3-4B - 轻量高效的开源模型支持长文本处理和函数调用
GithubHuggingfaceMiniCPM3人工智能大语言模型开源模型开源项目机器学习模型
MiniCPM3-4B是一款开源语言模型,仅用4B参数就达到了接近GPT-3.5-Turbo的性能。它具备32k上下文窗口、函数调用和代码解释器等功能,在中英双语、数学和编程等多个基准测试中表现出色。通过创新的训练策略,MiniCPM3-4B实现了与7B-9B模型相当的能力,为资源受限的AI应用场景提供了高效选择。
gpt-neo-1.3B - EleutherAI开发的13亿参数语言模型GPT-Neo 1.3B
GPT-NeoGithubHuggingface开源项目文本生成机器学习模型神经网络自然语言处理
GPT-Neo 1.3B是EleutherAI团队开发的大规模语言模型,基于GPT-3架构,拥有13亿参数。该模型在The Pile数据集上训练,适用于文本生成、问答等自然语言处理任务,并在多项基准测试中表现出色。模型采用MIT开源许可证,但使用时需注意可能存在的偏见和不当内容。
Llama-3-ELYZA-JP-8B - ELYZA开发的日英双语自然语言处理模型
GithubHuggingfaceLlama-3-ELYZA-JP-8BMeta Llama3大语言模型开源项目日语优化模型自然语言处理
Llama-3-ELYZA-JP-8B是ELYZA公司基于Meta Llama 3开发的语言模型。通过额外预训练和指令调优,该模型增强了日语处理能力,同时支持英语。它适用于多种自然语言处理任务,提供简便的使用方法,便于开发者集成。该模型采用Meta Llama 3社区许可证,为自然语言处理研究和应用提供了有力支持。
ELYZA-japanese-CodeLlama-7b - 日本语代码模型的新前沿,改进生成与理解
ELYZA-japanese-CodeLlama-7bGithubHuggingface代码生成开源项目日本语模型模型算法素数筛选
该项目是在Code Llama基础上增加预训练以增强日语能力的模型。它为开发者在处理日语编程任务时提供了出色的代码生成与理解性能。该模型可用于Hugging Face平台,通过库如transformers和GPU加速实现高效运行,使其成为开发者满足各类编程与语言需求的重要工具。
h2o-danube3-500m-base - 500M参数的大规模语言模型,支持离线文本生成
GPTGithubH2O.aiHuggingface大语言模型开源项目模型模型架构转化器
由H2O.ai推出的h2o-danube3-500m模型,是一个大规模语言模型,采用Llama 2架构调整及500M参数设计。模型支持原生离线运行,尤其适用于手机设备,并集成Mistral分词器,拥有32,000词汇量及8,192长度的上下文生成能力。在支持transformers库的环境中,模型可在GPU设备上有效运行,并且支持量化和多GPU分片处理。重要提醒用户在使用模型生成的内容时保持审慎态度并自行承担责任。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

白日梦AI

白日梦AI提供专注于AI视频生成的多样化功能,包括文生视频、动态画面和形象生成等,帮助用户快速上手,创造专业级内容。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

讯飞绘镜

讯飞绘镜是一个支持从创意到完整视频创作的智能平台,用户可以快速生成视频素材并创作独特的音乐视频和故事。平台提供多样化的主题和精选作品,帮助用户探索创意灵感。

Project Cover

讯飞文书

讯飞文书依托讯飞星火大模型,为文书写作者提供从素材筹备到稿件撰写及审稿的全程支持。通过录音智记和以稿写稿等功能,满足事务性工作的高频需求,帮助撰稿人节省精力,提高效率,优化工作与生活。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号