Project Icon

japanese-gpt-neox-small

日本GPT-NeoX小型模型,兼容Huggingface加载

本项目提供了一个小型的日本GPT-NeoX模型,基于EleutherAI/gpt-neox代码进行训练。该模型使用Japanese CC-100、Japanese C4和Japanese Wikipedia数据集进行训练,优化语言模型目标。可通过Huggingface的GPT-NeoX无缝加载,模型结构包括12层、768隐藏单元,支持基于sentencepiece的分词。此外,还提供前缀调优权重文件,可以用于后接表情符号的句子生成。经过验证,该模型兼容NVIDIA FasterTransformer 5.1进行推理。

japanese-gpt-neox-3.6b - 基于GPT-NeoX架构的36亿参数日语大语言模型
GPT-NeoXGithubHuggingface开源项目日语预训练模型深度学习自然语言处理语言模型
japanese-gpt-neox-3.6b是一个基于GPT-NeoX架构的日语大语言模型,拥有36亿参数。该模型在超过3125亿个日语语料库tokens上训练,包括CC-100、C4和维基百科数据。模型采用36层、2816隐藏层的transformer架构,验证困惑度为8.68。使用sentencepiece分词器,词表大小32,000,支持UTF-8字节分解。模型已开源并提供训练数据和使用文档。
japanese-gpt2-small - rinna开发的轻量级日语自然语言处理模型
GPT-2GithubHuggingface开源项目文本生成日语模型机器学习模型自然语言处理
japanese-gpt2-small是rinna公司开发的轻量级日语GPT-2模型。该模型基于CC-100和日语维基百科数据集训练,采用12层768隐藏单元的Transformer架构。它使用SentencePiece分词器,适用于文本生成等多种自然语言处理任务。模型在V100 GPU上训练约15天,验证集困惑度达到21左右。作为日语NLP的预训练基础模型,japanese-gpt2-small为相关研究和应用提供了有力支持。
japanese-gpt2-medium - 中型日语GPT-2模型为自然语言处理提供强大支持
GPT-2GithubHuggingfacetransformer开源项目文本生成日语模型模型自然语言处理
rinna公司开发的中型日语GPT-2模型基于CC-100和维基百科数据集训练。该模型采用24层1024隐藏单元的Transformer架构,使用sentencepiece分词器。通过Hugging Face可轻松调用,适用于多种日语自然语言处理任务。这个开源项目遵循MIT许可证,为日语NLP研究和应用奠定了坚实基础。
open-calm-small - 高效日语Transformer模型,探索OpenCALM-Small的关键特性
CyberAgentGPT-NeoXGithubHuggingfaceOpenCALM开源项目日本语模型语言模型
OpenCALM-Small是由CyberAgent, Inc.开发的小型日语语言模型,以160M参数提供高效的语言生成。基于Transformer架构,它在开源库GPT-NeoX上运行,并支持多样化的生成配置。该模型使用来自日本维基百科和常见抓取数据的精选训练数据集,为高质量日语内容生成奠定基础,是开发者处理日语自然语言任务的理想选择之一。
t5-large-medium - 基于Transformer的日文预训练模型,提高NLP任务性能
GithubHuggingfaceRetrievaT5 v1.1Transformer开源项目日语模型预训练
该T5 v1.1模型基于Transformer架构,专为日文语料进行预训练。通过使用GEGLU激活函数代替ReLU,提升了文本生成质量。模型在预训练时关闭Dropout以提升泛化能力,微调时可重启。训练数据包括mC4/ja和日本Wikipedia,确保日文内容的纯净性。此大型模型拥有约7.7亿参数,适用于广泛的日文自然语言处理任务,表现出优异的性能与适应性。
t5-base-japanese - 高效的日语文本转换T5预训练模型
GithubHuggingfaceT5准确率开源项目日本语料库模型语言模型迁移学习
本项目针对日语文本处理,提供了一款预训练的T5模型,该模型利用Wikipedia、OSCAR和CC-100等约100GB的数据进行训练。相比Google多语言T5模型,虽尺寸小25%,但在精度上有所提升,尤其是在livedoor新闻分类任务中表现突出。适用于日语文本高效处理,需关注潜在的偏见和伦理输出问题。
llm-jp-13b-v2.0 - 改进日本大型语言模型的开发与应用
GithubHuggingfacellm-jp大语言模型开源项目指令微调模型自然语言处理预训练
由日本团队发起,项目提供基于Transformer架构的大型语言模型,支持多种编程语言和文本生成,专注于自然语言处理。模型经过大规模数据集的预训练和细化调试,展现出卓越的文本生成能力。
gpt-neo-125m - 轻量级自然语言生成模型
EleutherAIGPT-NeoGithubHuggingface开源项目文本生成模型深度学习自然语言处理
GPT-Neo 125M是EleutherAI团队基于GPT-3架构开发的轻量级自然语言处理模型,拥有1.25亿参数。该模型在Pile数据集上经过3000亿token的训练,能够生成连贯文本,适用于多种NLP任务。尽管规模较小,但性能优异。值得注意的是,由于训练数据的多样性,使用时需谨慎筛选输出内容,以避免潜在的偏见或不当表述。
japanese-reranker-cross-encoder-xsmall-v1 - 小型高效的日语Reranker模型,通过CrossEncoder技术实现精确排序
CrossEncoderGithubHuggingfaceRerankerSentenceTransformers开源项目日本語模型
这个开源项目提供了一款专为日语环境设计的小型Reranker模型,采用CrossEncoder技术实现精确排序。模型具备6层架构和384隐藏单元,支持GPU加速,可在多种应用场景中表现优秀。通过SentenceTransformers和HuggingFace库,模型支持在JQaRA和JGLUE等多个数据集上的应用,以实现广泛的适用性和性能提升。
line-distilbert-base-japanese - LINE DistilBERT模型推动日语文本智能处理
Apache License 2.0GithubHuggingfaceLINE DistilBERT开源项目日本语模型模型架构预训练模型
LINE Corporation推出的DistilBERT模型专为日语文本处理而设计,基于BERT-base教师模型,在131 GB日语网络文本上完成了预训练。模型采用DistilBERT架构,有6层、768隐层、12个注意力头和66M参数。评估结果优秀,JGLUE评测中表现出色。其使用MeCab和SentencePiece进行分词和子词处理,词汇量为32768。适用于多种日语NLP任务,遵循Apache 2.0许可证。在GitHub上提供更多信息。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

稿定AI

稿定设计 是一个多功能的在线设计和创意平台,提供广泛的设计工具和资源,以满足不同用户的需求。从专业的图形设计师到普通用户,无论是进行图片处理、智能抠图、H5页面制作还是视频剪辑,稿定设计都能提供简单、高效的解决方案。该平台以其用户友好的界面和强大的功能集合,帮助用户轻松实现创意设计。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号