japanese-gpt-neox-small

日本GPT-NeoX小型模型，兼容Huggingface加载

前缀微调 NVIDIA 日语 Huggingface Github 开源项目模型 GPT-NeoX 文本生成

本项目提供了一个小型的日本GPT-NeoX模型，基于EleutherAI/gpt-neox代码进行训练。该模型使用Japanese CC-100、Japanese C4和Japanese Wikipedia数据集进行训练，优化语言模型目标。可通过Huggingface的GPT-NeoX无缝加载，模型结构包括12层、768隐藏单元，支持基于sentencepiece的分词。此外，还提供前缀调优权重文件，可以用于后接表情符号的句子生成。经过验证，该模型兼容NVIDIA FasterTransformer 5.1进行推理。

访问官网

Github

Huggingface

介绍相关项目

japanese-hubert-base - 日语HuBERT Base自监督语音学习模型

GithubHuBERTHuggingfaceReazonSpeechrinna/japanese-hubert-base开源项目日语语音模型模型自我监督学习

rinna Co., Ltd.发布的日语HuBERT Base模型，采用与原始HuBERT相同的12层变换器结构，通过ReazonSpeech语料库的19000小时语音数据进行训练，支持自监督语音表示学习。模型提供详尽的训练配置和论文参考，便于研究和应用。使用Transformers库可方便地实现日语语音处理。

deberta-v2-base-japanese-char-wwm - 日语DeBERTa V2模型实现字符级遮蔽与预训练

DeBERTa V2GithubHuggingfacetransformers字符级别开源项目日本語模型自然语言处理

该项目介绍了日语DeBERTa V2 base模型，该模型在日语Wikipedia、CC-100和OSCAR数据集上进行字符级分词和整体词遮蔽的预训练，可用于掩码语言建模及下游任务微调，采用了22,012个字符级子词的sentencepiece分词模型，通过transformers库进行训练。

kotoba-whisper-v2.1 - 日语语音识别模型优化版：提升精度和功能

GithubHugging FaceHuggingfaceKotoba-Whisper开源项目日语模型自然语言处理语音识别

Kotoba-Whisper-v2.1是一款基于Whisper的日语语音识别模型。该模型通过集成额外的后处理功能，如添加标点符号，提高了识别准确度。在多个日语语音数据集上，其表现超越了原版Whisper模型。模型支持使用Transformers库进行推理，并可选用Flash Attention 2等技术优化性能。

ELYZA-japanese-Llama-2-7b-instruct - Llama-2架构的日语大语言模型支持双语对话和指令微调

ELYZAGithubHuggingfaceLlama2人工智能开源项目日本语模型模型自然语言处理

ELYZA-japanese-Llama-2-7b是基于Llama-2架构开发的日语大语言模型。通过额外预训练，该模型显著提升了日语处理能力。项目提供多个版本，包括基础模型和指令微调版本，参数规模在6.27B至6.37B之间。模型支持日英双语对话，适用于文本生成和对话等任务。项目还提供了基于Hugging Face Transformers框架的使用示例代码，方便开发者集成和部署。

bert-base-japanese-whole-word-masking - 基于日语维基百科的BERT预训练模型采用全词掩码技术

BERTGithubHuggingface全词掩码开源项目日语预训练模型模型维基百科语料自然语言处理

该BERT模型基于日语维基百科数据预训练，采用IPA词典和MeCab进行分词，并引入全词掩码技术。模型架构与BERT base一致，包含12层结构、768维隐藏状态和12个注意力头。训练语料来自2019年9月的日语维基百科，词表规模为32000。模型在Cloud TPUs上训练完成，遵循原始BERT的训练配置，并以CC BY-SA 3.0许可证发布。

optimized-gpt2-1b - GPT-2架构优化模型提供高效可扩展的自然语言处理功能

GithubHuggingfacetransformers人工智能开源项目机器学习模型模型卡自然语言处理

optimized-gpt2-1b是一个基于GPT-2架构优化的大规模语言模型。该模型在保持GPT-2性能的基础上，通过架构和训练方法的优化提高了效率和可扩展性。它可应用于文本生成、摘要和问答等多种自然语言处理任务。模型支持直接使用或针对特定需求进行微调。项目提供了使用说明和评估结果，有助于研究人员和开发者更好地理解和应用这一语言模型。

bert-base-japanese-v3-ner-wikipedia-dataset - 基于维基百科数据集的日语命名实体识别BERT模型

BERTGithubHuggingfaceWikipedia数据集固有表現認識大规模语言模型开源项目模型自然语言处理

本项目提供了一个基于BERT的日语命名实体识别模型，该模型使用维基百科数据集进行训练。模型能够识别日语文本中的人名、地名等实体，可通过Transformers库轻松调用。项目源自《大规模语言模型入门》一书，提供了使用示例和相关资源链接，采用Apache 2.0许可证。

mt0-small - 支持百种语言的神经网络文本生成器

GithubHuggingfacemt0-small多语言模型开源项目机器翻译模型自然语言处理语言推理

mt0-small是一个支持百种语言的文本生成模型，主要应用于自然语言推理、指代消解和句子补全等任务。模型可实现跨语言情感分析、问答系统和故事生成等功能，适用于自然语言处理研究与开发。

ELYZA-japanese-Llama-2-7b-fast-instruct - 提升日本语言处理与指令执行的创新模型

ELYZA-japanese-Llama-2-7bGithubHuggingfaceLlama2人工智能开源项目日语能力模型追加事前学习

ELYZA-japanese-Llama-2-7b-fast-instruct基于Llama2，专注于提升日语处理能力，提供流畅的语言体验。通过针对日语的扩展训练，该模型在理解和生成日语方面表现优异，并支持GPU加速，以优化计算性能，适用于多种应用场景。欲了解更多使用案例和详细信息，请访问官方页面。

picoGPT - 极简风格的GPT-2实现版本

GPT-2GithubNumPypicoGPT代码实现开源项目模型生成

picoGPT是一个极简风格的GPT-2实现版本，采用NumPy全面编写，前向传播过程在短短40行代码中展开。它虽然运行缓慢，不支持多重训练或高级的采样方法，但其独特的简化设计提供了一种有趣的学习与试验环境，极适合AI和机器学习领域的爱好者及开发者。

项目侧边栏1

项目侧边栏2

推荐项目

Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手，通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能，支持100+编程语言，与主流编辑器无缝集成，显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台，能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐，Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案，通过智能技术简化视频制作流程。无论是企业宣传还是个人分享，有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持，能够阅读和理解用户上传的文件内容，解析网页信息，并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题，Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术，为商家提供一键生成商品图和营销文案的服务，显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台，让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型，免费访问各种图像生成与AI训练工具，从Stable Diffusion等基础模型开始，轻松实现创新图像生成。体验前沿的AI技术，推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器，它将改变您观看视频的方式！SubCat结合了先进的人工智能技术，为您提供即时视频字幕翻译，无论是本地视频还是网络流媒体，让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台，利用前沿AI技术，为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图，再到文案生成，美间让创意设计更简单、更高效。

Project Cover

稿定AI

稿定设计是一个多功能的在线设计和创意平台，提供广泛的设计工具和资源，以满足不同用户的需求。从专业的图形设计师到普通用户，无论是进行图片处理、智能抠图、H5页面制作还是视频剪辑，稿定设计都能提供简单、高效的解决方案。该平台以其用户友好的界面和强大的功能集合，帮助用户轻松实现创意设计。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号