#Japanese

awesome-japanese-nlp-resources - 日语NLP资源大全,包括Python库、工具、模型与数据集
awesome-japanese-nlp-resourcesPythonNLPHugging FaceJapaneseGithub开源项目
本项目提供全面的日语自然语言处理(NLP)资源,包括Python库、语言模型、词典和语料库等。收录了605个GitHub仓库和820个Hugging Face模型及数据集,并附带一个搜索工具方便查找更新信息。项目定期更新,最新包括Mozc UT地名词典和Kana-Kanji转换模块。资源涵盖形态分析、句法分析、情感分析及机器翻译等,是日语NLP研究和应用的重要参考。
vlog-translator - VLOG转录和日语翻译工具
vlogPythonNext.jsOpenAIJapaneseGithub开源项目
一个用于将VLOG视频转录并翻译成日语的开源工具,基于Python和Next.js构建。它整合了pysrt、yt-dlp和OpenAI等组件,实现高效的视频处理。获取OpenAI API密钥并设置环境变量即可轻松运行该工具。项目结构清晰,具有丰富的组件和模块支持,提供完整的转录和翻译功能。
Swallow-7b-instruct-hf - 日语与英语双支持的Swallow模型,带来高效文本推理
训练数据集GithubJapanese开源项目HuggingfaceLlama 2模型发布Swallow模型
Swallow模型加入日语数据进行持续预训练,支持日语和英语。项目推出不同版本的指令调优模型,如Swallow-7b-instruct-v0.1,以提升日语任务表现。通过广泛的词汇表和较少的tokens,模型在文本生成、机器翻译和阅读理解任务中表现优异,提供快速而精确的文本推理。