项目简介:Hugging Face 课程
Hugging Face 课程是一个旨在教授如何将Transformer技术应用于自然语言处理及其相关领域的免费课程。在学习过程中,课程还将引导学习者如何使用Hugging Face生态系统,包括🤗 Transformers、🤗 Datasets、🤗 Tokenizers和🤗 Accelerate等工具,以及Hugging Face Hub。该课程的所有内容都是开源的,学习者可以自由访问和使用。
语言及翻译
为实现机器学习民主化的愿景,该课程面向多种语言进行翻译。目前,课程已经支持英语、西班牙语、德语、法语、葡萄牙语、意大利语、中文(简体和繁体)、日语、韩语、俄语、泰语、土耳其语、越南语等多种语言。部分语言仍在持续翻译中。
如何参与翻译
-
提交问题:访问该项目的GitHub问题页面,查看是否已有他人提交了对应语言的翻译任务。如果没有,可以通过“新建问题”按钮使用翻译模板来提交新任务。
-
加入Discord频道:为了使翻译任务的讨论更加顺利,我们在Discord上为每种语言创建了专属频道。
-
分叉仓库:可以通过在仓库页面点击“Fork”按钮来分叉该项目。接着,通过Git将项目克隆到本地进行编辑。
-
复制英语文件:将英语文件复制到新建的语言目录中,开始翻译。
-
进行翻译:从
_toctree.yml
文件开始翻译,这个文件用于网站内容目录的生成。 -
本地构建课程:翻译完成后,可以使用
doc-builder
工具来预览翻译效果。 -
提交拉取请求:检查翻译文件格式并提交拉取请求,邀请项目负责人进行审核。
Jupyter 笔记本
课程中所有代码都保存在 huggingface/notebooks
仓库中。如果需要本地生成,可以安装所需依赖并运行脚本,该脚本会将代码段提取为Jupyter笔记本。
贡献新章节
目前不接受社区贡献的新章节。添加新章节的流程包括创建新目录、添加章节文档、更新_toctree.yml
文件,并提交拉取请求与项目负责人协作。
致谢
该项目的结构和README受到Advanced NLP with spaCy
课程的启发。Hugging Face 团队对所有参与和支持课程开发与翻译的人员表示感谢。