项目介绍
Malaya 是一款专为马来语研发的自然语言处理工具包,基于 PyTorch 实现。这个项目致力于为马来语提供高效且易于使用的自然语言处理解决方案。
安装指南
用户可以通过 PyPI 进行简单的安装,只需要在命令行中输入以下指令即可:
$ pip install malaya
请注意,该安装将自动配置好所有依赖项,除了 PyTorch 之外。因此,用户可以根据自己的需求选择安装适用于 CPU 或 GPU 的 PyTorch 版本。Malaya 支持的 Python 版本为 3.6.0及以上,支持的 PyTorch 版本为 1.10及以上。
如果您是 Windows 用户,安装前建议阅读专门的文档以获取 Windows 系统上的运行指导。
开发版本
对于希望了解 Malaya 最新功能的开发者,您可以通过以下命令从项目的主分支中直接安装:
$ pip install git+https://github.com/huseinzol05/malaya.git
在开发环境中,推荐使用 virtualenv
来管理和隔离开发环境。
预训练模型
Malaya 提供了预训练的马来西亚语模型,用户可以在 Hugging Face 仓库上查看这些模型。用户可以利用这些预训练模型来提升自然语言处理任务的效率和准确性。
参考文献
如果您在研究中使用 Malaya 软件,欢迎引用该软件:
@misc{Malaya, Natural-Language-Toolkit library for bahasa Malaysia, powered by PyTorch,
author = {Husein, Zolkepli},
title = {Malaya},
year = {2018},
publisher = {GitHub},
journal = {GitHub repository},
howpublished = {https://github.com/mesolitica/malaya}
}
致谢
项目的成功离不开许多支持者的贡献:
- KeyReply 提供了专用的 V100 云资源。
- Nvidia 提供了 Azure 的信用。
- Tensorflow Research Cloud 提供了免费的 TPU 访问权限。
感谢这些公司的支持,助力 Malaya 项目的推进。
欢迎贡献
Malaya 项目非常感谢各种形式的贡献,不局限于代码。若您有任何建议或希望提供帮助,欢迎随时与我们联系。您的贡献是推动该项目持续发展的动力。