#GPT-J
rome - 自动回归变换器上的高级模型编辑技术
Rank-One Model EditingROMEGPT-2 XLGPT-J自动回归变换器Github开源项目
ROME项目提供了自动回归变换器的模型编辑技术,支持OpenAI的GPT-2 XL与EleutherAI的GPT-J。项目包括安装指南、应用示例(如模型重写)及评估工具,帮助开发者理解和应用模型修改。
LlamaGPTJ-chat - 简单C++命令行聊天程序,兼容GPT-J、LLaMA及MPT模型
LlamaGPTJ-chatGPT-JLLaMAMPTC++Github开源项目
一个使用C++编写的命令行聊天程序,支持GPT-J、LLaMA、MPT等语言模型。适用于Linux、MacOS和Windows系统,有详尽的安装和使用指南,并支持多线程、保存/加载聊天日志、设置AI角色等多种功能。
gpt-j-api - 与GPT-J语言模型互动的文本生成和多语言分类API
gpt-j-apiAPI端点GPT-J文本生成零样本分类Github开源项目
介绍了通过API与GPT-J语言模型进行互动,支持文本生成和多语言文本分类,包括Python和Bash示例、公开API接口、Streamlit应用和独立API文档。提供了在TPU VM上设置服务器和部署Streamlit仪表板的详细指南。
EasyLM - 简化的大规模语言模型训练与部署
EasyLMJAXLLaMATPUGPT-JGithub开源项目
EasyLM提供了一站式解决方案,用于在JAX/Flax中预训练、微调、评估和部署大规模语言模型。通过JAX的pjit功能,可以扩展到数百个TPU/GPU加速器。基于Hugginface的transformers和datasets,EasyLM代码库易于使用和定制。支持Google Cloud TPU Pods上的多TPU/GPU和多主机训练,兼容LLaMA系列模型。推荐加入非官方的Discord社区,了解更多关于Koala聊天机器人和OpenLLaMA的详细信息及安装指南。
LLM-Adapters - LLM模型参数微调适配器集成框架
LLM-AdaptersHuggingFaceLoRAGPT-JPEFTGithub开源项目
LLM-Adapters 是一个集成了多种适配器的框架,用于实现大语言模型的参数高效微调。支持 LLaMa、OPT、BLOOM 和 GPT-J 等开源大语言模型,以及 Bottleneck、Parallel 和 LoRA 等适配器。这个框架为研究人员和开发者提供了强大的工具,可应用于各种任务的适配器方法。最新更新包括 commonsense170k 数据集,LLaMA-13B-Parallel 模型在多个常识基准测试中表现优异,超越了 ChatGPT。
相关文章