#TinyStories
awesome-synthetic-datasets - 大语言模型合成数据集资源汇总
Github开源项目大语言模型合成数据集TinyStoriesSelf-InstructCosmopedia
该项目整理了大语言模型生成合成数据集的相关资源,包括教程、技术、数据集、工具和论文。涵盖TinyStories、Cosmopedia等数据集,以及Self-Instruct、AutoPrompt等技术,为AI研究和开发提供参考。
TinyStories-33M - 基于GPT-Neo架构的开源文本生成模型
Github开源项目文本生成模型训练模型数据集HuggingfaceGPT-NeoTinyStories
该模型以TinyStories数据集为基础,采用GPT-Neo架构进行训练,可通过API简便生成文本,广泛应用于自然语言处理任务。