Project Icon

UnslopNemo-12B-v2-GGUF

增强AI模型表达能力的实验探索

该项目通过减少RP数据集中的特点,以提高模型的表达力。适用于Mistral、ChatML以及文本补全任务。通过调整采样设置,用户有可能获得更优的结果。参与者被鼓励在讨论页面提供反馈,以帮助进一步改进性能。

NSFW_DPO_Noromaid-7b-Mistral-7B-Instruct-v0.1-GGUF - 结合多模型的量化文本生成引擎
GithubHuggingfaceNSFW_DPO_Noromaid-7b-Mistral-7B-Instruct-v0.1transformers开源项目文本生成模型模型合并量化
NSFW_DPO_Noromaid-7b-Mistral-7B-Instruct-v0.1-GGUF是利用llama.cpp开发的量化模型,整合了mistralai和athirdpath的两款7B模型。通过slerp合并法和bfloat16数据类型,该项目优化了文本生成任务的性能。用户可以通过Transformers和Accelerate库在Python中完成文本生成。该模型结合了多模型的优点,专为处理复杂文本生成任务而设计,提供了高效的运行性能。
Nous-Hermes-2-SOLAR-10.7B - 人工智能对话模型,以性能与数据协作为核心
GithubHuggingfaceNous Hermes 2人工智能基准测试开源项目模型模型微调聊天对话
Nous Hermes 2基于SOLAR 10.7B,是一款经过优化的对话AI模型,经过对大量GPT-4生成及其他优质数据的训练,表现优于SOLAR 10.7B基础模型,并接近Yi-34B。支持多种基准测试,包括GPT4All、AGIEval、BigBench和TruthfulQA。该模型支持ChatML聊天格式,适合复杂对话互动。即将推出的量化版本可通过LM Studio与模型进行ChatGPT风格的交互,支持ChatML。
codegemma-7b-it - 自然语言代码生成与对话专家
CodeGemmaGithubHuggingface代码完成代码生成对话生成开源项目模型评估方法
CodeGemma项目集合了7B和2B参数的开源代码模型,专注代码补全、生成及对话功能,尤其突出自然语言转代码的能力。codegemma-7b-it变体特别在指令生成方面展示了优异表现。借助FIM技术和依赖关系图打包技术,模型增强了与真实应用的契合度。此外,该项目注重伦理与安全,符合Google政策标准,适用于代码生成、学习和技术交流,兼容多种编程语言。
Nous-Hermes-Llama2-13b - 开源语言模型专注长回复与准确性
GithubHuggingfaceLlama-2人工智能开源项目机器学习模型自然语言处理语言模型
Nous-Hermes-Llama2-13b是基于Llama 2微调的开源语言模型,采用30万条指令进行训练。该模型以生成长篇回复和较低的幻觉率为特点,在AGI-Eval等多项基准测试中表现优异。它可用于创意写作、指令理解等多种语言任务,为开发者和研究人员提供了一个强大的开源语言工具。
ChatLM-mini-Chinese - 小参数中文对话模型,支持低显存预训练,优化SFT和DPO性能
ChatLM-Chinese-0.2BGithubHuggingfaceRLHF优化SFT微调开源项目预训练
ChatLM-mini-Chinese是一个小参数中文生成式语言模型项目。模型参数为0.2B,最低4GB显存即可实现预训练,512MB显存可进行推理。项目公开预训练和优化数据集,包括SFT微调和DPO偏好优化,支持多种下游任务。基于Huggingface NLP框架,自实现trainer,支持单机单卡及多卡训练,并可断点续训。此项目优化了内存和显存的使用,为硬件资源不足的用户提供了一种高效的中文对话解决方案。
datablations - 对在数据限制下扩展语言模型的方法的研究
C4Githublanguage models开源项目数据稀缺数据重复训练数据
本项目研究在数据受限情况下扩展语言模型的方法。通过对9000亿训练令牌和90亿参数模型进行实验,提出并验证了重复令牌和多余参数的计算优化法则。实验涵盖数据增强、困惑度过滤及去重处理。相关模型和数据集公开在仓库,有助于在资源有限情况下高效训练和优化语言模型。
NeumAI - 优化大规模检索增强生成的开发者数据平台
GithubNeum AIRAG向量数据库大语言模型开源项目数据平台
Neum AI是一个数据平台,帮助开发者利用检索增强生成(RAG)技术。它从现有数据源提取数据,生成向量嵌入,并导入向量数据库进行相似性搜索。平台具有高吞吐量分布式架构,处理数十亿数据点,内置数据连接器和实时同步功能,确保数据最新,并支持元数据混合检索,提供全面的RAG解决方案。
UltraChat - 大规模、多样化的多轮对话数据和模型
GithubUltraChatUltraFeedbackUltraLM开源项目数据集模型
UltraChat项目专注于构建开源、大规模、多轮对话数据,目标是打造具有广泛会话能力的强大语言模型。最新发布的模型和数据集包括UltraLM-13B-v2.0、UltraRM和UltraCM,在AlpacaEval基准测试上表现优异。UltraChat数据集分为三大部分:世界问题、写作与创作、现有材料辅助,对话涵盖了技术、艺术和创业等领域。项目数据仅供研究和教育用途,基于MIT许可证发布。
ChatGLM-Efficient-Tuning - 微调ChatGLM-6B模型,支持多种训练和量化方法
ChatGLMGithubRLHF开源项目数据集机器学习高效微调
ChatGLM-Efficient-Tuning项目提供高效微调ChatGLM-6B模型的工具和方法,支持LoRA、P-Tuning V2等多种微调方式,适用于单GPU和多GPU训练。项目还提供Web UI和CLI操作,支持4-bit和8-bit量化训练。通过丰富的数据集和功能,如强化学习和模型评估,满足不同场景的微调需求。详情请参见项目Wiki。
rulm - 俄语语言模型:的实现与性能对比
GPT Role-play RealmGithubRuTurboAlpacaRussianSuperGLUESaigarulm开源项目
此项目展示了俄语语言模型的实现与比较,涵盖DataFest的分享、主要演示和Fine-tuning Colab资源链接。同时介绍了基于ChatGPT生成数据的RuTurboAlpaca和Saiga两个主要数据集,以及相关模型及其训练配置的详细内容。提供了数据集生成脚本和提示。此外,还展示了GPT Role-play Realm的数据集和模型评估结果,包括与GPT4和gpt-3.5-turbo的对比分析。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

稿定AI

稿定设计 是一个多功能的在线设计和创意平台,提供广泛的设计工具和资源,以满足不同用户的需求。从专业的图形设计师到普通用户,无论是进行图片处理、智能抠图、H5页面制作还是视频剪辑,稿定设计都能提供简单、高效的解决方案。该平台以其用户友好的界面和强大的功能集合,帮助用户轻松实现创意设计。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号