Project Icon

Bespoke-MiniCheck-7B

文档核实模型的优化技术与高质量数据策展效果

由Bespoke Labs开发的Llama-3.1-Bespoke-MiniCheck-7B模型,应用高质量数据策展技术,提升了长文本事实核查的精准度。该模型从internlm2_5-7b-chat微调,集成了35K个数据点,包括ANLI示例与合成生成数据,以增强泛化能力。尽管体积小,该模型在LLM-AggreFact基准测试中表现卓越,自动前缀缓存功能提升了推理速度,在高负载下保持出色的文档处理能力。

TinyLlama - 3万亿token训练的小型1.1B参数语言模型
AI预训练GithubTinyLlama开源项目模型评估语言模型
TinyLlama是一个使用3万亿token预训练的1.1B参数语言模型。它与Llama 2架构兼容,可集成到现有Llama项目中。TinyLlama体积小巧,适用于计算和内存受限的场景。该项目开源了预训练和微调代码,具有高效的训练和推理性能。TinyLlama可应用于推测解码、边缘计算和实时对话等领域。
llama3-chinese - 基于Meta-Llama-3-8B的中英双语大语言模型
GithubLlama3-Chinese人工智能大语言模型开源项目自然语言处理
Llama3-Chinese是基于Meta-Llama-3-8B训练的中英双语大语言模型。该项目使用高质量多语言数据和先进训练方法,提升了模型的对话能力。项目提供完整的模型使用指南,包括下载、合并、推理和部署,并配有Web和CLI演示,方便研究者和开发者使用。
Chinese-LLaMA-Alpaca-3 - 中文Llama-3大模型及其精调版本的特性
GithubLlama-3-Chinese中文大模型开源开源项目性能提升指令精调
Chinese-LLaMA-Alpaca-3项目推出了基于Meta新一代Llama-3技术的中文模型版本,涵盖原始及指令精调版本。这些模型利用海量中文数据增强了语义理解与指令执行性能,可广泛适用于多种中文文本处理任务。
Llama3-Chinese-Chat - 基于Llama 3的中英双语优化大语言模型
ChineseGithubLlama3人工智能开源项目自然语言处理语言模型
Llama3-Chinese-Chat项目基于Meta-Llama-3-8B-Instruct模型开发,采用ORPO方法优化训练,大幅提升中英双语交互能力。该模型具备角色扮演、工具使用等功能,提供多种版本选择。最新v2.1版本在数学、角色扮演和函数调用方面性能显著提升,训练数据集扩充至10万对。项目同时提供Ollama模型和量化版本,便于快速部署使用。
llama3 - Llama 3开源大语言模型 推动AI创新与责任发展
GithubLlama 3Meta人工智能大语言模型开源开源项目
Meta推出Llama 3系列大语言模型,参数规模从8B到70B不等,包含预训练和指令微调版本。该系列面向广泛用户群体开放,旨在推动负责任的AI创新。Llama 3具备8192个token的序列处理能力,并提供便捷的加载和推理代码。模型权重和分词器可通过官方网站或Hugging Face平台获取。
llama - 开源大语言模型推动自然语言处理发展
GithubLlamaMeta人工智能大语言模型开源开源项目
Llama 2是Meta公司开发的开源大语言模型系列,提供7B至70B参数的预训练和微调模型。该项目为研究和商业用途提供模型权重和代码,支持多样化的自然语言处理应用。Llama 2注重负责任的AI发展,实施严格的使用政策。项目包含多个仓库,构建了从基础模型到端到端系统的完整技术栈,为AI领域的创新和应用提供了重要支持。
LLaMA-Cult-and-More - 最新大模型参数、微调数据和硬件需求解析
AnthropicEfficient训练GithubMetaOpenAI多模态LLM开源项目
LLaMA-Cult-and-More项目详细介绍了最新大模型的参数数量、微调数据集与技术,并提供LLM对齐后训练的实用指南,包括数据集、基准数据集和高效训练库。从预训练模型到后训练模型,项目涵盖了许多有趣的内容,帮助您了解关键功能和最新进展。
Taiwan-LLM - 专为繁体中文与英语环境设计的高性能语言模型,具有70亿参数规模
GithubLlama-3-Taiwan-70BNLP基准NVIDIA传统中文开源项目聊天机器人
Llama-3-Taiwan-70B是专为繁体中文与英语环境设计的高性能语言模型,具有70亿参数规模,涵盖多个行业领域。该模型透过NVIDIA NeMo技术优化,已完成在台北一号的NVIDIA DGX H100系统上的训练,获多个企业支持。
ChatLM-mini-Chinese - 小参数中文对话模型,支持低显存预训练,优化SFT和DPO性能
ChatLM-Chinese-0.2BGithubHuggingfaceRLHF优化SFT微调开源项目预训练
ChatLM-mini-Chinese是一个小参数中文生成式语言模型项目。模型参数为0.2B,最低4GB显存即可实现预训练,512MB显存可进行推理。项目公开预训练和优化数据集,包括SFT微调和DPO偏好优化,支持多种下游任务。基于Huggingface NLP框架,自实现trainer,支持单机单卡及多卡训练,并可断点续训。此项目优化了内存和显存的使用,为硬件资源不足的用户提供了一种高效的中文对话解决方案。
LLM-Zoo - 最新自然语言处理模型信息汇总,开源与闭源模型实时更新
ChatGPTGithubLLM开源开源项目模型自然语言处理
展示多种开源与闭源LLM模型的详细信息,包括发布时间、模型大小、支持语言、适用领域及训练数据。提供GitHub、HuggingFace、演示及研究论文链接,信息定期更新以反映最新进展。欢迎贡献者参与添加新模型或更新现有模型信息。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

稿定AI

稿定设计 是一个多功能的在线设计和创意平台,提供广泛的设计工具和资源,以满足不同用户的需求。从专业的图形设计师到普通用户,无论是进行图片处理、智能抠图、H5页面制作还是视频剪辑,稿定设计都能提供简单、高效的解决方案。该平台以其用户友好的界面和强大的功能集合,帮助用户轻松实现创意设计。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号