Project Icon

EEVE-Korean-Instruct-10.8B-v1.0

韩语大语言模型EEVE-Korean-Instruct-10.8B采用DPO技术优化指令理解

EEVE-Korean-Instruct-10.8B-v1.0是一个针对韩语优化的大语言模型。该模型基于SOLAR-10.7B扩展韩语词汇表,并使用DPO技术进行指令微调。在多项基准测试中,模型平均得分达66.48分。训练数据包括韩语翻译版的SlimOrca-Dedup和ultrafeedback数据集。项目提供了API使用说明和模型评估结果,适用于需要高性能韩语语言处理的应用场景。

EEVE-Korean-10.8B-v1.0 - 七阶段培训实现韩语大语言模型扩展的高效技术
EEVE-Korean-10.8B-v1.0GithubHuggingface大语言模型开源项目模型词汇扩展技术跨语言应用韩语词汇拓展
通过子词嵌入与参数冻结的七阶训练,从英语模型有效扩展至韩语。该项目未进行指令微调,但在韩语任务中表现优异,并通过详细词汇扩展过程提升跨语言应用潜力。深入的词频分析和标记器训练确保模型拥有丰富的韩语词汇。了解更多技术细节,请查阅技术报告。
KoE5 - 一种新颖的多语言模型,专注于增强韩文文本检索性能
GithubHuggingfaceKoE5KoreanSentenceTransformer多语言嵌入开源项目文本检索模型
KoE5是一个开源项目,旨在优化韩文文本检索,具有卓越的特征提取能力。模型在intfloat/multilingual-e5-large的基础上进行了微调,并利用ko-triplet-v1.0数据集进行优化,使其适合于复杂文本检索任务,例如信息检索和语义相似性分析。客观上,它在韩文查询处理方面表现出色,广泛应用于多语言嵌入模型的挑战中。
Llama-3-Open-Ko-8B-Instruct-preview - Llama-3基础上的韩语模型适用于对话和指导任务
GithubHuggingfaceLlama-3-Open-Ko-8B-Instruct-preview开源项目指令生成机器学习模型语言模型预训练
Llama-3-Open-Ko-8B-Instruct-preview利用公开资源预训练,处理17.7B+文本标记,为韩语对话和指导提供新起点。TPUv5e-256支持下的训练采用Chat Vector方法,增强自然语言生成。尽管尚未微调韩语指令,该模型已展示可靠性和高效性
EXAONE-3.0-7.8B-Instruct - 高性能双语指令微调大语言模型
EXAONE-3.0-7.8B-InstructGithubHuggingface开源许可开源项目性能评估指令微调模型语言模型
EXAONE-3.0-7.8B-Instruct是LG AI Research开发的英韩双语生成模型,拥有78亿参数。经过8万亿token的预训练和指令微调后,该模型在多项基准测试中表现出色,与同等规模的顶级开源模型相媲美。它不仅支持英语和韩语的对话生成,还可应用于广泛的自然语言处理任务,为推动人工智能研究生态系统的发展做出了贡献。
gemma-ko-7b-instruct-v0.62 - 简洁韩文文本生成模型,适用于多种自然语言处理任务
GemmaGithubHuggingface开源项目文本生成模型模型优化自然语言处理韩国语
Gemma Ko 7B Instruct v0.62 是一个专注于韩文文本生成的模型,能支持语言翻译、文本摘要、问答及对话生成等多种自然语言处理任务。该模型生成的文本高质量且具备上下文连贯性。由开发者 lemon-mint 基于 openchat 的模型进行微调。使用时请谨慎对待数据偏见及潜在错误信息。
Llama-3-Open-Ko-8B - 高性能开源韩语大型语言模型
GithubHuggingfaceLlama-3开源AI开源项目模型自然语言处理语言模型韩语预训练
Llama-3-Open-Ko-8B是一个基于Llama-3-8B进行持续预训练的开源韩语语言模型。该模型使用60GB以上的去重文本训练,包含超过17.7B个token,采用优化的Transformer架构,支持8k上下文长度。它适用于商业和研究目的,可用于助手式聊天等多种自然语言生成任务。开发者使用时需遵循相关许可和负责任的AI开发原则。
komt-mistral-7b-v1 - 韩语文本生成中的创新多任务指令调优模型
GithubHuggingfacekomet多任务指令大语言模型开源项目模型模型评估韩语性能
项目采用多任务指令调优方法,提升了韩语文本生成的准确性和有效性。通过监督数据集,生成适合大语言模型的训练数据并应用于komt-mistral-7b-v1,该模型是Mistral-7B-Instruct-v0.1的微调版本。评估结果显示,在韩语任务中的得分优于其他开源模型,尤其在文本生成和问答任务中表现出色,为韩语用户提供更智能的交互体验。
KR-ELECTRA-generator - 韩语预训练模型专注提升非正式文本处理能力
GithubHuggingfaceKR-ELECTRA开源项目机器学习模型深度学习自然语言处理韩语模型
KR-ELECTRA是首尔国立大学开发的韩语ELECTRA模型,专注提升非正式文本处理能力。该模型使用34GB平衡的书面和口语韩语数据预训练,采用30,000个基于形态素的词汇。KR-ELECTRA在多项韩语NLP任务中表现卓越,尤其在非正式文本相关任务上效果显著。模型支持TensorFlow和PyTorch框架,为韩语自然语言处理研究提供了有力工具。
polyglot-ko-3.8b - 韩国大规模自回归语言模型的技术突破
EleutherAIGithubHuggingfacePolyglot-KoRoPE位置编码开源项目模型自动回归模型韩国语言模型
Polyglot-Ko-3.8B是一个由EleutherAI开发的韩国大型自回归语言模型,具有3.8B参数和32个Transformer层,采用Rotary位置编码。模型在超过863GB的韩语数据集上训练,但不对公众开放,并在训练中屏蔽了个人信息,以防止生成个人识别数据。Polyglot-Ko-3.8B在COPA和HellaSwag任务中表现优异。此模型可在GPT-NeoX框架中使用,适合多种语言处理任务,但建议在使用时对潜在敏感内容进行人类审核。
polyglot-ko-12.8b-Inst - 此模型为韩语文本生成提供优化支持
GithubHuggingfaceKoQualitypolyglot-ko-12.8b多语言开源项目文本生成模型模型训练
模型通过使用10%指令数据集[Kullm, OIG, KoAlpaca]进行调优,融入了多GPU和CPU卸载技术,实现高效的分布式训练,致力于韩语文本生成应用。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号