#韩国语
KcELECTRA-base - 基于用户生成内容的韩语预训练模型KcELECTRA
Github开源项目预训练模型Huggingface韩国语KcELECTRA用户生成文本nlp模型
KcELECTRA是一种专注于处理噪声文本的韩语预训练模型,基于Naver新闻评论和回复数据集进行训练。对比KcBERT,KcELECTRA在数据集扩展和词汇表方面得到改进,实现了在下游任务中的性能提升。该模型可通过Huggingface的Transformers库轻松访问和使用,无需额外下载文件。
ko-sroberta-nli - 韩语句子语义嵌入的开源模型
Github开源项目语义搜索模型Huggingface句子嵌入句子相似度韩国语ko-sroberta-nli
ko-sroberta-nli模型通过将韩语文本转换为768维向量,支持多种自然语言处理任务如聚类和语义搜索。它在KorNLI和KorSTS数据集上的评估结果值得关注,且允许在不使用sentence-transformers时结合Hugging Face Transformers进行操作,实现灵活的词嵌入应用。这款工具具备便捷的安装和操作,可高效提升韩语语义处理能力。
roberta-large - 深入探索韩语RoBERTa大型语言模型
Github开源项目自然语言处理机器学习模型HuggingfaceKLUERoBERTa模型韩国语
此开源项目展示了在韩语上预训练的RoBERTa大型语言模型,使用BertTokenizer加载,专为提升韩语自然语言处理任务而设计,是研究与应用的有力辅助工具。
ko-gemma-2-9b-it - 韩语大型语言模型,最新版本提升对话生成能力
大型语言模型Github开源项目文本生成模型谷歌GemmaHuggingface韩国语
Ko-Gemma-2-9B-IT 是基于 Google 技术的韩语对话生成模型,经过精心调整,优化人类反馈,适合各种文本生成任务。
gemma-ko-7b-instruct-v0.62 - 简洁韩文文本生成模型,适用于多种自然语言处理任务
Github开源项目文本生成自然语言处理模型Gemma模型优化Huggingface韩国语
Gemma Ko 7B Instruct v0.62 是一个专注于韩文文本生成的模型,能支持语言翻译、文本摘要、问答及对话生成等多种自然语言处理任务。该模型生成的文本高质量且具备上下文连贯性。由开发者 lemon-mint 基于 openchat 的模型进行微调。使用时请谨慎对待数据偏见及潜在错误信息。
et5-typos-corrector - ETRI-et5模型驱动的韩语拼写优化器
Github开源项目模型Huggingface数据预处理拼写纠正韩国语ET5PLM模型
该开源项目基于ETRI-et5模型,为韩语口语拼写问题提供解决方案。通过特定数据集的微调,该工具能够高效自动纠正拼写错误,从而提高文本准确性。数据预处理涵盖去除标点符号和短句以及过筛含标签词汇,以提升纠正性能。用户可轻松输入文本并获取优化结果,适合大量文本处理需求。