#法语

flaubert_base_uncased - 法语语言模型FlauBERT与FLUE测试集
Github开源项目模型HuggingfaceNLP系统法语FlauBERTFLUE无监督语言模型
FlauBERT是一种专为法语自然语言处理设计的模型,通过法国国家科学研究中心的Jean Zay超级计算机在大型法语语料库上进行训练,支持多种模型尺寸,以适应不同需求。其配套的FLUE评测方案类似于GLUE基准,促进了法语NLP系统的共享与发展,并支持未来的实验重复性。用户可通过Hugging Face的Transformers库便捷使用FlauBERT,为法语NLP领域提供了有力支持。
camembert-base-legacy - 基于RoBERTa的法语语言模型在多任务中的应用
Github开源项目语言模型预训练Hugging Face模型HuggingfaceCamemBERT法语
CamemBERT是一种先进的法语语言模型,基于RoBERTa,提供多种可选变体,可满足不同的自然语言处理需求。通过Hugging Face库,用户能够轻松集成和应用其强大的掩码填充和上下文特征提取功能。
whisper-large-v3-french-distil-dec8 - 优化法语语音识别的内存使用和推理效率
Github开源项目模型推理速度Huggingface语音转录自动语音识别法语Whisper-Large-V3-French-Distil-Dec8
Whisper-Large-V3-French-Distil通过减少解码层数和优化推理时间,实现法语语音识别的高效性。该模型支持多种库,如transformers和openai-whisper,并能与原版Whisper-Large-V3-French模型结合使用,增强推理速度和结果一致性。评估数据表明其在多语料库中将单词错误率(WER)降至较低水平。
opus-mt-es-fr - 开源西班牙语-法语神经机器翻译模型
Github开源项目模型Huggingfacetransformer模型机器翻译西班牙语OPUS-MT法语
opus-mt-es-fr是基于transformer-align架构开发的西班牙语-法语机器翻译模型。模型在新闻测试集上实现32-35的BLEU评分,在Tatoeba测试集达到58.4分。项目采用OPUS数据集训练,使用normalization和SentencePiece技术预处理数据。
wav2vec2-large-xlsr-53-french - 法语语音识别模型实现自动语音文本转录
Github开源项目语音识别机器学习模型HuggingfaceCommon Voice法语XLSR
该开源模型通过针对法语的深度训练,实现了法语语音到文本的自动转录功能。模型支持处理16kHz采样率的语音输入,在标准测试集上展现出较低的错误率。模型提供完整的使用示例和评估工具,可用于法语语音识别相关应用开发。
MIstral-QUantized-70b_Miqu-1-70b-iMat.GGUF - 优质法语对话能力的70B模型,适用于大容量VRAM
Github开源项目模型Mistral AI量化Huggingface法语Miqu 1 70b上下文大小
Miqu 1 70b是Mistral Medium Alpha的一个模型,由Mistral AI公司开发,适合法语使用者。该模型在法语对话中表现出色,智能性能与精调的Llama 2 70b相当,并倾向于避免过拟合。Miqu提供多种量化格式,Q4_K_S和Q3_K_M在48GB和36GB VRAM上支持完全卸载,满足大容量VRAM用户需求。虽然Miqu与CodeLlama 70b有相同的100万theta值,但在实验中证明其最大上下文能力为32k,相较于4k更具优势,并提供较低的周转率。
distilcamembert-base-sentiment - DistilCamemBERT-Sentiment揭示法语情感分析的高效选择
Github开源项目模型模型压缩情感分析HuggingfaceCamemBERT法语DistilCamemBERT
DistilCamemBERT-Sentiment是一种优化的法语情感分析模型,通过使用Amazon Reviews和Allociné数据集微调,降低偏差。相较其他基于CamemBERT的方案,该模型缩短了推断时间,并在精确度和top-2准确率上表现良好,适合用于高效生产环境。
distilcamembert-base-ner - 法语命名实体识别模型,推理时间减半
Github开源项目模型模型优化Huggingface实体识别CamemBERT法语DistilCamemBERT-NER
DistilCamemBERT-NER针对法语命名实体识别进行微调,与CamemBERT相比推理时间缩短一半但能耗保持不变。采用wikiner_fr数据集,综合F1得分达98.18%。在PER、LOC、ORG类别上,性能优于多语种与Flair法语模型,提供高效的文本处理解决方案。
sentence-camembert-base - 提供法语句子嵌入的先进方法,有效提升文本相似度
Github开源项目模型模型评估Huggingface句子嵌入句子相似性法语sentence-camembert-base
该模型利用预训练的Camembert-base和Siamese BERT-Networks微调,为法语句子嵌入提供了先进的方法,通过训练在stsb_multi_mt数据集上,有效提升文本相似度精确性。测试中Pearson相关系数达到82.36,适合从事法语内容分析的开发者,助力提高自然语言处理任务的准确性和效率。
flaubert_small_cased - 用于法语自然语言处理的无监督语言模型
Github开源项目语言模型模型Huggingface法语FlauBERTCNRS无监督预训练
FlauBERT是基于大型法语语料库进行预训练的无监督语言模型,提供多种尺寸选择。结合FLUE评估平台,增强法语自然语言处理的评估能力。该项目利用CNRS Jean Zay超算机,支持未来的可重复实验,并已集成于Hugging Face的Transformers库中,便于开发者应用。
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号