Project Icon

amd-partial-phonetree-v1

融合句子转换器和对比学习的高效文本分类模型

SetFit模型结合sentence-transformers/paraphrase-mpnet-base-v2,通过高效的少样本学习实现文本分类。模型采用对比学习微调句子转换器和训练LogisticRegression分类头,具有优异的分类性能。支持最大512标记长度,适用于电话语音邮件和电话树分类需求。模型适合需要高效文本分类的研发人员和数据科学家使用。

NeuralLLaMa-3-8b-DT-v0.1 - 结合多模型优势的文本生成解决方案,增强任务表现
GithubHuggingfaceLazyMergekitNeuralLLaMa-3-8b-DT-v0.1准确率开源项目文本生成模型模型合并
NeuralLLaMa-3-8b-DT-v0.1 是一种通过融合ChimeraLlama-3-8B-v2、llama-3-stella-8B和llama-3-merged-linear等模型,借助LazyMergekit技术,提升了文本生成任务精确度的开源项目。适用于0-Shot和多次尝试测试,表现出出色的任务表现,严格准确率达43.71%。项目易于集成,支持多种量化配置,适合多种平台应用。
F5-TTS - 提高训练和推理速度的先进文本到语音转换系统
E2 TTSF5-TTSGithub开源项目推理数据集训练
项目F5-TTS利用Diffusion Transformer和ConvNeXt V2技术,显著提升了训练和推理速度。支持生成最长30秒的音频,并通过Sway Sampling技术优化推理性能。用户可以自定义数据集,并使用多GPU和fp16配置加速训练。提供单次推理、语音编辑和批量推理功能,并支持通过Gradio App进行操作。多种测试数据集和评估工具确保模型表现稳定高效。
Firefly-LLaMA2-Chinese - 低资源高效的中英文LLaMA2模型预训练与指令微调
Firefly-LLaMA2-ChineseGithubHuggingface中英双语模型低资源增量预训练大模型技术开源项目
本项目专注于低资源增量预训练与多轮指令微调,提升LLaMA2模型在中文领域的表现。支持对多种中英文预训练模型进行扩充与优化,开源了7B和13B的Base与Chat模型。在Open LLM Leaderboard和CMMLU榜单上表现出色,以4*V100完成高效训练,远低于其他模型的GPU资源需求。提供全项目信流程训练代码及数据,对LLaMA2、Baichuan2等多个模型进行详细评测,确保用户获得全面权威的模型性能数据。
FastSpeech2 - 快速且高质量的端到端文本转语音
FastSpeech 2GithubMelGANNVIDIAPyTorch开源项目文本转语音
FastSpeech 2,面向精准快速的文本到语音转换,基于PyTorch与Espnet技术,配备Nvidia与MelGAN工具,极致优化语音生成效果,适合各类开发者利用和研究。
fashion-clip - 专为时尚领域优化的对比语言视觉学习模型
CLIPFashionCLIPGithubHugging Face开源项目时尚行业模型
FashionCLIP是一个为时尚行业优化的CLIP模型,用于提升商品检索、分类和时尚分析的表现。通过超过70万对图像和文本数据进行微调,FashionCLIP在零样本场景下表现出色。更新版FashionCLIP 2.0采用更多训练数据,显著提高了FMNIST、KAGL和DEEP数据集的性能。项目提供开源代码和模型权重,可在Hugging Face上获取,并支持多种API和教程便于上手。
floret - 将fastText和Bloom嵌入结合的紧凑词向量生成工具
GithubfastTextfloret子词嵌入开源项目文本分类词向量
floret是fastText的扩展版本,结合fastText的子词技术和Bloom嵌入,为任意词生成紧凑的全覆盖向量。通过将词和子词哈希存储在同一表中,大幅减少存储空间。支持训练词嵌入和文本分类模型,提供Python接口,生成的向量可轻松导入spaCy等NLP库。作为一个高效的文本处理工具,floret在保持fastText优点的同时,提供了更紧凑的词向量表示方法。
SkyText-Chinese-GPT3 - 中文GPT-3预训练模型多功能应用
GithubNLP技术SkyText中文GPT3奇点智源开源项目预训练大模型
SkyText项目推出的中文GPT-3预训练模型,具备聊天、问答、中英互译等多种功能,支持内容续写、对对联、写古诗、生成菜谱等多种应用。模型经过30多道数据清洗流程,采用创新的中文编码方式,以确保高质量的语料和模型效果。该项目提供了13亿参数和2.6亿参数两种版本,用户可选择不同参数规模的模型进行体验。
llama-classification - 利用LLaMA的文本分类代码库概述与使用指南
GithubLLaMA代码库实验设置开源项目文本分类预处理
这个代码库提供了使用LLaMA进行文本分类的基础代码。用户可以通过该项目设置实验环境并运行在Nvidia V100 GPU上,用于与Huggingface数据集进行文本分类实验。项目介绍了Direct、Channel和Pure Generation三种方法,并提供了预处理、推理和校准的具体示例。
Chinese-CLIP - 中文多模态嵌入和检索性能优化的领先方案
Chinese-CLIPGithub图文特征提取开源项目模型下载跨模态检索零样本图像分类
Chinese-CLIP项目,基于大规模中文图文对数据,专门针对中文领域的特点进行优化,提供高效的图文特征计算与相似度测算,实现零样本分类和跨模态检索。该项目改进了多个模型,包括ViT与ResNet结构,并在多个公开数据集上展示了显著的性能提升,为中文处理场景下的企业和研究者提供强大工具。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

稿定AI

稿定设计 是一个多功能的在线设计和创意平台,提供广泛的设计工具和资源,以满足不同用户的需求。从专业的图形设计师到普通用户,无论是进行图片处理、智能抠图、H5页面制作还是视频剪辑,稿定设计都能提供简单、高效的解决方案。该平台以其用户友好的界面和强大的功能集合,帮助用户轻松实现创意设计。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号