Project Icon

rinalmo

基于BERT的非编码RNA预训练模型助力RNA结构预测

RiNALMo是一种基于BERT架构的非编码RNA预训练语言模型。该模型在3600万条独特ncRNA序列上使用掩码语言建模进行训练,可有效应用于RNA结构预测。模型包含33层、1280个隐藏单元和20个注意力头,总参数量达6.5亿。RiNALMo可用于RNA序列特征提取、序列和核苷酸级别的分类回归任务,以及RNA接触预测等多种下游应用。

parakeet-rnnt-0.6b - 先进的英语语音识别模型 准确率达98.37%
FastConformerGithubHuggingfaceNeMoTransducer开源项目模型自动语音识别语音转文本
parakeet-rnnt-0.6b是NVIDIA NeMo和Suno.ai联合开发的英语语音识别模型。采用FastConformer Transducer架构,拥有约6亿参数。在LibriSpeech测试集上错误率仅1.63%,多个数据集上表现优异。支持16kHz单声道音频输入,可通过NeMo工具包使用,适用于多种语音转文本场景。
rtp-llm - 大型语言模型推理加速引擎
CUDAGithubrtp-llm多模态输入大语言模型开源项目量化
rtp-llm是阿里巴巴基础模型推理团队开发的大型语言模型推理加速引擎,广泛应用于支持淘宝问答、天猫、菜鸟网络等业务,并显著提升处理效率。该项目基于高性能CUDA技术,支持多种权重格式和多模态输入处理,跨多个硬件后端。新版本增强了GPU内存管理和设备后端,优化了动态批处理功能,提高了用户的使用和体验效率。
robbert-v2-dutch-base - 荷兰语自然语言处理的先进预训练模型
GithubHuggingfaceRobBERT人工智能开源项目机器学习模型自然语言处理荷兰语模型
RobBERT是基于RoBERTa架构开发的荷兰语预训练语言模型,在多项自然语言处理任务中展现出卓越性能。模型通过39GB荷兰语语料库(含660亿词)预训练,可用于文本分类、回归和标记等任务。RobBERT在情感分析、指代消解和命名实体识别方面表现突出,尤其适合小规模数据集场景。作为目前最先进的荷兰语BERT模型,RobBERT为荷兰语自然语言处理研究和应用提供了强大工具。
bigbird-roberta-base - 高性能长序列文本处理的稀疏注意力Transformer模型
BigBirdGithubHuggingfacetransformer模型开源项目模型深度学习自然语言处理长序列处理
BigBird-RoBERTa-base是一种基于块稀疏注意力机制的Transformer模型,可处理长达4096个token的序列。该模型在Books、CC-News、Stories和Wikipedia等大规模数据集上预训练,大幅降低了计算成本。在长文档摘要和长上下文问答等任务中,BigBird-RoBERTa-base展现出优秀性能。模型支持灵活配置注意力类型,可在默认的块稀疏模式和全注意力模式间切换,为超长序列文本处理提供了高效方案。
nli-deberta-v3-xsmall - 使用DeBERTa模型实现自然语言推理与零样本分类
Cross-EncoderGithubHuggingfaceMultiNLISNLIzero-shot分类开源项目模型自然语言推理
该模型通过Cross-Encoder技术训练,基于microsoft/deberta-v3-xsmall,实现自然语言推理及零样本分类。其使用SNLI和MultiNLI数据进行训练,表现为:SNLI测试集91.64%的准确率,MNLI错配集87.77%的准确率。模型能识别句对的矛盾、蕴涵和中立标签,支持Python和Transformers库的调用,便于在多场景中应用。详细信息请参阅文档以提升项目中的自然语言处理效果。
mindnlp - 开源自然语言处理与大语言模型框架
GithubMindNLPMindSpore大语言模型开源项目自然语言处理预训练模型
MindNLP是一个基于MindSpore的开源自然语言处理库,支持语言模型、机器翻译、问答系统、情感分析、序列标注和摘要生成等多种任务。该项目集成了BERT、Roberta、GPT2和T5等多种预训练模型,通过类似Huggingface的API简化了使用流程。用户可通过pypi或源代码安装该库,并支持包括Llama、GLM和RWKV在内的大型语言模型的预训练、微调和推理,非常适合研究者和开发人员构建和训练模型。
rellm - 使用正则表达式提高语言模型输出的准确性
GPT2GithubReLLM开源项目正则表达式结构化数据语言模型
ReLLM项目利用正则表达式控制语言模型的输出,可生成特定的语法或语义结构,如日期、数字或完整模板。ReLLM在生成前过滤不匹配的词元,提升生成质量。即使是小型模型,也能在ReLLM的帮助下提高输出质量。该项目适用于需要解析JSON、XML等上下文无关文法的场景。
DeBERTa-v3-large-mnli-fever-anli-ling-wanli - 多数据集微调的自然语言推理模型 实现零样本分类和NLI任务
DeBERTa-v3-largeGithubHuggingface开源项目文本分类模型模型训练自然语言推理零样本分类
DeBERTa-v3-large-mnli-fever-anli-ling-wanli模型在多个自然语言推理数据集上进行了微调。该模型在ANLI基准测试中表现优异,是Hugging Face Hub上性能领先的NLI模型。它支持零样本分类,并在MultiNLI、ANLI、LingNLI和WANLI等数据集上达到了先进水平。这个基于Microsoft DeBERTa-v3-large的模型整合了多项创新技术,为自然语言理解任务提供了有效解决方案。
rulm - 俄语语言模型:的实现与性能对比
GPT Role-play RealmGithubRuTurboAlpacaRussianSuperGLUESaigarulm开源项目
此项目展示了俄语语言模型的实现与比较,涵盖DataFest的分享、主要演示和Fine-tuning Colab资源链接。同时介绍了基于ChatGPT生成数据的RuTurboAlpaca和Saiga两个主要数据集,以及相关模型及其训练配置的详细内容。提供了数据集生成脚本和提示。此外,还展示了GPT Role-play Realm的数据集和模型评估结果,包括与GPT4和gpt-3.5-turbo的对比分析。
Mol-Instructions - 大规模生物分子指令数据集助力大语言模型
GithubMol-Instructions大语言模型开源项目数据集生物分子蛋白质
Mol-Instructions是一个开放的大规模生物分子指令数据集,包含分子导向、蛋白质导向和生物分子文本三类指令。数据集涵盖分子设计、蛋白质功能预测等多个任务,通过AI协作、数据提取和模板转换等方法构建。该数据集旨在增强大语言模型在生物分子领域的表现,现已在Hugging Face平台发布。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号