Logo

#模型

Logo of llm
llm
一款CLI工具和Python库,用于与大型语言模型交互,支持远程API和本地安装模型。可从命令行运行提示、将结果存储在SQLite中、生成嵌入等。通过插件目录,可访问更多模型。
Logo of FlashRank
FlashRank
FlashRank是一款极速、超轻量的Python库,专为优化搜索和检索流程设计。基于最新的SoTA大规模语言模型和交叉编码器,支持多种再排序模式并能在常规CPU上运行。模型轻至4MB,适合AWS Lambda等无服务器环境,有效减低运行成本,提升处理效率。适合多样化的部署场景和搜索策略,是提升搜索效率的优选工具。
Logo of catai
catai
本地运行GGUF模型,通过简单的聊天界面与AI助手互动。支持自动检测编程语言、查看原始消息、实时文本流和快速模型下载等功能。兼容Windows、Linux和Mac平台,提供易用的Web API和开发API,方便开发者管理和使用AI模型。
Logo of WebGPT
WebGPT
WebGPT项目是一款基于WebGPU的Transformer模型应用,使用纯JavaScript和HTML实现。该项目不仅用于技术演示,同时也作为教育资源,支持在主流浏览器中运行,并能管理最多500M参数的模型。主要优化在Chrome v113和Edge Canary等浏览器上,通过WebGPU技术提高运行效率,适合用于学习和研究深度学习模型。
Logo of Aquila2
Aquila2
页面提供详细的Aquila2系列(包括Aquila2-7B、Aquila2-34B和Aquila2-70B-Expr)和AquilaChat2系列(包括AquilaChat2-7B、AquilaChat2-34B和AquilaChat2-70B-Expr)开源模型信息,包含快速入门指南、微调教程、长文本理解与评估方法及模型下载链接。最新新闻和更新展示了这些模型在多个数据集上的性能,及其在长文本理解和推理任务中的表现,帮助用户全面了解与应用。
Logo of tiktoken-go
tiktoken-go
tiktoken-go是一个高效的BPE分词器,适用于OpenAI的多种模型。作为原版tiktoken在Go语言中的实现,它提供了与原库一致的缓存机制和多种加载选项,包括离线加载器,便于快速使用和自定义实现。项目包含详细的使用示例,涵盖各种编码和模型,以及性能测试结果,展示了其出色的性能表现。
Logo of mynlp
mynlp
mynlp是一个高性能且可扩展的中文自然语言处理工具包,支持通过Maven和Gradle轻松安装。用户可根据需求选择核心词典、词性标注、命名实体识别、拼音切分等模型资源,mylnp-all依赖包涵盖大部分常用资源。该项目参考了多个优秀开源项目并结合多种算法,适用于广泛的应用场景。详情请访问mynlp在线文档。
Logo of llama-api-server
llama-api-server
llama-api-server是一个开源RESTful API服务器,兼容OpenAI API并支持llama和llama2等后端。用户可以通过PyPI下载、配置模型和安全令牌文件后启动服务器。该项目支持广泛的GPT工具和框架,提供详尽的安装及使用指南。其主要功能包括文本完成、嵌入和聊天,并支持参数设置如温度和顶级概率。项目正处于积极开发阶段,未来将添加更多功能和文档。
Logo of deepdoctection
deepdoctection
deepdoctection是一个Python库,通过深度学习模型实现文档提取和布局分析,支持对象检测、OCR和文本挖掘。此集成框架结合Tensorflow或PyTorch等库,适用于PDF或扫描图片文档处理,支持文档布局分析、表格识别和文本分类等任务,致力于解决实际应用问题,是文档处理领域开发者的理想选择。
Logo of rasa_nlu_gq
rasa_nlu_gq
rasa_nlu_gq是基于最新版本Rasa的改进版,对原有组件进行了优化和扩展。新特性包括双向LSTM和膨胀卷积模型的实体识别、jieba词性标注、实体反向修改意图、BERT模型的词向量特征提取,以及CPU和GPU资源配置优化。此项目还引入了TensorFlow API用于意图分类。详细安装说明及实例请参阅相关链接。
Logo of generative-ai-python
generative-ai-python
Google AI Python SDK为Python开发者提供了构建基于Google DeepMind Gemini模型的多模态应用的便捷途径。通过该SDK,可以轻松操作文本、图像和代码。使用者需在Google AI Studio创建API密钥,并参考Python SDK教程和快速入门指南。详细使用示例与全面文档详见Gemini API Cookbook和ai.google.dev,全面支持各版本Python。
Logo of comfyui_segment_anything
comfyui_segment_anything
ComfyUI Segment Anything项目在ComfyUI框架下实现了核心功能,并提供详细的Python依赖安装指南和模型下载方式,确保与sd-webui-segment-anything一致。用户可以通过pip命令快速安装所需依赖,并自动或手动下载BERT、GroundingDino和SAM模型。如下载速度较慢,可设置代理加速。项目欢迎社区贡献,用户可以通过fork和pull request参与代码改进。
Logo of gen-efficientnet-pytorch
gen-efficientnet-pytorch
本项目实现了EfficientNet、MixNet、MobileNetV3等多种高效模型,利用通用架构定义支持多种计算高效的神经网络。所有模型均基于MobileNet V1/V2块序列设计,并支持字符串化架构配置。请注意,该项目现已停止维护,推荐使用`timm`库获取更多功能和权重兼容的模型。
Logo of DenseNet
DenseNet
DenseNet通过每层与其他层的直接连接,提升图像识别准确性并减少参数和计算量。最新版本内存效率更高,支持CIFAR和ImageNet数据集,提供PyTorch、TensorFlow、Keras等深度学习框架的实现代码,适合研究和应用。
Logo of interpret
interpret
InterpretML 是集合先进机器学习解释技术的开源工具包,使用户能训练可解释模型及分析黑箱系统。工具包支持模型调试、特征工程、公平性检测和人工智能协作等,帮助用户全方位理解模型行为并确保法规与高风险应用的合规性。通过实例展示,InterpretML 不仅增强了模型透明度,也提高了其可信度。
Logo of qlib
qlib
Qlib是一个开源AI量化投资平台,利用AI技术赋能金融研究和价值创造。支持监督学习、市场动态建模和强化学习等多种机器学习模式,覆盖量化投资的全部流程,如alpha寻求、风险管理、投资组合构建及订单执行。平台不断更新,引入最新量化研究成果和论文。
Logo of bert4torch
bert4torch
bert4torch是一个基于PyTorch开发的自然语言处理工具。支持包括BERT、RoBERTa、GPT在内的多种预训练模型,适用于广泛NLP任务。提供丰富示例及详尽文档,助力快速实施项目。特包高级功能如大模型推理,极致满足专业需求,是NLP领域的首选工具库。
Logo of LLM-Zoo
LLM-Zoo
展示多种开源与闭源LLM模型的详细信息,包括发布时间、模型大小、支持语言、适用领域及训练数据。提供GitHub、HuggingFace、演示及研究论文链接,信息定期更新以反映最新进展。欢迎贡献者参与添加新模型或更新现有模型信息。
Logo of Smarty-GPT
Smarty-GPT
Smarty-GPT 是一个自动化工具,旨在通过提示词和上下文对多个大型语言模型(如 ChatGPT、GPT4 等)的行为进行调整,且对终端用户透明。用户可以通过简单的安装脚本快速部署,并使用多种模型及自定义提示词功能。该项目支持手动提示词、Awesome Chat GPT 提示词和自定义提示词,通过 Colab 等平台提供丰富的代码示例,方便用户上手。欢迎开发者贡献新功能和模型。
Logo of chatgpt-cli
chatgpt-cli
ChatGPT CLI是一款命令行工具,利用官方API实现快速对话,成本远低于ChatGPT Plus订阅。支持多种配置方式及模型选择,还可恢复会话,适用于多场景。安装和配置简便,提供多种命令和功能,提升用户体验。
Logo of openai
openai
该项目提供了一个R包,用于访问OpenAI的API,包括模型、文本生成、聊天、编辑、图像、嵌入、音频、文件、微调和审核功能。用户可以通过R函数实现文本生成、图像合成和语音转文字等操作。项目持续更新,并支持最新的GPT-3.5-turbo模型,安装方便,并提供详细的API密钥配置指南,适用于各种应用场景。
Logo of spacy-models
spacy-models
此页面详细介绍了spaCy模型的下载、安装和使用方法。内容涵盖模型命名规范、版本管理以及旧版本支持。提供用于文本处理的多种模型,包括标签、解析、命名实体识别和句子分割。本页面还确保模型具备快速部署与透明管理的特性。
Logo of beto
beto
此页面介绍了一个基于大型西班牙语语料库训练的BERT模型BETO,提供无区分大小写和区分大小写的Tensorflow和Pytorch版本。BETO应用全词掩蔽技术,在多项西班牙语基准测试中表现优异,并与多语言BERT及其他模型进行了对比。用户可以在HuggingFace Model Repository下载BETO模型,并通过HuggingFace Transformers库轻松使用。此外,页面还包含示例代码和引用信息。
Logo of instructor-embedding
instructor-embedding
INSTRUCTOR是一种指令微调的文本嵌入模型,无需额外训练即可生成定制化的文本嵌入,支持多种任务和领域,覆盖70项不同的嵌入任务,表现卓越。最新更新包括优化的代码结构和硬负样本检查点。用户可以通过本地或Colab轻松安装和使用INSTRUCTOR进行文本分类、信息检索和聚类等任务,并提供详细的安装及使用指南。
Logo of fromage
fromage
该页面介绍了FROMAGe项目,为其多模态输入输出任务提供代码和模型权重。包含详细的设置指南、预训练检查点、图像检索预计算嵌入、推理和训练示例以及评估脚本。研究人员可使用这些资源在视觉故事讲述和对话生成等任务中实现突破。欢迎访问项目主页和在线演示参与讨论。
Logo of compression
compression
TensorFlow Compression 提供一套数据压缩工具,帮助构建端到端优化的数据压缩机器学习模型。该库支持高效存储数据表示,减少性能损失。主要功能包括范围编码、熵模型类以及用于数据压缩的额外TensorFlow功能和Keras层。2024年2月1日起,该库进入维护模式,适用于TensorFlow 2.14及以上版本。用户可以通过教程和论文链接深入了解有损数据压缩及模型优化方法。
Logo of 魔搭社区
魔搭社区
魔搭社区是一个专业平台,旨在汇聚各领域机器学习模型,提供模型探索、推理、训练、部署和应用等一站式服务。设计简约,操作便捷,确保用户可以快速找到所需功能。直观的导航和详尽的文档支持帮助用户快速上手,推动机器学习技术的广泛应用。
Logo of best_AI_papers_2022
best_AI_papers_2022
2022年人工智能领域的科研进展和技术发展。这个集合包含了通过严格策划得到的多篇AI论文,由专家louisfb01整理,每篇论文均提供视频概述、详细文章链接和实现代码,覆盖伦理、偏见和治理等多个关键议题。
Logo of KAN-TTS
KAN-TTS
KAN-TTS能够提供从零开始训练个性化文本到语音模型的能力。支持包括sam-bert和hifi-GAN在内的多种模型,并持续进行模型更新。支持多种语言,包括普通话、英语等。详尽的培训教程和在线演示可在官方网站查阅。如有疑问,欢迎联系我们。
Logo of node-chatgpt-api
node-chatgpt-api
node-chatgpt-api提供了一个支持最新gpt-3.5-turbo模型的Node.js模块、REST API服务及命令行应用。该项目支持在各种应用中集成ChatGPT功能,易于部署且支持Docker。开发者还可以通过API编程来管理和自定义ChatGPT对话,以创造个性化的聊天体验。
Logo of wllama
wllama
wllama项目提供了WebAssembly绑定,让用户无需后台或GPU即可在浏览器中运行推理任务。项目支持Typescript,并提供高性能API和实验性编码器-解码器架构。还包括离线缓存、自定义日志器及并发文件加载等功能。适用于在Web环境中进行文本补全和嵌入计算的开发者。
Logo of text
text
TorchText将于2024年4月发布其最终稳定版0.18。这一NLP工具包包括原始文本迭代器、基本NLP构建模块、文本处理转换、预训练模型和词汇类等功能。推荐使用Anaconda安装,支持多种Python版本。指南和文档包括SpaCy、Moses等可选依赖项。提供详细教程和示例帮助用户入门。
Logo of spacy-stanza
spacy-stanza
spacy-stanza 是一个包装 Stanza 库的软件,使得在 SpaCy 管道中使用斯坦福模型变得更加容易。其功能包括多语言词性标注、形态分析、词干提取和依存解析,支持68种语言,还为部分语言提供命名实体识别功能。用户可以通过下载预训练的 Stanza 模型,通过 spacy_stanza.load_pipeline() 加载并处理文本。这个工具还允许添加自定义组件,结合 SpaCy 的词汇属性、规则匹配和可视化功能,提供了强大的自然语言处理解决方案。
Logo of openaigo
openaigo
由社区维护的OpenAI API客户端库。支持文本补全、对话补全、图片生成、编辑、嵌入和文件操作等API功能,易于集成并适合多种开发需求。代码通过CodeQL分析和测试,提供详细使用示例,帮助开发者快速上手和减少调试时间。
Logo of opennlp
opennlp
Apache OpenNLP是一个用Java编写的机器学习工具包,用于自然语言处理,支持分词、句子分割、词性标注、命名实体识别、块解析、语法分析、共指解析和语言检测等任务。项目旨在提供成熟的NLP工具,并提供多语言预训练模型和注释资源。OpenNLP可以通过Java API或命令行使用,易于集成到如Apache Flink、Apache NiFi、Apache Spark等分布式处理管道中。
Logo of MapTR
MapTR
MapTR是一款高效准确的在线向量化高精度地图构建框架,可应用于自动驾驶系统的复杂场景中。该框架采用统一的置换等效建模方法,结合分层查询嵌入和双向匹配策略,提高了学习过程的稳定性,具备实时推理能力,并在nuScenes和Argoverse2数据集中表现出色。MapTR支持多种地图元素,具备良好的扩展性和灵活性。最新版本MapTRv2提升了性能和收敛速度,并引入了额外的语义中心线,进一步优化下游规划需求。
Logo of stable-diffusion-docker
stable-diffusion-docker
Stable Diffusion Docker 容器在支持 CUDA 的 GPU 上运行,通过官方模型实现高质量图像生成。支持从文本生成图像、图像修改、深度引导和图像修复等功能,适用多种应用场景。最低要求 8GB VRAM 的 GPU,并提供设备选择和内存优化选项。详细使用指南和示例帮助用户快速入门。
Logo of Holocron
Holocron
Holocron项目提供深度学习计算机视觉最新技术的高效实现,增强开发者灵活性并与PyTorch生态系统兼容。支持多种图像分类、目标检测和语义分割模型,包括Res2Net、Darknet和YOLO等。项目附带详细文档、示例代码和实时演示,助力开发者快速上手并部署高性能视觉解决方案,并提供多种优化算法和工具提升训练效率与准确性。适用于追求前沿性能和灵活开发环境的研究人员和工程师。
Logo of Index-1.9B
Index-1.9B
Index-1.9B系列模型集成了SFT和DPO,显著提升了多语言对话和翻译性能。该系列包含基础模型、纯净模型、对话模型和角色扮演模型,特别适用于中文和东亚语言环境。最新更新包含适配llamacpp和Ollama的版本,并开放了衰减前的检查点供研究使用。提供高效的量化方法和详细的微调指南,确保模型在实际应用中的出色表现,开发者可通过丰富的定制和优化选项提升模型效果。
Logo of postgresml
postgresml
PostgresML是集成于PostgreSQL的全面ML/AI平台,优化模型数据管理流程,支持高级自然语言处理和多维文本分析,提供先进模型训练调整API,加速数据驱动的业务决策。
Logo of LMFlow
LMFlow
LMFlow为大型机器学习模型微调提供一个可扩展、便捷且高效的开源工具箱,支持多种优化功能,如自定义优化器训练、LISA算法等,已广泛应用于机器学习领域。
Logo of openlm
openlm
OpenLM是一个兼容OpenAI的库,支持调用来自HuggingFace、Cohere等多家提供商的大语言模型。它支持OpenAI的Completion API参数,并返回类似的响应结构。用户可以在一个请求中完成多个模型的多个提示,直接调用推理API,避免使用多个SDK的复杂性。安装简便,只需通过pip命令。目前支持Completion端点,并计划未来增加更多标准化端点。
Logo of pytorch-openai-transformer-lm
pytorch-openai-transformer-lm
该项目实现了OpenAI Transformer语言模型在PyTorch中的复现,提供了预训练权重加载脚本及模型类。采用固定权重衰减和调度学习率优化模型,支持对ROCStories Cloze任务进行微调,效果接近原始TensorFlow实现。适用于深度学习研究和语言模型的生成与分类任务。
Logo of splade
splade
SPLADE项目使用BERT的MLM头和稀疏正则化来学习查询和文档的稀疏扩展,优化了检索性能。项目包含训练、索引和检索的代码,并支持在BEIR基准测试中评估。最新版本通过硬负样本采样、蒸馏和改进的预训练语言模型初始化,显著提升了检索效果。此外,SPLADE的稀疏表示优化了倒排索引的使用,提供了显式词汇匹配和可解释性等优点。经过优化的训练和正则化,SPLADE在域内外测试中表现优异,延迟性能与BM25相当。
Logo of CLIP-ImageSearch-NCNN
CLIP-ImageSearch-NCNN
CLIP-ImageSearch-NCNN项目在移动设备和x86平台上使用CLIP模型实现了自然语言图像检索功能。通过图像和文本特征提取,支持以图搜图、以字搜图等多种搜索方式,提供高效的图像搜索体验。项目包含适用于Android和x86平台的demo,利用ncnn进行部署,广泛适用于手机相册等图像搜索应用。
Logo of CoreNLP
CoreNLP
Stanford CoreNLP 是用 Java 编写的自然语言处理工具集。它处理文本输入,提供词形还原、词性标注、实体识别、日期和数量标准化等功能。支持包括英语、阿拉伯语、中文、法语、德语等多种语言。该工具集集成度高,仅需两行代码即可运行所有工具,广泛应用于学术界、工业界和政府部门。
Logo of fashion-clip
fashion-clip
FashionCLIP是一个为时尚行业优化的CLIP模型,用于提升商品检索、分类和时尚分析的表现。通过超过70万对图像和文本数据进行微调,FashionCLIP在零样本场景下表现出色。更新版FashionCLIP 2.0采用更多训练数据,显著提高了FMNIST、KAGL和DEEP数据集的性能。项目提供开源代码和模型权重,可在Hugging Face上获取,并支持多种API和教程便于上手。
Logo of DialogStudio
DialogStudio
DialogStudio 是一个全面的对话数据集项目,包含大量统一的对话数据集和任务意识模型,支持对单个数据集和大型语言模型的训练。用户可以通过 HuggingFace 轻松下载和使用这些数据集,涵盖从知识驱动到任务导向多个领域。同时,项目进行了高质量的数据集评估,提供了详细的评价标准和评分。DialogStudio 既促进会话 AI 研究,也为模型开发者和数据科学家提供了重要资源,推动该领域的创新与进步。
Logo of keras_cv_attention_models
keras_cv_attention_models
该项目提供全面的深度学习模型和使用指南,支持Keras和PyTorch后端。涵盖基础操作、模型训练、推理优化等功能,并详细介绍识别、检测、分割和语言模型的使用。还支持ONNX导出和推理性能评估。
Logo of uncertainty-baselines
uncertainty-baselines
Uncertainty Baselines提供高质量的不确定性和鲁棒性标准模板,作为研究人员新想法和应用的起点,促进技术交流。项目高效实施关键任务,减少对代码库其他文件的依赖,便于独立使用。建议不确定性和鲁棒性评估的最佳实践,帮助研究人员快速原型化和基准比较。支持TensorFlow开发,可在TPUs和GPUs上运行,提升实验灵活性和重复性。