#自然语言处理

CLIP - CLIP是一种在各种(图像、文本)对上训练的神经网络
CLIPPyTorch图像识别自然语言处理模型训练Github开源项目
CLIP通过对比学习训练神经网络,结合图像和文本,实现自然语言指令预测。其在ImageNet零样本测试中的表现与ResNet50相当,无需使用原始标注数据。安装便捷,支持多种API,适用于零样本预测和线性探针评估,推动计算机视觉领域发展。
AutoGroq - 动态生成AI团队,包括专家生成、自然对话、代码片段提取等功能
AutoGroqAI助手动态代理生成自然语言处理代码片段提取Github开源项目
AutoGroq根据用户需求动态生成AI团队,优化工作流程和项目管理。无需手动配置,即可实现专家生成、自然对话、代码片段提取等功能,并支持多种LLM整合。该工具已被近8000名开发者采用。
pytorch-book - PyTorch 1.8入门与高级应用指南
PyTorch深度学习神经网络生成对抗网络自然语言处理Github开源项目
这本书提供了《深度学习框架PyTorch:入门与实践(第2版)》的对应代码,基于PyTorch 1.8编写,内容涵盖基础使用、高级扩展和实战应用三大模块。读者可以学习从安装PyTorch、使用Tensor与自动微分系统、构建神经网络模块到进行数据加载与GPU加速等操作。此外,还讲解了向量化、分布式计算及CUDA扩展的高级技术,并通过图像分类、生成对抗网络、自然语言处理、风格迁移及目标检测等实战项目,深入理解并应用PyTorch进行深度学习开发。
rags - 使用自然语言从数据源创建RAG管道
RAGsStreamlitOpenAI数据管道自然语言处理Github开源项目
RAGs是一个基于Streamlit的应用程序,使用自然语言从数据源创建RAG管道。用户可以描述任务和参数,查看和修改生成的参数,并通过RAG代理查询数据。项目支持多种LLM和嵌入模型,默认使用OpenAI构建代理。该应用程序提供了一个标准的聊天界面,能够通过Top-K向量搜索或总结功能满足查询需求。了解更多关于安装和配置的信息,请访问GitHub页面或加入Discord社区。
Deep-Learning-Interview-Book - 详尽介绍深度学习求职面试所需的各类知识
Deep Learning Interview Book深度学习求职攻略机器学习自然语言处理Github开源项目
该指南全面涵盖深度学习领域的求职面试知识,包括数学、机器学习、深度学习、强化学习、计算机视觉、图像处理、自然语言处理、SLAM、推荐算法、数据结构与算法、编程语言(C/C++/Python)、深度学习框架等,旨在帮助求职者高效准备面试。
smile - Java与Scala的高性能机器学习引擎
Smile机器学习数据可视化自然语言处理分类算法Github开源项目
Smile是一个高效且全面的机器学习系统,支持Java和Scala,包含自然语言处理、线性代数、图形、插值和可视化功能。其先进的数据结构和算法提供卓越性能,涵盖分类、回归、聚类、关联规则挖掘、特征选择、多维缩放、遗传算法、缺失值插补和高效近邻搜索等领域。用户可以通过Maven中央库使用,并在Smile网站找到编程指南和详细信息。
courses - AI课程和资源精选合集
AI courses人工智能深度学习自然语言处理机器学习Github开源项目
本仓库汇集了各种人工智能课程和资源链接,适合不同学习阶段的用户。涵盖生成式AI、深度学习、自然语言处理等多个主题的免费课程,资源来自麻省理工学院、斯坦福大学、哈佛大学等知名机构。欢迎贡献和建议,共同打造优质的AI学习平台。
nlp - NLP基础知识与应用案例介绍
NLP自然语言处理机器学习fasttext开源书籍Github开源项目
介绍自然语言处理(NLP)的基础知识和实际应用,包括常用数据集、机器学习模型评价方法、词袋模型、TFIDF、Word2Vec、Doc2Vec等技术,以及多层感知机、fasttext和LDA在文档分类和主题建模中的应用。还展示了对美食评语的情感分析,说明了NLP在文本理解与安全领域的重要性。此外,还介绍了一本开源NLP入门书籍的写作和更新过程,适合想深入了解NLP技术的读者。
spaCy - 高性能自然语言处理库
spaCy自然语言处理Python神经网络模型训练系统Github开源项目热门
spaCy 是一个高级自然语言处理库,支持Python和Cython,适用于实际产品开发。它提供预训练管道,支持70种以上语言的分词和训练,拥有最先进的速度和神经网络模型,可用于词性标注、句法解析、命名实体识别、文本分类等多种任务。spaCy 同时支持多任务学习和使用预训练变换器,如BERT,适合生产环境下的训练系统,模型打包,部署和工作流管理,是商业开源软件,遵循MIT许可证。
mars5-tts - MARS5英文语音合成模型,提供多声部解析能力
MARS5语音模型CAMB.AI自然语言处理深度学习Github开源项目热门
MARS5是由CAMB.AI开发的英文语音合成模型,采用两阶段AR-NAR管道设计,并具有创新的NAR组件。该模型能够在仅需5秒的音频和一小段文本的情况下,处理包括体育解说、动画等在内的多样化、复杂的语调场景。用户可以通过简单的设置,选择浅色克隆或深色克隆方法进行语音合成,优化输出以适应特定用途。支持通过Docker或API使用模型,适合没有硬件条件的用户。详见官方文档和GitHub页面。
pandas-ai - 高效数据处理与自然语言交互平台
PandasAIPython数据可视化自然语言处理数据分析Github开源项目热门
PandasAI是一个强大的Python平台,专为非技术用户设计,通过自然语言轻松查询数据。它不仅帮助技术用户节省时间,还通过Jupyter notebooks或借助FastAPI和Flask轻松部署为REST API。想要了解更多PandasAI Cloud或企业版服务,欢迎联系我们获取详细信息。
iAsk - 免费高精度AI搜索引擎,即刻获得准确回答
热门AI助手AI搜索引擎AI工具iAsk ProMMLUTruthfulQA自然语言处理
iAsk.Ai——顶尖免费AI搜索引擎,结合先进的NLP及Transformer技术,提供即时、准确且客观的答案。在行业标准测试中,性能优于人类专家,是您信赖的信息检索助手。
Awesome-LLM-Long-Context-Modeling - 包含有关高效转换器、长度外推、长期内存、检索增强生成 (RAG) 和长上下文建模评估的论文和博客的存储库
大语言模型长文本处理信息检索Transformer优化自然语言处理Github开源项目
本仓库收集了关于高效变换器、长度外推、长期记忆、增强检索生成(RAG)及长文本建模评估的研究论文和博客,提供专业资源用于探索长上下文模型及其挑战,并讨论优化NLP模型的创新方法,适合深度语言模型和复杂文本建模研究人员及开发者。考虑到用户搜索意图的多样性,建议在SEO描述中提及项目对长文本建模从算法到实际应用的全面影响,以及其对未来研究方向的启示。
spark-nlp - 高效自然语言处理与大规模语言模型开源库
Spark NLPApache Spark自然语言处理机器学习预训练模型Github开源项目
Spark NLP 是一个基于 Apache Spark 的开源库,提供高效且准确的自然语言处理注释,支持机器学习管道的分布式扩展。该库包含超过 36000 个预训练管道和模型,支持 200 多种语言,涵盖分词、词性标注、嵌入、命名实体识别、文本分类、情感分析、机器翻译等任务。兼容 BERT、RoBERTa 等主流变压器模型,支持 Python、R、Java、Scala 和 Kotlin。
PyTorch-Tutorial-2nd - 涵盖深度学习应用与推理部署的知识库
PyTorch深度学习计算机视觉自然语言处理大语言模型Github开源项目
本书基于PyTorch,系统性涵盖深度学习的核心知识,包括计算机视觉、自然语言处理、大语言模型等实战案例,详解ONNX和TensorRT推理部署框架,为读者提供从基础到应用的完整指导,帮助快速掌握PyTorch并实现项目落地。适合AI自学者、产品经理及跨领域人士阅读。
axflow - 模块化的TypeScript自然语言处理开发框架
AxflowTypeScriptAI应用开发自然语言处理框架Github开源项目
Axflow是一款模块化的TypeScript框架,用于开发强大的自然语言处理应用。其模块化设计支持逐步采用,形成完整的AI开发解决方案。主要模块包括无依赖SDK、数据连接框架和LLM质量评估工具。此外,Axflow还在开发高效数据处理、模型服务和微调库。Axflow旨在简化LLM操作,为开发者提供灵活和高效的TypeScript AI开发体验。
raptor - 利用递归树结构提升大规模文本检索效率的新技术
RAPTOR文档检索语言模型树结构自然语言处理Github开源项目
RAPTOR采用递归树结构,提升语言模型的信息检索效率和上下文理解能力,克服了传统模型的局限。本文介绍了RAPTOR的具体实施方法、安装步骤和使用指南,并展示了如何集成自定义模型来扩展其功能。
shell-ai - 命令行自然语言理解工具,简化Shell命令生成
Shell-AI命令行工具自然语言处理命令建议跨平台Github开源项目
Shell-AI是一款命令行工具,通过自然语言理解生成Shell命令建议。支持跨平台使用,兼容Azure OpenAI部署。用户输入自然语言描述后,Shell-AI会提供符合需求的单行命令建议。支持多种配置方式,安装简单,适用于Linux、macOS和Windows系统。
mindnlp - 开源自然语言处理与大语言模型框架
MindNLP自然语言处理预训练模型大语言模型MindSporeGithub开源项目
MindNLP是一个基于MindSpore的开源自然语言处理库,支持语言模型、机器翻译、问答系统、情感分析、序列标注和摘要生成等多种任务。该项目集成了BERT、Roberta、GPT2和T5等多种预训练模型,通过类似Huggingface的API简化了使用流程。用户可通过pypi或源代码安装该库,并支持包括Llama、GLM和RWKV在内的大型语言模型的预训练、微调和推理,非常适合研究者和开发人员构建和训练模型。
HealthGPT - 利用大型语言模型在苹果健康生态系统中处理个性化健康数据
HealthGPTStanford SpeziApple Health自然语言处理开源项目Github
HealthGPT是斯坦福生物设计团队的开源iOS应用,基于Stanford Spezi平台开发。此应用使用户能够通过自然语言与Apple Health的健康数据交互,支持语音输入和文字输入。HealthGPT不仅支持本地数据查询以保护用户隐私,还整合了GPT-3.5和GPT-4模型,能查询多种健康指标如睡眠、步行和活跃能量等。
ML-YouTube-Courses - YouTube上的机器学习课程清单
机器学习深度学习自然语言处理AI教育DAIR.AIGithub开源项目
发掘DAIR.AI整理的YouTube机器学习课程清单,覆盖从基础到高级的各类主题,如决策树、神经网络和深度学习。课程适合不同水平的学习者,帮助你提升机器学习技能。
transformers - 机器学习库,覆盖文本、视觉与音频处理
Hugging Face人工智能自然语言处理机器学习多模态Github开源项目
探索🤗 Transformers——一个功能全面的机器学习库,覆盖文本、视觉与音频处理。该库提供数千种可对接JAX、PyTorch或TensorFlow的预训练模型,适用于多种语言处理与多模态任务。主要功能包括: - 文本分类 - 信息提取 - 问答系统 - 摘要生成 - 翻译 - 文本生成 此外,还能处理表格问答、OCR及视觉问答等多模态任务。Transformers库易于使用,支持模型间的快速切换与无缝整合。
ML-Notebooks - 机器学习笔记本资源库,支持快速搭建和扩展
机器学习人工智能深度学习代码示例自然语言处理Github开源项目
ML-Notebooks为不同的机器学习任务和应用提供了一系列精简且易于扩展的笔记本。项目整合了Codespaces技术,用户仅需几步简单配置,便可启动一个配备完整依赖项的开发环境,非常适合教育和研究使用。从基础入门到深入探索如PyTorch、GNN及GANs等前沿技术,应有尽有。
AiLearning-Theory-Applying - 人工智能领域的全面学习资源
机器学习深度学习自然语言处理AiLearning-Theory-ApplyingTransformerGithub开源项目
AiLearning-Theory-Applying项目提供人工智能领域的全面学习资源,覆盖基础知识、机器学习、深度学习及自然语言处理。项目持续更新,附带详尽注释和数据集,便于理解与操作,助力初学者及研究人员迅速掌握AI理论及应用实践。
awesome-deep-learning-papers - 2012-2016年度最受引用的深度学习研究论文
深度学习神经网络卷积神经网络自然语言处理图像识别Github开源项目
'Awesome Deep Learning Papers' 提供的是一份经精心策划的文献列表,囊括了2012至2016年间在深度学习领域中引用率最高的研究论文。覆盖从图像处理到自然语言处理等众多研究领域,旨在为研究人员与技术爱好者提供启发思考与深入了解的必读材料。
Deep-Learning-Papers-Reading-Roadmap - 深度学习论文阅读路线图,覆盖从基础到前沿技术的多个阶段
深度学习卷积神经网络递归神经网络自然语言处理强化学习Github开源项目
该项目提供了一条有序的深度学习论文阅读路径,覆盖从基础到前沿技术的多个阶段。涵盖图像识别到语音识别等多个领域的关键论文,并提供直观的阅读指导和详细分类,以助力读者全面理解深度学习。适用于学术研究者和行业开发者。
Introduction-NLP - 《自然语言处理入门》详细解析
自然语言处理HanLP机器学习文本分类命名实体识别Github开源项目
本项目详细解析《自然语言处理入门》,涵盖中文分词、词性标注、命名实体识别等NLP核心技术,为初学者及爱好者提供清晰的学习路径和实用的笔记。
postgresml - GPU 驱动的 AI 应用程序数据库
PostgresML机器学习PostgreSQL自然语言处理模型Github开源项目
PostgresML是集成于PostgreSQL的全面ML/AI平台,优化模型数据管理流程,支持高级自然语言处理和多维文本分析,提供先进模型训练调整API,加速数据驱动的业务决策。
nlpaug - NLP数据增强的Python工具库
nlpaug数据增强自然语言处理音频处理机器学习Github开源项目
nlpaug为文本和音频提供数据增强解决方案,适用于多种机器学习和神经网络框架,如scikit-learn、PyTorch和TensorFlow,只需几行代码即可实现数据增强。
Awesome-Text2SQL - 针对大型语言模型、Text2SQL、Text2DSL、Text2API、Text2Vis 等的精选教程和资源
Text2SQLLarge Language Models数据库自然语言处理关系数据库Github开源项目
了解Awesome-Text2SQL项目如何提升文本到SQL转换的效率。平台整合了丰富的资源和教程,涵盖前沿研究、实战项目和多样数据库技巧,为专业人士或爱好者打造全方位的学习和应用环境。
ML-NLP - 深入解析机器学习与自然语言处理全面知识库
机器学习深度学习自然语言处理算法工程师NLP面试Github开源项目
ML-NLP项目提供机器学习与自然语言处理的全面资源,涉及关键理论和现实应用。各章节均配有实战代码,确保算法工程师高效备战面试。项目持续更新,跟上最新行业发展。
lectures - Oxford Deep NLP 2017 课程
自然语言处理神经网络递归神经网络语言模型DeepMindGithub开源项目
探索学习和实践递归神经网络在自然语言处理中的应用,包括语言模型、文本翻译、语音转录及问答系统等。
Awesome-pytorch-list - 覆盖NLP、计算机视觉和概率生成等多个领域的各类PyTorch资源的汇集平台
PyTorch机器学习深度学习神经网络自然语言处理Github开源项目
Awesome-Pytorch-list是一个包括各类PyTorch资源的汇集平台,覆盖NLP、计算机视觉和概率生成等多个领域。这个开源项目提供了丰富的教程、案例和工具库。其内容持续更新,致力于支持动态神经网络的GPU加速研究。研究人员和开发者可以利用这些最新资源,进行高效的机器学习和科研实验。
awesome-nlp - 一个综合NLP(自然语言处理)资源库,集成了包括研究摘要、教程、工具库在内的全方位资料
自然语言处理深度学习机器学习NLPPythonGithub开源项目
awesome-nlp是一个综合NLP(自然语言处理)资源库,集成了包括研究摘要、教程、工具库在内的全方位资料。与顶尖实验室合作,保持在NLP领域的前沿,提供机器翻译、情感分析等多样化应用。支持多语言处理,如中文、韩文、阿拉伯文等,为全球用户提供适用资源,是一个知名的NLP信息平台。
DeepLearning - 深度学习资源,涵盖教程、图书和实战项目
深度学习机器学习神经网络自然语言处理图像处理Github开源项目
探索全面的深度学习资源,涵盖教程、图书和实战项目,适合从新手到专家的每一个阶段。
BLOOM - 开发的多语言、大规模开放科学语言模型
AI开发模型训练AI工具BloomModeltransformers自然语言处理PyTorch模块模型配置热门
作为致力于通过开源和开放科学推进AI发展的平台,BLOOM提供包括BloomModel在内的多款AI模型,充实的文档与代码资源助力研究人员与开发者更好地探索与应用前沿AI技术。