Logo

#自然语言处理

Logo of CLIP
CLIP
CLIP通过对比学习训练神经网络,结合图像和文本,实现自然语言指令预测。其在ImageNet零样本测试中的表现与ResNet50相当,无需使用原始标注数据。安装便捷,支持多种API,适用于零样本预测和线性探针评估,推动计算机视觉领域发展。
Logo of Deep-Learning-Interview-Book
Deep-Learning-Interview-Book
该指南全面涵盖深度学习领域的求职面试知识,包括数学、机器学习、深度学习、强化学习、计算机视觉、图像处理、自然语言处理、SLAM、推荐算法、数据结构与算法、编程语言(C/C++/Python)、深度学习框架等,旨在帮助求职者高效准备面试。
Logo of spaCy
spaCy
spaCy 是一个高级自然语言处理库,支持Python和Cython,适用于实际产品开发。它提供预训练管道,支持70种以上语言的分词和训练,拥有最先进的速度和神经网络模型,可用于词性标注、句法解析、命名实体识别、文本分类等多种任务。spaCy 同时支持多任务学习和使用预训练变换器,如BERT,适合生产环境下的训练系统,模型打包,部署和工作流管理,是商业开源软件,遵循MIT许可证。
Logo of Awesome-LLM-Long-Context-Modeling
Awesome-LLM-Long-Context-Modeling
本仓库收集了关于高效变换器、长度外推、长期记忆、增强检索生成(RAG)及长文本建模评估的研究论文和博客,提供专业资源用于探索长上下文模型及其挑战,并讨论优化NLP模型的创新方法,适合深度语言模型和复杂文本建模研究人员及开发者。考虑到用户搜索意图的多样性,建议在SEO描述中提及项目对长文本建模从算法到实际应用的全面影响,以及其对未来研究方向的启示。
Logo of raptor
raptor
RAPTOR采用递归树结构,提升语言模型的信息检索效率和上下文理解能力,克服了传统模型的局限。本文介绍了RAPTOR的具体实施方法、安装步骤和使用指南,并展示了如何集成自定义模型来扩展其功能。
Logo of ML-YouTube-Courses
ML-YouTube-Courses
发掘DAIR.AI整理的YouTube机器学习课程清单,覆盖从基础到高级的各类主题,如决策树、神经网络和深度学习。课程适合不同水平的学习者,帮助你提升机器学习技能。
Logo of awesome-deep-learning-papers
awesome-deep-learning-papers
'Awesome Deep Learning Papers' 提供的是一份经精心策划的文献列表,囊括了2012至2016年间在深度学习领域中引用率最高的研究论文。覆盖从图像处理到自然语言处理等众多研究领域,旨在为研究人员与技术爱好者提供启发思考与深入了解的必读材料。
Logo of nlpaug
nlpaug
nlpaug为文本和音频提供数据增强解决方案,适用于多种机器学习和神经网络框架,如scikit-learn、PyTorch和TensorFlow,只需几行代码即可实现数据增强。
Logo of Awesome-pytorch-list
Awesome-pytorch-list
Awesome-Pytorch-list是一个包括各类PyTorch资源的汇集平台,覆盖NLP、计算机视觉和概率生成等多个领域。这个开源项目提供了丰富的教程、案例和工具库。其内容持续更新,致力于支持动态神经网络的GPU加速研究。研究人员和开发者可以利用这些最新资源,进行高效的机器学习和科研实验。
Logo of speech-recognition-uk
speech-recognition-uk
本项目集成了乌克兰语的自动语音识别和语音合成的最新进展与数据集。详细涵盖了多种语音模型如wav2vec2和Citrinet,同时提供模型评估和测试结果。加入我们的Discord或Telegram社区,共同推动乌克兰语语音技术的前沿发展。
Logo of Otto
Otto
Otto是一个面向初学者的智能聊天应用,旨在帮助用户通过自然语言描述轻松理解并实践机器学习。该应用通过智能推荐与样本数据集支持,使用户能够快速利用机器学习模型。支持的模型类型包括回归、分类和自然语言处理等,还提供源码生成和可视化工具,确保每个学习阶段的易理解性。
Logo of cognee
cognee
cognee是一个先进的开源框架,旨在通过图形、LLMs和向量检索功能,为AI工程师提供精确的输出结果。该工具支持自我改进,兼容多种本地配置和存储方案,从而助力AI项目的高效实施和灵活扩展。
Logo of storyteller
storyteller
StoryTeller集成了GPT-3、Stable Diffusion和神经TTS技术,实现从文本生成到图像绘制再到声音合成的生动故事创造过程。适用于快速内容创作、教育娱乐等多场景。支持命令行和Python接口,可自定义参数。
Logo of AutoGroq
AutoGroq
AutoGroq根据用户需求动态生成AI团队,优化工作流程和项目管理。无需手动配置,即可实现专家生成、自然对话、代码片段提取等功能,并支持多种LLM整合。该工具已被近8000名开发者采用。
Logo of smile
smile
Smile是一个高效且全面的机器学习系统,支持Java和Scala,包含自然语言处理、线性代数、图形、插值和可视化功能。其先进的数据结构和算法提供卓越性能,涵盖分类、回归、聚类、关联规则挖掘、特征选择、多维缩放、遗传算法、缺失值插补和高效近邻搜索等领域。用户可以通过Maven中央库使用,并在Smile网站找到编程指南和详细信息。
Logo of mars5-tts
mars5-tts
MARS5是由CAMB.AI开发的英文语音合成模型,采用两阶段AR-NAR管道设计,并具有创新的NAR组件。该模型能够在仅需5秒的音频和一小段文本的情况下,处理包括体育解说、动画等在内的多样化、复杂的语调场景。用户可以通过简单的设置,选择浅色克隆或深色克隆方法进行语音合成,优化输出以适应特定用途。支持通过Docker或API使用模型,适合没有硬件条件的用户。详见官方文档和GitHub页面。
Logo of spark-nlp
spark-nlp
Spark NLP 是一个基于 Apache Spark 的开源库,提供高效且准确的自然语言处理注释,支持机器学习管道的分布式扩展。该库包含超过 36000 个预训练管道和模型,支持 200 多种语言,涵盖分词、词性标注、嵌入、命名实体识别、文本分类、情感分析、机器翻译等任务。兼容 BERT、RoBERTa 等主流变压器模型,支持 Python、R、Java、Scala 和 Kotlin。
Logo of shell-ai
shell-ai
Shell-AI是一款命令行工具,通过自然语言理解生成Shell命令建议。支持跨平台使用,兼容Azure OpenAI部署。用户输入自然语言描述后,Shell-AI会提供符合需求的单行命令建议。支持多种配置方式,安装简单,适用于Linux、macOS和Windows系统。
Logo of transformers
transformers
探索🤗 Transformers——一个功能全面的机器学习库,覆盖文本、视觉与音频处理。该库提供数千种可对接JAX、PyTorch或TensorFlow的预训练模型,适用于多种语言处理与多模态任务。主要功能包括: - 文本分类 - 信息提取 - 问答系统 - 摘要生成 - 翻译 - 文本生成 此外,还能处理表格问答、OCR及视觉问答等多模态任务。Transformers库易于使用,支持模型间的快速切换与无缝整合。
Logo of Deep-Learning-Papers-Reading-Roadmap
Deep-Learning-Papers-Reading-Roadmap
该项目提供了一条有序的深度学习论文阅读路径,覆盖从基础到前沿技术的多个阶段。涵盖图像识别到语音识别等多个领域的关键论文,并提供直观的阅读指导和详细分类,以助力读者全面理解深度学习。适用于学术研究者和行业开发者。
Logo of Awesome-Text2SQL
Awesome-Text2SQL
了解Awesome-Text2SQL项目如何提升文本到SQL转换的效率。平台整合了丰富的资源和教程,涵盖前沿研究、实战项目和多样数据库技巧,为专业人士或爱好者打造全方位的学习和应用环境。
Logo of awesome-nlp
awesome-nlp
awesome-nlp是一个综合NLP(自然语言处理)资源库,集成了包括研究摘要、教程、工具库在内的全方位资料。与顶尖实验室合作,保持在NLP领域的前沿,提供机器翻译、情感分析等多样化应用。支持多语言处理,如中文、韩文、阿拉伯文等,为全球用户提供适用资源,是一个知名的NLP信息平台。
Logo of StyleTTS
StyleTTS
StyleTTS是一款高效的文本到语音合成工具,能够从参考语音中学习并再现其语调与情感,同时确保语音自然和说话者之间的高度相似度。
Logo of deep-learning-drizzle
deep-learning-drizzle
deep-learning-drizzle 集结了全球顶尖院校与研究机构的深度学习与AI在线课程。覆盖初级到高级课程,涉及自然语言处理、计算机视觉、机器学习等多个领域,提供视频教程及实战操作指南。适合各层次人士学习,助您深入AI领域。
Logo of LLM-eval-survey
LLM-eval-survey
作为一个独立资源,LLM-eval-survey汇集了关于大型语言模型(LLMs)的全面评估研究与资源。涵盖自然语言处理、逻辑推理、机器翻译等领域,旨在提升对这些先进模型的理解和应用。项目通过多维度的评估方法,助力研究人员和开发者深入探索LLMs的潜力与挑战,推动人工智能技术进步。还定期更新最新研究论文和实用资源,为学术和工业界提供重要信息与工具。
Logo of BLOOM
BLOOM
作为致力于通过开源和开放科学推进AI发展的平台,BLOOM提供包括BloomModel在内的多款AI模型,充实的文档与代码资源助力研究人员与开发者更好地探索与应用前沿AI技术。
Logo of pytorch-book
pytorch-book
这本书提供了《深度学习框架PyTorch:入门与实践(第2版)》的对应代码,基于PyTorch 1.8编写,内容涵盖基础使用、高级扩展和实战应用三大模块。读者可以学习从安装PyTorch、使用Tensor与自动微分系统、构建神经网络模块到进行数据加载与GPU加速等操作。此外,还讲解了向量化、分布式计算及CUDA扩展的高级技术,并通过图像分类、生成对抗网络、自然语言处理、风格迁移及目标检测等实战项目,深入理解并应用PyTorch进行深度学习开发。
Logo of courses
courses
本仓库汇集了各种人工智能课程和资源链接,适合不同学习阶段的用户。涵盖生成式AI、深度学习、自然语言处理等多个主题的免费课程,资源来自麻省理工学院、斯坦福大学、哈佛大学等知名机构。欢迎贡献和建议,共同打造优质的AI学习平台。
Logo of pandas-ai
pandas-ai
PandasAI是一个强大的Python平台,专为非技术用户设计,通过自然语言轻松查询数据。它不仅帮助技术用户节省时间,还通过Jupyter notebooks或借助FastAPI和Flask轻松部署为REST API。想要了解更多PandasAI Cloud或企业版服务,欢迎联系我们获取详细信息。
Logo of PyTorch-Tutorial-2nd
PyTorch-Tutorial-2nd
本书基于PyTorch,系统性涵盖深度学习的核心知识,包括计算机视觉、自然语言处理、大语言模型等实战案例,详解ONNX和TensorRT推理部署框架,为读者提供从基础到应用的完整指导,帮助快速掌握PyTorch并实现项目落地。适合AI自学者、产品经理及跨领域人士阅读。
Logo of mindnlp
mindnlp
MindNLP是一个基于MindSpore的开源自然语言处理库,支持语言模型、机器翻译、问答系统、情感分析、序列标注和摘要生成等多种任务。该项目集成了BERT、Roberta、GPT2和T5等多种预训练模型,通过类似Huggingface的API简化了使用流程。用户可通过pypi或源代码安装该库,并支持包括Llama、GLM和RWKV在内的大型语言模型的预训练、微调和推理,非常适合研究者和开发人员构建和训练模型。
Logo of ML-Notebooks
ML-Notebooks
ML-Notebooks为不同的机器学习任务和应用提供了一系列精简且易于扩展的笔记本。项目整合了Codespaces技术,用户仅需几步简单配置,便可启动一个配备完整依赖项的开发环境,非常适合教育和研究使用。从基础入门到深入探索如PyTorch、GNN及GANs等前沿技术,应有尽有。
Logo of Introduction-NLP
Introduction-NLP
本项目详细解析《自然语言处理入门》,涵盖中文分词、词性标注、命名实体识别等NLP核心技术,为初学者及爱好者提供清晰的学习路径和实用的笔记。
Logo of ML-NLP
ML-NLP
ML-NLP项目提供机器学习与自然语言处理的全面资源,涉及关键理论和现实应用。各章节均配有实战代码,确保算法工程师高效备战面试。项目持续更新,跟上最新行业发展。
Logo of DeepLearning
DeepLearning
探索全面的深度学习资源,涵盖教程、图书和实战项目,适合从新手到专家的每一个阶段。
Logo of vits_chinese
vits_chinese
vits_chinese项目引入了BERT和VITS技术,通过隐藏的韵律嵌入和自然语言特性,显著提高了文本到语音合成的音质和自然度。此项目不只适于高质量音频生成,也提供模块化蒸馏加速和在线演示,便利学习和开发人员的应用。
Logo of From-0-to-Research-Scientist-resources-guide
From-0-to-Research-Scientist-resources-guide
该资源指南适用于具备基础编程知识或计算机科学背景的人士,目的在于培养其成为专注于深度学习和自然语言处理领域的研究科学家。指南全面介绍自顶向下及自底向上的学习方法,并详细列出数学基础、机器学习、深度学习等核心领域的资源,帮助用户找到匹配的学习路线。
Logo of rust-bert
rust-bert
rust-bert是基于Rust语言开发的高效自然语言处理库,支持问答、命名实体识别、翻译和摘要生成等多种任务。此库支持多线程分词和GPU推断,具备丰富的API,便于开发者和研究人员快速部署使用多种预训练模型。
Logo of rags
rags
RAGs是一个基于Streamlit的应用程序,使用自然语言从数据源创建RAG管道。用户可以描述任务和参数,查看和修改生成的参数,并通过RAG代理查询数据。项目支持多种LLM和嵌入模型,默认使用OpenAI构建代理。该应用程序提供了一个标准的聊天界面,能够通过Top-K向量搜索或总结功能满足查询需求。了解更多关于安装和配置的信息,请访问GitHub页面或加入Discord社区。
Logo of nlp
nlp
介绍自然语言处理(NLP)的基础知识和实际应用,包括常用数据集、机器学习模型评价方法、词袋模型、TFIDF、Word2Vec、Doc2Vec等技术,以及多层感知机、fasttext和LDA在文档分类和主题建模中的应用。还展示了对美食评语的情感分析,说明了NLP在文本理解与安全领域的重要性。此外,还介绍了一本开源NLP入门书籍的写作和更新过程,适合想深入了解NLP技术的读者。
Logo of iAsk
iAsk
iAsk.Ai——顶尖免费AI搜索引擎,结合先进的NLP及Transformer技术,提供即时、准确且客观的答案。在行业标准测试中,性能优于人类专家,是您信赖的信息检索助手。
Logo of axflow
axflow
Axflow是一款模块化的TypeScript框架,用于开发强大的自然语言处理应用。其模块化设计支持逐步采用,形成完整的AI开发解决方案。主要模块包括无依赖SDK、数据连接框架和LLM质量评估工具。此外,Axflow还在开发高效数据处理、模型服务和微调库。Axflow旨在简化LLM操作,为开发者提供灵活和高效的TypeScript AI开发体验。
Logo of HealthGPT
HealthGPT
HealthGPT是斯坦福生物设计团队的开源iOS应用,基于Stanford Spezi平台开发。此应用使用户能够通过自然语言与Apple Health的健康数据交互,支持语音输入和文字输入。HealthGPT不仅支持本地数据查询以保护用户隐私,还整合了GPT-3.5和GPT-4模型,能查询多种健康指标如睡眠、步行和活跃能量等。
Logo of AiLearning-Theory-Applying
AiLearning-Theory-Applying
AiLearning-Theory-Applying项目提供人工智能领域的全面学习资源,覆盖基础知识、机器学习、深度学习及自然语言处理。项目持续更新,附带详尽注释和数据集,便于理解与操作,助力初学者及研究人员迅速掌握AI理论及应用实践。
Logo of postgresml
postgresml
PostgresML是集成于PostgreSQL的全面ML/AI平台,优化模型数据管理流程,支持高级自然语言处理和多维文本分析,提供先进模型训练调整API,加速数据驱动的业务决策。
Logo of lectures
lectures
探索学习和实践递归神经网络在自然语言处理中的应用,包括语言模型、文本翻译、语音转录及问答系统等。
Logo of LLaMA-Pro
LLaMA-Pro
LLaMA-Pro项目通过模块扩展实现渐进式改进,显著提升算法性能。开源代码和模型包括LLaMA-Pro-8B和Mistral-Pro-8B-v0.1,后者在多个基准测试中表现优异,尤其在代码与数学能力方面超越主流型号。项目还提供了本地执行方法和训练代码。在ACL 2024大会上,项目论文已被接收,展示出其学术和实用价值。同时,LLaMA-Pro项目提供评估工具和预训练样例,支持开发者高效开发。
Logo of awesome-audio-plaza
awesome-audio-plaza
Awesome Audio Plaza汇聚全球音频领域的最新研究成果和创新项目。涵盖自然语音合成、音乐创作、自动语音识别至声音转换等多个子领域,为研究人员、学者及爱好者提供了一个内容丰富的信息平台。该平台通过整合arxiv、Hugging Face日报、Twitter、GitHub等多种资源,确保用户能够访问到前沿科研和技术动态。
Logo of vits2
vits2
VITS2项目融合了对抗学习与结构设计,在单阶段文本转语音技术上实现了显著的质量与效率提升。此模型通过结构和训练机制的优化,增强了语音的自然感和多讲者语音特征的匹配度,并提高了训练及推理速度。VITS2的创新技术显著降低了对音素转换的依赖,支持了完整的端到端处理。
Logo of huozi
huozi
活字3.0是一个支持32K上下文的稀疏混合专家模型,具备中英文知识、数学推理和代码生成能力,并在指令遵循和安全性上有所提升。项目开源了中文MT-Bench数据集,支持多种推理框架如Transformers、vLLM和llama.cpp,为自然语言处理研究和应用提供更多选择。