#自然语言处理
speech-recognition-uk - 乌克兰语自动语音识别和语音合成
语音识别语音合成自动化语音转文本Ukrainian自然语言处理Github开源项目
本项目集成了乌克兰语的自动语音识别和语音合成的最新进展与数据集。详细涵盖了多种语音模型如wav2vec2和Citrinet,同时提供模型评估和测试结果。加入我们的Discord或Telegram社区,共同推动乌克兰语语音技术的前沿发展。
StyleTTS - 多样化的文本到语音合成
StyleTTS文本到语音自然语言处理情感语调语音合成Github开源项目
StyleTTS是一款高效的文本到语音合成工具,能够从参考语音中学习并再现其语调与情感,同时确保语音自然和说话者之间的高度相似度。
vits_chinese - 基于BERT和VITS技术的文本到语音合成系统
TTSBERTVITS文本到语音自然语言处理Github开源项目
vits_chinese项目引入了BERT和VITS技术,通过隐藏的韵律嵌入和自然语言特性,显著提高了文本到语音合成的音质和自然度。此项目不只适于高质量音频生成,也提供模块化蒸馏加速和在线演示,便利学习和开发人员的应用。
awesome-audio-plaza - 全球音频领域的最新研究成果和创新项目
音频项目自然语言处理语音合成音乐生成语音识别Github开源项目
Awesome Audio Plaza汇聚全球音频领域的最新研究成果和创新项目。涵盖自然语音合成、音乐创作、自动语音识别至声音转换等多个子领域,为研究人员、学者及爱好者提供了一个内容丰富的信息平台。该平台通过整合arxiv、Hugging Face日报、Twitter、GitHub等多种资源,确保用户能够访问到前沿科研和技术动态。
Otto - 智能机器学习助手
Otto机器学习自然语言处理Facebook AI ChallengeWit.aiGithub开源项目
Otto是一个面向初学者的智能聊天应用,旨在帮助用户通过自然语言描述轻松理解并实践机器学习。该应用通过智能推荐与样本数据集支持,使用户能够快速利用机器学习模型。支持的模型类型包括回归、分类和自然语言处理等,还提供源码生成和可视化工具,确保每个学习阶段的易理解性。
deep-learning-drizzle - 深度学习与AI在线课程
深度学习机器学习神经网络自然语言处理计算机视觉Github开源项目
deep-learning-drizzle 集结了全球顶尖院校与研究机构的深度学习与AI在线课程。覆盖初级到高级课程,涉及自然语言处理、计算机视觉、机器学习等多个领域,提供视频教程及实战操作指南。适合各层次人士学习,助您深入AI领域。
From-0-to-Research-Scientist-resources-guide - 适用于具备基础编程知识或计算机科学背景的人士的深入学习指南
深度学习机器学习自然语言处理优化理论数学基础Github开源项目
该资源指南适用于具备基础编程知识或计算机科学背景的人士,目的在于培养其成为专注于深度学习和自然语言处理领域的研究科学家。指南全面介绍自顶向下及自底向上的学习方法,并详细列出数学基础、机器学习、深度学习等核心领域的资源,帮助用户找到匹配的学习路线。
vits2 - 单阶段文本转语音系统的效率与质量提升
VITS2文本到语音单阶段模型自然语言处理SK TelecomGithub开源项目
VITS2项目融合了对抗学习与结构设计,在单阶段文本转语音技术上实现了显著的质量与效率提升。此模型通过结构和训练机制的优化,增强了语音的自然感和多讲者语音特征的匹配度,并提高了训练及推理速度。VITS2的创新技术显著降低了对音素转换的依赖,支持了完整的端到端处理。
cognee - 旨在通过图形、LLMs和向量检索功能,为AI工程师提供精确的输出结果的开源框架
cogneeLLMs自然语言处理向量检索图数据库Github开源项目
cognee是一个先进的开源框架,旨在通过图形、LLMs和向量检索功能,为AI工程师提供精确的输出结果。该工具支持自我改进,兼容多种本地配置和存储方案,从而助力AI项目的高效实施和灵活扩展。
LLM-eval-survey - 汇集了涵盖自然语言处理、逻辑推理、机器翻译等领域关于大型语言模型(LLMs)的全面评估研究与资源
大型语言模型自然语言处理评估ChatGPT论文Github开源项目
作为一个独立资源,LLM-eval-survey汇集了关于大型语言模型(LLMs)的全面评估研究与资源。涵盖自然语言处理、逻辑推理、机器翻译等领域,旨在提升对这些先进模型的理解和应用。项目通过多维度的评估方法,助力研究人员和开发者深入探索LLMs的潜力与挑战,推动人工智能技术进步。还定期更新最新研究论文和实用资源,为学术和工业界提供重要信息与工具。
rust-bert - 基于Rust语言开发的高效自然语言处理库
rust-bert自然语言处理机器翻译情感分析问答系统Github开源项目
rust-bert是基于Rust语言开发的高效自然语言处理库,支持问答、命名实体识别、翻译和摘要生成等多种任务。此库支持多线程分词和GPU推断,具备丰富的API,便于开发者和研究人员快速部署使用多种预训练模型。
huozi - 支持32K上下文的双语稀疏混合专家模型
活字通用大模型活字3.0HIT-SCIR自然语言处理中文MT-BenchGithub开源项目
活字3.0是一个支持32K上下文的稀疏混合专家模型,具备中英文知识、数学推理和代码生成能力,并在指令遵循和安全性上有所提升。项目开源了中文MT-Bench数据集,支持多种推理框架如Transformers、vLLM和llama.cpp,为自然语言处理研究和应用提供更多选择。
storyteller - 多模态AI故事生成器
StoryTeller人工智能多模态故事生成自然语言处理Github开源项目
StoryTeller集成了GPT-3、Stable Diffusion和神经TTS技术,实现从文本生成到图像绘制再到声音合成的生动故事创造过程。适用于快速内容创作、教育娱乐等多场景。支持命令行和Python接口,可自定义参数。
openrl - 综合性强化学习平台,支持多任务训练
OpenRL强化学习PyTorch多智能体自然语言处理Github开源项目
OpenRL 是一款基于 PyTorch 的开源强化学习研究框架,支持单代理、多代理、离线强化学习、自我对弈及自然语言处理任务。框架提供统一接口、训练加速方法和多种深度学习模型支持,兼容 Gymnasium、MuJoCo、StarCraft II 等多种环境。同时,OpenRL 还支持用户自定义训练模型、奖励模型和环境配置,并提供中英文文档。
NLP-Tutorials - 从搜索引擎到预训练模型的全面教程
NLP自然语言处理机器学习深度学习神经网络Github开源项目
NLP教程全面介绍多种自然语言处理模型,涉及搜索引擎技术、词汇及句子理解,并深入探讨seq2seq、Transformer、BERT和GPT等先进模型,包括实用的代码示例和理论分析。
viz-gpt - 使用聊天界面从表格数据集进行上下文数据可视化的工具
VizGPT数据可视化自然语言处理交互式聊天界面图表生成Github开源项目
VizGPT结合人工智能与自然语言处理,可生成图表并让用户通过聊天界面编辑,使数据可视化更灵活和互动。与当前市场上的其他视觉产品如Tableau相比,VizGPT的聊天界面交互提供了无需先行专业知识即可构建和调整可视化的便利。
FlowTest - 简化API测试流程的无代码工具
FlowTestAIAPI测试自然语言处理低代码跨平台兼容性Github开源项目
FlowTestAI是一款无代码/低代码工具,旨在简化端到端API测试的创建和执行。它支持自然语言处理和拖放界面,帮助开发人员和QA团队提升协作效率并深入了解API性能。它兼容多个平台,支持OpenAPI规范和主流LLM,具备版本控制和CI/CD功能。
DelphiOpenAI - Delphi开源库实现OpenAI API,兼容多平台
Delphi OpenAI APIOpenAI自然语言处理人工智能APIGithub开源项目
DelphiOpenAI项目实现了OpenAI公开API的Delphi版本,支持最新的ChatGPT和DALL-E等功能。兼容所有主要平台,提供文本生成、图片处理和自定义模型等API调用功能。该项目适用于Delphi 10.3及以上IDE版本,安装便捷,无需第三方库,适合多种应用场景。
OpenGPT - 开发者友好的自然语言处理API集成
OpenGPTAPI自然语言处理人工智能模型开发者Github开源项目
OpenGPT 3.5/4 提供开发者友好的API,使自然语言处理功能易于集成。简单且不复杂的使用步骤,让开发者能快速应用GPT技术,增强其应用程序的功能。该项目让每个人都能免费获取人工智能模型,并为开发者提供便捷的接口和示例代码。欢迎贡献,推进AI技术的边界。
mql - 自然语言转SQL工具,兼容PostgreSQL
MQLSQL查询PostgreSQLDocker自然语言处理Github开源项目
MQL 是一款将自然语言查询转换为SQL查询的工具,无需编程基础即可使用。只需连接或上传数据库模式即可进行自然语言查询并获取SQL。MQL支持本地Docker和传统安装。目前仅兼容PostgreSQL,未来将支持MySQL。特色包括高准确性、简便的安装步骤和默认用户登录功能。
PetThoughts - 智能识别宠物表情与环境,推测宠物情绪
I Know What Your Pet Is Thinking面部表情分析环境分析自然语言处理用户界面Github开源项目
该应用利用Gemini Pro API的图像识别技术,智能分析宠物面部表情和环境,推测其情绪状态和活动。只需上传宠物照片,即可获得详细的文本描述。适用于猫和狗等常见宠物,提供易于操作的用户界面,帮助用户更好了解宠物或分享有趣故事,带来愉悦体验。
unprompted - Stable Diffusion WebUI插件
UnpromptedStable Diffusionshortcodes模板语言自然语言处理Github开源项目
Unprompted是适用于Stable Diffusion WebUI的免费插件,提供强大且易读的模板语言和多功能工具。内置70多种默认shortcodes,并支持自定义shortcodes,用户无需编程即可便捷使用。特别功能如txt2mask和Bodysnatcher,以及能够组织模板文件夹。还拥有自动复数、同义词和动词变位等自然语言处理能力,配备详尽文档和丰富示例。Unprompted具有多种安装方式,满足各类用户需求。
AutoAudit - AutoAudit-开源网络安全人工智能模型
AutoAudit网络安全大模型自然语言处理ClamAVGithub开源项目
AutoAudit项目开源专用于网络安全的大语言模型,致力于通过自然语言处理技术支持安全审计和防御。该模型能进行恶意代码分析、网络攻击检测和安全漏洞预测,并与ClamAV集成。当前版本基于Alpaca-Lora训练,未来将增强逻辑推理能力和数据集准确性,并加入更多安全扫描工具。
text2text - 跨语言文本处理的综合工具包
Text2Text跨语言模型自然语言处理文本生成语言翻译Github开源项目
提供跨语言文本生成、翻译、嵌入和问答等功能的NLP工具包,支持百种语言。可在Google Colab平台免费运行,适用学术研究、企业应用和个性化开发。通过示例和快速入门指南,用户能快速掌握强大的多语言模型,高效处理文本。
LLM-Zoo - 最新自然语言处理模型信息汇总,开源与闭源模型实时更新
LLM自然语言处理ChatGPT开源模型Github开源项目
展示多种开源与闭源LLM模型的详细信息,包括发布时间、模型大小、支持语言、适用领域及训练数据。提供GitHub、HuggingFace、演示及研究论文链接,信息定期更新以反映最新进展。欢迎贡献者参与添加新模型或更新现有模型信息。
Chat-With-Excel - 直接自然语言与表格数据互动,简化数据分析流程
Chat-With-Excel数据分析机器学习自然语言处理Google ColabGithub开源项目
Chat-With-Excel项目允许用户使用自然语言与表格数据交互,无需记忆公式或学习Pandas。用户可以通过Google Colab轻松运行数据分析任务,并与机器学习模型进行自然语言训练。即将上线Replit和Streamlit版本。更多更新请关注Anil Chandra Naidu Matcha的Twitter或YouTube频道。项目相关的其他示例和代码包括Chat with Website、Chat with PDF、Chat with Youtube及DiscordGPT。
jtokkit - 专为OpenAI模型设计的Java分词库,提供便捷的API,支持多种编码和解码算法
JTokkitJavaOpenAItokenizer自然语言处理Github开源项目
JTokkit是一个专为OpenAI模型设计的Java分词库,提供便捷的API,支持多种编码和解码算法如r50k_base和cl100k_base。该库无依赖,兼容Java 8及以上版本,并具备高效性能。用户可以通过Maven或Gradle轻松安装,并支持自定义编码算法。使用JTokkit,开发者能够轻松进行自然语言处理任务中的文本分词和令牌计算。
azure-openai-samples - Azure OpenAI的GPT基础知识、实际案例及解决方案
GPTAI绘图自然语言处理AzureOpenAIGithub开源项目
本项目提供了使用Azure OpenAI提供的GPT的基础资源,包括快速上手指南、实际使用案例以及端到端的解决方案。通过这些资源,用户可以了解GPT在聊天机器人、客户服务、内容生成、问答系统、文本摘要和情感分析等应用中的实际使用情况,并通过贡献和更新保持与技术发展的同步。项目基于GPT 3.5,并将在GPT-4可用时更新。
OpenAIWorkshop - Azure OpenAI服务使用指南
Azure OpenAIREST APIGPT-3content generation自然语言处理Github开源项目
Azure OpenAI服务通过REST API提供对OpenAI语言模型如GPT-3、Codex和Embeddings的访问。这些模型适用于内容生成、摘要、语义搜索及代码翻译等任务。在本工作坊,参与者将学习使用最新AI技术创建AI解决方案,涵盖OpenAI基础知识、提示工程及AOAI应用构建。适合数据库科学家、软件工程师等,所有示例和教程均在GitHub提供。
attention-viz - 帮助理解Transformer模型在语言和视觉任务中的自注意力机制
attention-vizTransformer深度学习可视化自然语言处理Github开源项目
此项目通过可视化技术帮助研究人员理解Transformer模型在语言和视觉任务中的自注意力机制,展示查询与关键向量的关系和整体模式。AttentionViz提供了交互式工具,支持多输入序列分析,提升了模型理解,并在多个应用场景中展现其实用性。
awesome-huggingface - 综合NLP开源项目与Hugging Face集成工具
Hugging Facetransformers自然语言处理机器学习NLP工具包Github开源项目
该项目列出了多个优秀的开源项目和应用,均与Hugging Face库集成,为各类NLP任务提供有效的解决方案。内容涵盖官方库教程、NLP工具包、文本表示、推理引擎、模型扩展、模型压缩、对抗攻击、风格转换、情感分析、语法纠正、翻译、知识与实体、语音处理、多模态学习、强化学习、问答系统、推荐系统、评估工具、神经搜索、云支持和硬件支持等多个领域。此项目能够帮助用户找到并使用适合的工具和库,提升自然语言处理任务的效率和效果。
keras-nlp - 兼容多框架的自然语言处理工具和预训练模型
KerasNLPTensorFlowJAXPyTorch自然语言处理Github开源项目
KerasNLP 是一个兼容 TensorFlow、JAX 和 PyTorch 的自然语言处理库,提供预训练模型和低级模块。基于 Keras 3,支持 GPU 和 TPU 的微调,并可跨框架训练和序列化。设置 KERAS_BACKEND 环境变量即可切换框架,安装方便,立即体验强大 NLP 功能。
texthero - 全面的文本数据处理和可视化工具
Texthero文本预处理自然语言处理文本表示文本可视化Github开源项目
Texthero是一个专为现代程序员设计的Python工具包,致力于快速高效地处理和可视化文本数据。其功能包括文本预处理、自然语言处理、文本表示、向量空间分析和文本可视化。Texthero与Pandas具有相同的表达能力,并提供全面的文档支持,对语言学知识要求较低。该项目免费开源,鼓励社区贡献,共同提升多语言支持。
bpemb - 基于BPE技术的多语言预训练子词嵌入,用于自然语言处理
BPEmb子词嵌入自然语言处理Byte-Pair Encoding神经网络Github开源项目
BPEmb使用Byte-Pair Encoding (BPE)技术,为275种语言提供训练好的子词嵌入,训练数据来自Wikipedia。该项目为神经网络在自然语言处理任务中提供输入。用户可以通过pip安装BPEmb,并自动下载所需的嵌入和SentencePiece模型。BPEmb支持子词分段和预训练子词嵌入,适用于多种语言处理任务,具有多种词汇表大小选择,以满足不同应用需求。
MiNLP - 迈向智能文本解析的先进中文自然语言处理平台
MiNLP自然语言处理中文分词开源结构化解析Github开源项目
小米自然语言处理平台(MiNLP)涵盖词法、句法和语义分析模块,已在公司业务中广泛应用。MiNLP-Tokenizer中文分词工具自2020年11月开源以来不断优化。2021年计划开源词性标注和命名实体识别工具,并逐步开源句法和语义分析工具,致力于打造功能领先的NLP平台。duckling-fork-chinese专注于中文结构化解析,广泛应用于小爱生产环境,尤其在数字和时间解析方面表现出色。
BLOOM - 开发的多语言、大规模开放科学语言模型
AI开发模型训练AI工具BloomModeltransformers自然语言处理PyTorch模块模型配置热门
作为致力于通过开源和开放科学推进AI发展的平台,BLOOM提供包括BloomModel在内的多款AI模型,充实的文档与代码资源助力研究人员与开发者更好地探索与应用前沿AI技术。
相关文章
兜哥出品:一本开源的NLP入门书籍
2024年08月30日
AutoGroq:革新AI交互的突破性工具
2024年08月30日
rust-bert:Rust语言的先进自然语言处理库
2024年08月30日
自然语言处理(NLP)技术全面解析:从基础到应用
2024年08月30日
AutoGroq:革新AI助手交互的突破性工具
2024年08月30日
深入浅出PyTorch:从入门到实战的完整指南
2024年08月30日
深度学习面试宝典:助你成功应对AI领域面试挑战
2024年08月30日
Coursera:在线学习的革命性平台
2024年08月30日
MemGPT:9.2k星星!创建具有长期记忆和自定义工具的大模型Agent,完全开源!
2024年08月03日