Project Icon

conv-emotion

会话情感识别技术及最新数据集与模型更新

本页面介绍了会话情感识别技术,包括用于识别会话情感的多种基于PyTorch和TensorFlow的模型,如COSMIC、TL-ERC和DialogueGCN。还提供了最新的多模态多方对话数据集和相关基准数据集,并介绍了识别会话情感原因和对话生成的技术。这些技术通过建模对方状态和跨人际依赖关系来实现情感识别。最新更新包括M2H2数据集和相关基线模型,并链接至其他重要项目和研究。

Talk-to-Edit - 基于自然语言的AI人脸精细编辑技术
CelebA-DialogGithubStyleGAN2Talk-to-Edit人脸编辑对话系统开源项目
Talk-to-Edit是一个基于自然语言对话的人脸编辑系统,可精细调整刘海、眼镜、胡须、微笑和年龄等五种面部特征。该系统整合了语言理解和图像生成技术,支持128x128和1024x1024分辨率的图像处理。项目还发布了CelebA-Dialog数据集,为视觉-语言人脸任务研究提供资源。
metavoice-src - 1.2B参数开源TTS模型,支持情感语音合成和跨语言声音克隆
GithubMetaVoice-1BTTS开源开源项目情感语音语音克隆
MetaVoice-1B是一个开源的1.2B参数TTS模型,经过10万小时的语音训练,支持英语情感语音合成和零样本的美式和英式语音克隆(仅需30秒参考音频)。该模型还支持跨语言声音克隆和任意长度文本的语音合成。可通过云端或本地部署使用,并提供Hugging Face和Google Colab的演示。
voice-safety-classifier - 语音聊天毒性检测的高精度分类工具
GithubHuggingfacetoxicity detection多标签分类开源项目模型模型评估语音安全音频分类
该项目提供了一个新的语音聊天毒性检测基准模型,基于大规模数据集开发。模型使用WavLM base plus权重,经过2,374小时语音多标签微调,输出标签包括Profanity、DatingAndSexting、Racist、Bullying等。评估显示模型在二元分类任务中的精度达到94.48%。使用者可通过特定命令运行模型权重进行应用。
llm-datasets - LLM微调优质数据集与工具资源库
GithubLLM对话开源项目微调指令跟随数据集
LLM Datasets项目汇集了大语言模型微调所需的优质数据集、实用工具和核心概念。涵盖通用、数学逻辑、编程和对话等多个领域,项目详细阐述了高质量数据集的特征。为研究人员和开发者提供多样化的LLM微调数据资源,旨在促进模型性能提升。
chatglm2-6b - 性能升级的开源中英双语对话模型
ChatGLM2-6BGithubHuggingface人工智能对话模型开源开源项目模型自然语言处理
ChatGLM2-6B是ChatGLM-6B的升级版本,作为开源中英双语对话模型,它在性能、上下文长度和推理效率方面都有显著提升。经过1.4T标识符预训练,ChatGLM2-6B在多个数据集上表现优异,支持32K上下文长度,推理速度提高42%。此外,该模型采用更开放的协议,允许免费商业使用,为自然语言处理领域提供了强大的开源工具。
robertuito-emotion-analysis - RoBERTuito驱动的西班牙语情感分析模型
GithubHuggingfaceRoBERTuitoTwitter开源项目情感分析模型自然语言处理西班牙语
robertuito-emotion-analysis项目提供了一个基于RoBERTuito的西班牙语情感分析模型。该模型能够识别6种基本情绪和中性情绪,在情感分析、仇恨言论检测和讽刺识别等任务中表现出色。模型使用TASS 2020 Task 2语料库训练,为处理西班牙语社交媒体文本提供了有效工具。研究人员可以通过Hugging Face模型库轻松访问和使用这一资源。
CharacterGLM-6B - 新一代中文AI角色对话模型
CharacterGLM-6BGithub人工智能对话预训练模型开源项目自然语言处理角色扮演
CharacterGLM-6B是聆心智能与清华大学CoAI实验室联合开发的新一代对话模型。基于ChatGLM2系列,该模型通过独特的属性和行为设计,实现AI角色的一致性、拟人化和吸引力。在多项评估中,CharacterGLM-6B展现出优于主流大语言模型的性能,尤其在角色扮演和对话能力方面表现突出。这一开源项目为研究人员和开发者提供了创建个性化AI角色的有力工具,推动对话AI技术的进步。
entaoai - 企业数据互动体验优化,集成多模态与高级评估
Azure Cognitive SearchAzure OpenAI ServiceChatGPTGithubLLMPrompt Flow开源项目
此项目展示了多种创建类似ChatGPT体验的方法,支持企业自有数据。通过Azure OpenAI服务访问ChatGPT模型,并利用Pinecone、Redis等向量存储或Azure认知搜索实现数据索引与检索。用户可以上传数据进行端到端测试。功能更新包括高效聊天、实时流、问答和管理功能的重构,多模态模式和高级评估技术的初步版本,以及根据最佳实践配置认知搜索类型。丰富的功能和更新确保出色的性能与用户体验。
UltraChat - 大规模、多样化的多轮对话数据和模型
GithubUltraChatUltraFeedbackUltraLM开源项目数据集模型
UltraChat项目专注于构建开源、大规模、多轮对话数据,目标是打造具有广泛会话能力的强大语言模型。最新发布的模型和数据集包括UltraLM-13B-v2.0、UltraRM和UltraCM,在AlpacaEval基准测试上表现优异。UltraChat数据集分为三大部分:世界问题、写作与创作、现有材料辅助,对话涵盖了技术、艺术和创业等领域。项目数据仅供研究和教育用途,基于MIT许可证发布。
Emojinator - 基于机器学习的手势表情识别与分类
EmojinatorGithub开源项目手势识别机器学习电子信息表情符号
Emojinator项目通过机器学习技术提供不同手势表情的识别和分类解决方案。项目包含多个版本(如Emojinator 2.0和3.0),有详细的文件组织结构和创建手势及训练模型的代码。特别适合需处理电子消息和网页表情符号的应用场景,欢迎开发者们尝试使用。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

白日梦AI

白日梦AI提供专注于AI视频生成的多样化功能,包括文生视频、动态画面和形象生成等,帮助用户快速上手,创造专业级内容。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

讯飞绘镜

讯飞绘镜是一个支持从创意到完整视频创作的智能平台,用户可以快速生成视频素材并创作独特的音乐视频和故事。平台提供多样化的主题和精选作品,帮助用户探索创意灵感。

Project Cover

讯飞文书

讯飞文书依托讯飞星火大模型,为文书写作者提供从素材筹备到稿件撰写及审稿的全程支持。通过录音智记和以稿写稿等功能,满足事务性工作的高频需求,帮助撰稿人节省精力,提高效率,优化工作与生活。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号