Project Icon

conv-emotion

会话情感识别技术及最新数据集与模型更新

本页面介绍了会话情感识别技术,包括用于识别会话情感的多种基于PyTorch和TensorFlow的模型,如COSMIC、TL-ERC和DialogueGCN。还提供了最新的多模态多方对话数据集和相关基准数据集,并介绍了识别会话情感原因和对话生成的技术。这些技术通过建模对方状态和跨人际依赖关系来实现情感识别。最新更新包括M2H2数据集和相关基线模型,并链接至其他重要项目和研究。

ConvoKit - 对话特征提取及社会现象分析的全面工具包
ConvoKitGithub对话特征提取工具包开源项目数据集社会现象分析
此工具包通过统一接口提取对话特征并分析社会现象,兼容scikit-learn,内含多种大型对话数据集和示例脚本。支持语言协调、礼貌策略、对话上下文框架及超图表示等功能,适用于对话结构研究及结果预测。
wav2vec2-base-superb-er - 基于Wav2Vec2的语音情感识别模型实现高精度声学特征提取
GithubHuggingfaceIEMOCAPSUPERBWav2Vec2开源项目情感识别模型语音识别
wav2vec2-base-superb-er是一个针对SUPERB情感识别任务优化的语音情感识别模型。该模型可从16kHz采样的语音中提取声学特征,识别说话者的情感状态。经IEMOCAP数据集训练后,模型能识别4种主要情感类别,测试集识别准确率为62.58%。模型提供pipeline接口和直接调用方式,便于快速部署语音情感分析应用。
pytorch-sentiment-analysis - 使用PyTorch进行电影评论情感分析的教程
GithubPyTorchPython 3.9开源项目情感分析教程神经网络
该开源项目提供了一系列教程,使用PyTorch实现序列分类模型,主要用于从电影评论中预测情感。课程内容包括神经词包模型、递归神经网络(RNN)、卷积神经网络(CNN)和Transformer模型的理论与实践。此外,还讲解了如何使用torchtext库简化数据加载和预处理。如果有任何疑问或反馈,可以随时通过提交问题进行交流。
fer - 面部表情识别与情绪检测的开源解决方案
FERGithubOpenCVPythonTensorflow开源项目情感识别
FER是一个功能强大的开源面部表情识别工具,支持Python 3.6及以上版本,依赖OpenCV和TensorFlow进行表情检测。该工具能识别视频中的面部表情,输出JSON格式数据,支持MTCNN和Haar Cascade分类器,使情绪检测更为精准。通过简单的编程接口,可以快速在本地或通过TF Serving云端运行表情识别,适用于多种应用场景。
vit-face-expression - Vision Transformer驱动的七类面部表情识别模型
FER2013GithubHuggingfaceVision Transformer人脸表情识别开源项目情感分析数据预处理模型
vit-face-expression模型采用Vision Transformer架构,通过FER2013数据集微调,实现了七种基本面部表情的识别。该模型可分析愤怒、厌恶、恐惧、快乐、悲伤、惊讶和中性表情,在测试集上达到71.16%的准确率。这一开源项目为面部情绪分析领域提供了新的解决方案。
Expressive-FastSpeech2 - 非自回归表情文本到语音合成技术
Expressive-FastSpeech2Github多语言支持对话TTS开源项目情感TTS非自回归TTS
Expressive-FastSpeech2是一个非自回归表情文本到语音(TTS)的研究项目,专注于emotional和conversational TTS。该项目使用AIHub多模态视频AI数据和IEMOCAP数据库进行韩语和英语的处理,并提供了不同语言适应和数据处理的指导。
SECap - 语音情感转文字描述的开源AI系统
GithubSECap大语言模型开源项目情感分析语音情感描述音频处理
SECap是一个开源的语音情感描述生成系统,结合大语言模型技术将语音情感转化为文字描述。项目包含模型代码、训练测试脚本和600个音频样本的测试集。系统能捕捉语音情感特征并生成相应描述,为语音情感分析研究提供新的工具和思路。
EmotiVoice - 开源多声音、情感合成的文本转语音引擎
EmotiVoiceGithub多声音开源开源项目情感合成文本到语音热门
EmotiVoice是一款功能强大的开源文本转语音(TTS)引擎,支持中英文,并配备超过2000种声音选项。其最显著的特点是情感合成功能,用户可以创建表达各种情绪的语音,如快乐、激动、悲伤和愤怒等。EmotiVoice提供易于使用的Web界面和脚本接口,适用于批量生成结果,同时还支持语音速度调整,提供Mac应用程序和HTTP API,增设免费调用次数。
chat-dataset-baseline - 中文对话模型训练资源整合平台
AI训练GithubLLaMA-Factory中文对话模型开源项目数据集模型优化
chat-dataset-baseline项目整合Hugging Face平台优质数据集,为中文对话模型训练提供全面资源。采用PDCA循环迭代,涵盖数据选择、模型训练、测试和优化。项目提供详细指南,适合数据科学家和AI爱好者快速上手,用于训练高质量中文基础模型,为特定行业应用打下基础。
seamless_communication - AI多语言实时表情语音翻译系统
AI模型GithubSeamless多语言翻译实时翻译开源项目语音翻译
Seamless Communication项目开发了一系列AI模型,包括SeamlessM4T、SeamlessExpressive和SeamlessStreaming,支持近100种语言的多模态、实时和富有表现力的翻译。该项目通过开源工具和数据集,为研究人员和开发者提供了强大的序列建模组件,推动了更自然、真实的跨语言交流技术发展。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

白日梦AI

白日梦AI提供专注于AI视频生成的多样化功能,包括文生视频、动态画面和形象生成等,帮助用户快速上手,创造专业级内容。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

讯飞绘镜

讯飞绘镜是一个支持从创意到完整视频创作的智能平台,用户可以快速生成视频素材并创作独特的音乐视频和故事。平台提供多样化的主题和精选作品,帮助用户探索创意灵感。

Project Cover

讯飞文书

讯飞文书依托讯飞星火大模型,为文书写作者提供从素材筹备到稿件撰写及审稿的全程支持。通过录音智记和以稿写稿等功能,满足事务性工作的高频需求,帮助撰稿人节省精力,提高效率,优化工作与生活。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号