#对话生成
groundingLMM
GLaMM是一种新型多模态AI模型,将自然语言生成与对象分割技术相结合。该模型提出了接地对话生成任务,并基于GranD数据集进行训练。GLaMM能够处理图像和区域级输入,支持视觉对话和指代表达分割等功能,为视觉语言交互提供了新的解决方案。
Knover
Knover是一个基于PaddlePaddle的知识增强对话生成工具包,专为高效训练和推理大规模对话模型而设计。它支持Q-TOD、PLATO-KAG和PLATO-XL等多个先进项目,覆盖任务型、知识型和开放域对话领域。Knover运行于Python 3.7+和PaddlePaddle-GPU 2.4.0+环境,为研究人员和开发者提供了完整的安装指南和使用文档。
BotChat
BotChat基准测试通过分析大语言模型生成的对话评估多轮聊天能力。基于MuTual-Test数据集,该项目生成了大规模模型对话数据,并采用单轮评估、BotChat Arena和人类对话对比等方法全面评估主流LLM对话质量。研究发现GPT-4表现最佳,部分小型开源模型在短对话中也有不错表现。这一创新基准为改进LLM对话能力提供了新思路。
Deepshot
Deepshot是一款创新的AI对话生成和替换软件,提供强大的视频编辑工具。它能生成完美同步的音频和视频,适用于多种场景。用户通过直观的配置文件可快速生成内容,实现创意视觉。该软件支持多语言翻译、内容创作、错误修正和A/B测试,有助于突破语言障碍,提高内容创作效率。Deepshot为用户提供了专业视频制作的全新解决方案,简化了创作流程。
HeartByte
HeartByte是一个AI辅助写作平台,专为小说创作者设计。平台利用AI技术帮助作者克服写作瓶颈,加快创作速度。作者提供情节概要后,AI可生成描述、对话和细节,为故事增添生命力。'修改'和'头脑风暴'等功能有助于完善故事结构,突破创意瓶颈。HeartByte致力于提高写作效率,同时增强叙事深度和质量,让创作者更容易完成吸引读者的作品。
multiwoz
MultiWOZ是一个包含10,000多个人类对话的全标注多领域任务型对话数据集。它涵盖多个领域和主题,规模超过以往任务型语料库。该数据集为对话状态追踪、响应生成等任务提供基准测试,并通过版本更新持续提高数据质量。MultiWOZ为对话系统研究提供了重要资源,促进了该领域的发展。
codegemma-7b-it
CodeGemma项目集合了7B和2B参数的开源代码模型,专注代码补全、生成及对话功能,尤其突出自然语言转代码的能力。codegemma-7b-it变体特别在指令生成方面展示了优异表现。借助FIM技术和依赖关系图打包技术,模型增强了与真实应用的契合度。此外,该项目注重伦理与安全,符合Google政策标准,适用于代码生成、学习和技术交流,兼容多种编程语言。
GODEL-v1_1-large-seq2seq
GODEL是为目标导向对话设计的预训练模型,使用基于Transformer的编码器-解码器架构,能从外部文本中生成响应。该模型在需要外部信息支持的对话任务中表现出色。v1.1版本在551M条Reddit多轮对话及5M条指令和知识对话上训练,能通过少量特定对话高效微调,适合需要情感共鸣或基于知识生成安全响应的情境。
CDial-GPT
CDial-GPT 借助丰富的中文对话数据集和创新的机器学习技术为语言模型预训练提供解决方案。平台提供多样化的预训练模型,便于微调和实际应用,同时支持通过 HuggingFace 访问,适用于多场景如客服自动化和聊天机器人,推进中文自然语言处理的发展。