#ICLR
ReAct
介绍ReAct项目,通过比较GPT-3和PaLM在不同任务中的表现,探讨语言模型中的推理与行动协同方法。内容涵盖API设置、实验运行及结果分析,适用于HotpotQA、FEVER、AlfWorld和WebShop等任务。
ToG
ToG项目提出了一种结合知识图谱的大语言模型推理框架,旨在实现更深入、更负责任的推理能力。该框架在复杂问答和知识推理任务中展现了良好性能,有助于提升AI系统的可解释性和准确性。项目开源代码支持Freebase和Wikidata知识图谱,为相关研究提供了实验平台。
TimeMixer
TimeMixer是一种基于MLP架构的时间序列预测模型,通过多尺度混合技术实现长短期预测的性能突破。该模型利用Past-Decomposable-Mixing和Future-Multipredictor-Mixing模块处理多尺度时间序列,在多个基准数据集上展现出优异性能。TimeMixer不仅预测精度高,还具备良好的运行效率,适用于多种要求高效预测的应用场景。
LanguageBind_Image
LanguageBind是一种创新的多模态预训练方法,通过语言将视频、音频、深度图像等不同模态绑定。该项目提出了包含1000万条多模态数据的VIDAL-10M数据集,并在多个模态任务上实现了领先性能。LanguageBind无需中间模态即可扩展到检测等任务,开源了全部模态预处理代码和API接口,为多模态AI研究提供了有力工具。
LanguageBind_Video_FT
LanguageBind是一种基于语言的多模态预训练方法,将视频-语言预训练扩展到视频、红外、深度、音频等多种模态。该方法以语言作为不同模态间的桥梁,无需中间模态即可实现高性能。项目提出了包含1000万条数据的VIDAL-10M数据集,涵盖5种模态。通过多视角增强的描述训练,LanguageBind在多个下游任务中展现出优异性能。