ttt-lm-pytorch
ttt-lm-pytorch项目提出了一种新型序列建模层,结合了RNN的线性复杂度和高表达能力的隐藏状态。该方法将隐藏状态设计为机器学习模型,通过自监督学习在测试阶段持续更新,因此被称为测试时训练(TTT)层。项目实现了TTT-Linear和TTT-MLP两种变体,分别采用线性模型和双层MLP作为隐藏状态,为长序列建模提供了高效替代方案。