#SwiftInfer

SwiftInfer：高效的AI推理与服务框架

3 个月前

3 个月前

相关项目

SwiftInfer

SwiftInfer 采用基于 TensorRT 的 Streaming-LLM 技术，提升长文本输入处理的有效性。借助 Attention Sink 技术，避免模型在注意力窗口变动时发生故障，确保在生产环境中的高效运行，非常适合对推理效率和稳定性要求高的大模型应用。

投诉举报邮箱: service@vectorlightyear.com