#特征存储
awesome-mlops
awesome-mlops 为用户提供全面的机器学习操作(MLOps)资源与最佳实践,覆盖从核心知识、社区交流到模型部署和监测等各个方面。无论是初学者还是专业人士,都能在这个项目中找到有价值的信息和指导。
applied-ml
通过精选的论文、文章和博客,学习企业如何实施数据科学与机器学习项目。了解不同公司对问题的定义、所采用的机器学习技术、背后的科学原理,以及所取得的商业成果,以便更好地评估投资回报。同时还包括最新的机器学习研究进展和实用指南。
feast
Feast是一个开源的特征存储系统,旨在为机器学习平台团队提供可靠的特征管理工具。它通过管理离线存储和低延迟的在线存储,确保特征在训练和服务中的一致性,避免数据泄漏。Feast提供了一个单一的数据访问层,将特征存储与特征检索分离,使模型在不同数据基础设施之间保持可移植性。用户可以通过详细的文档和指南,轻松上手并运行Feast。
hopsworks
Hopsworks 是一个安全且可治理的数据平台,适用于机器学习资产的开发、管理和共享功能。支持特征库和模型管理,以及特征和训练管道的开发及运行。可作为独立特征库,支持云环境和本地部署,并无缝集成 AWS、Azure 和 GCP 等第三方平台。提供丰富的文档和教程以优化使用体验。
featureform
Featureform 是一个虚拟特征库,使数据科学家能够定义、管理并服务于机器学习模型的特征。它通过协调现有基础设施,将变换、特征、标签和训练集标准化,促进团队协作和资源共享。Featureform 支持从个人数据科学家到大型企业团队的多种应用场景,并提供内置合规支持,包括角色访问控制和审计日志。该开源项目兼容现有数据基础设施,适用于本地和云端部署。
elasticsearch-learning-to-rank
elasticsearch-learning-to-rank是一款专为Elasticsearch设计的搜索结果排序优化插件。它能够存储查询模板作为特征,记录相关性分数用于离线模型训练,并支持存储多种类型的排序模型。该插件可利用存储的模型对搜索结果进行智能排序,已在维基媒体基金会等多个知名机构的搜索系统中得到应用。插件支持线性模型、XGBoost和RankLib等多种算法,为开发者提供了灵活的排序优化方案。