Project Icon

redun

以高效表达和增量计算为核心的多功能工作流引擎

redun是一个用Python实现的高效工作流框架,它通过惰性表达式定义工作流,在自动并行化、缓存和数据追溯方面表现出色。支持多种计算后端,包括线程、进程、AWS批处理和Spark作业,适用于生物信息学、化学信息学和Web数据提取等领域。其主要特性包括动态DAG创建、数据和代码变化的增量计算、缓存重用和数据追溯日志,保障了工作流的灵活性和可扩展性。

sqlflow - 机器学习与SQL编程的先进集成
GithubKubernetesSQLFlowTensorFlowXGBoost开源项目机器学习热门
SQLFlow 是一款编译器,它将SQL程序编译成在Kubernetes上运行的工作流,支持包括机器学习训练、预测、模型评估等在内的AI作业。此平台支持MySQL、TiDB、Hive等多种数据库系统,以及TensorFlow、Keras、XGBoost等机器学习工具包。SQLFlow 致力于通过SQL增强机器学习模型开发,让拥有SQL技能的工程师也能轻松开发高级机器学习应用。
drake - R语言数据分析工作流管理与优化工具
GithubR包drake复现性工作流开源项目数据分析
drake是一款针对R语言的数据分析工作流管理工具。该工具能够智能分析工作流程,自动跳过已更新的步骤,并支持分布式计算。drake通过提供结果与代码和数据的一致性证据,增强研究可信度。它允许研究者灵活修改内容,显著提升数据科学项目的效率和可重复性。
aiflows - AI工作流设计与实现的模块化开源框架
CoLinkFlowVerseFunSearchGithubPython 3.10aiFlows开源项目
aiFlows是一个模块化框架,简化了涉及人类、AI系统和工具的复杂工作流的设计和实现。其特点包括模块化设计、可复用性、点对点远程协作和并发执行。通过FlowVerse社区,用户可以下载和定制各种工作流,促进AI研究者和实践者的协作和反馈。支持Python 3.10+,助力下一代AI工具的开发和优化。
vectorflow - 高效、容错的开源码向量嵌入处理流程
API端点GithubVectorFlow向量嵌入开源开源项目高吞吐量
VectorFlow 提供高效、可靠的 API 端点,能够快速处理和存储大量原始数据的向量嵌入。支持多种文本格式(如 TXT、PDF、HTML、DOCX),推荐在生产环境中使用 Kubernetes 部署。用户可以通过 Python 客户端或 Docker-Compose 快速本地运行。项目当前为 MVP 版本,具备重试功能、集成 AWS S3 和自定义块校验 Webhook 等特性。访问官方文档或加入社区以了解更多信息及使用案例。
oneflow - 用户友好且高效扩展的深度学习框架
CUDA支持GithubOneFlowPyTorch API分布式训练开源项目深度学习框架
OneFlow是一款深度学习框架,提供类似PyTorch的API,支持n维并行执行的全局张量以及图编译器用于加速和部署模型。最新版本1.0.0已发布,兼容Linux和多个Python版本。用户可以通过Docker或Pip轻松安装,并利用丰富的文档和模型库快速上手,适合大型变压器模型的并行训练和计算机视觉任务。
cwl-airflow - 轻量级工作流管理器实现Apache-Airflow与CWL的集成
Apache-AirflowCWL-AirflowGithubPython包工作流管理开源项目管道管理
cwl-airflow是一个扩展Apache-Airflow 2.1.4功能的Python包,支持Common Workflow Language (CWL) v1.1。这个轻量级管道管理器可将CWL工作流无缝集成到Airflow环境中,提供卓越的性能和易用性。项目兼容Python 3.7,使用Apache 2.0许可证,并在GitHub上持续维护。安装便捷,可通过pip获取最新或特定版本。完整文档托管在ReadTheDocs平台,为用户提供全面的使用指南。cwl-airflow的优势在于其灵活性和与多种工具的兼容性,为复杂工作流管理提供了高效解决方案。
text-dedup - 文本去重工具集,支持多种去重方法和大规模数据集处理
Bloom FilterGithubMinHashRETSimSimHashtext-dedup开源项目
项目提供一系列文本去重脚本,适用于各种场景,包括嵌入式去重(RETSim/UniSim)、适合大规模数据集的MinHash + MinHashLSH、64或128位SimHash、后缀数组子串去重、布隆过滤器和精确哈希去重等方法。项目支持高效处理大数据集并计划引入更多去重方法,如SuperMinHash和ProbMinHash等。用户可以根据需求来自定义脚本,灵活应用于不同的文本数据处理场景。
river - 实时流数据处理的在线机器学习Python库
GithubPython库River在线机器学习开源项目流数据算法
River是一个专注于在线机器学习的Python库,为处理流数据提供用户友好的工具。它实现了多种算法,包括线性模型、决策树和异常检测,支持实时学习和预测。该库适用于需要持续学习、应对概念漂移或开发接近生产环境模型的场景。River注重清晰度和用户体验,单样本处理速度快,并与Python生态系统无缝集成。
cachecloud - Redis多架构云管理平台
GithubRedis云管理平台开源项目弹性伸缩统计监控运维管理
CacheCloud是一个Redis云管理平台,支持Standalone、Sentinel和Cluster架构。该平台提供快速部署、运维管理、弹性伸缩、监控统计和客户端接入等功能。CacheCloud能有效降低大规模Redis运维成本,提高资源管控和利用率。平台已在处理日均800亿+命令、管理18T+内存的大规模Redis环境中得到应用。
RediSearch - 准确的全文搜索与查询索引模块
GithubRediSearchRedis全文搜索开源项目查询索引
RediSearch提供查询、二级索引和全文搜索功能,使用压缩倒排索引实现快速检索和低内存消耗。功能特性包括精确短语匹配、模糊搜索和数字过滤等,显著增强Redis的应用。支持前缀匹配、布尔查询和自动补全,适用于包括中文在内的多种语言查询。可以通过简单步骤快速部署,支持Docker镜像和Redis云服务。拥有丰富的客户端库,适用于多种编程语言。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号