#数据分析
awesome-opensource-data-engineering - 全面的数据工程开源项目资源库
开源数据工程数据处理数据分析数据管理Github开源项目
该资源库汇集了数据工程领域的开源项目,覆盖数据分析、业务智能、数据湖和数据治理等方面。包含Apache Spark、Flink等分析工具,Debezium、Kafka等数据捕获和消息系统,以及各种数据格式、集成工具和工作流管理系统。为数据工程实践提供了全面的开源解决方案参考。
FragPipe - 综合性质谱蛋白质组学数据分析平台
FragPipe质谱蛋白质组学MSFragger数据分析Github开源项目
FragPipe是一个综合性质谱蛋白质组学数据分析平台。该平台集成MSFragger搜索引擎和Philosopher工具包等多个模块,支持传统和开放搜索、翻译后修饰分析、定量分析等功能。FragPipe提供图形界面和命令行操作,可在Windows、Linux或云端环境运行。平台支持DDA和DIA数据分析,包括标记和非标记定量方法,为蛋白质组学研究提供全面解决方案。
ml_hacks - 机器学习实践与教程资源集锦
机器学习算法聚类深度学习数据分析Github开源项目
ml_hacks项目是一个机器学习资源库,收录了多种算法实现和教程。内容涵盖参数调优、集成学习、异常检测等实践示例,以及机器学习入门、数据分析等基础教程。项目还包括核方法、类别不平衡等专题研究,并提供深度学习和PyTorch相关材料,适合不同水平的学习者参考。
medpy - 医学图像处理的Python库和工具集
MedPy医学图像处理Python库开源软件数据分析Github开源项目
MedPy是一个开源的医学图像处理Python库,专注于高维图像处理。它提供丰富的功能和脚本集合,支持PyPI和Conda-Forge安装。MedPy具有完善的文档和教程,适用于Python 3及以上版本。该项目在GitHub上维护,为医学图像处理研究和应用提供了有力支持。MedPy支持医学图像的分割、配准、滤波等多种处理任务,广泛应用于放射学、神经影像学等医学领域。
plumber - R函数轻松转化为Web API的开源工具
PlumberAPIR语言Web服务数据分析Github开源项目
Plumber是一个用于创建Web API的R包,通过roxygen2风格的注释将R代码转换为API端点。它支持多种HTTP方法和数据序列化,简化了API的构建过程。Plumber提供多种部署选项,如DigitalOcean集成和Posit Connect支持,便于API的发布。这个工具适用于数据分析、机器学习模型部署和交互式应用开发,为R用户提供了一种高效的方式来分享和部署他们的工作。
lambda - 环境监控与统计日志功能
系统诊断性能优化Huggingface模型数据分析Github开源项目环境监控统计日志
Lambda项目实现了统计日志记录功能,用于监控和识别环境问题。该功能记录并分析环境数据,有助于及时发现和解决潜在问题,提升系统稳定性。这一机制为开发过程中的环境管理提供了有力支持。
moirai-1.0-R-base - 基于Transformer的通用时间序列预测模型
时间序列预测开源项目数据分析Moirai模型预训练模型机器学习模型GithubHuggingface
Moirai-1.0-R-base是一个基于掩码编码器的通用时间序列预测Transformer模型,在LOTSA数据集上预训练。该模型包含9100万参数,使用补丁嵌入和变量ID编码方法,可处理多变量时间序列数据进行预测。模型支持自定义预测长度和上下文窗口设置,通过uni2ts库实现部署。作为Moirai系列的中型版本,该模型在性能和计算效率方面达到平衡。
jina-embeddings-v2-base-de - 德英双语文本嵌入模型,优化跨语言相似度计算和检索
文本分类Githubsentence-transformers开源项目数据分析MTEBHuggingface模型评估模型
jina-embeddings-v2-base-de是一款针对德语和英语的双语文本嵌入模型。该模型在MTEB基准测试中表现出色,尤其在文本分类、检索和聚类任务中效果显著。模型不仅能处理德语文本,还支持德英跨语言相似度计算,适用于多语言文本检索和相似度匹配等场景。
相关文章
YData Profiling: 一站式数据探索与分析利器
3 个月前
PySyft: 隐私保护下的分布式机器学习框架
3 个月前
Sklearn与TensorFlow机器学习实用指南中文版项目介绍
3 个月前
CS-Ebook:一个高质量的计算机科学经典书籍推荐清单
3 个月前
探索数据科学的奇妙世界:awesome-datascience项目全面解析
3 个月前
AI学习路线图:从入门到实战的全面指南
3 个月前
Complete Machine Learning Package: 从零到精通的全面学习指南
3 个月前
VisualDL: 飞桨深度学习可视化工具
3 个月前
DataFrame: 现代C++中的强大数据分析工具
3 个月前