#数据科学

notebooks-contrib - RAPIDS社区贡献的GPU加速数据科学笔记本库
RAPIDSGPU加速数据科学开源NVIDIAGithub开源项目
notebooks-contrib是RAPIDS社区维护的GPU加速数据科学笔记本库。它涵盖从入门到高级的多个主题,包括多GPU处理、深度学习和各领域应用。该项目提供教程、工作流示例和实用指南,同时鼓励社区贡献。用户可以找到丰富的学习资源,如官方文档、视频教程和部署指南,以便更好地利用RAPIDS进行GPU加速数据分析。
fast.ai - 简化深度学习的开源教育平台
AI工具深度学习人工智能数据科学机器学习fast.ai
fast.ai提供免费在线课程和开源软件库,通过代码优先的实践教学,帮助各类人群快速掌握深度学习技术。该平台注重应用,让学习者能快速构建模型,同时致力于提高AI领域的多样性。
CodeSquire - AI代码生成工具 助力数据科学效率提升
AI工具CodeSquire代码自动完成AI编程助手数据科学生产力工具
CodeSquire是一款专为数据科学领域打造的AI代码生成工具。它支持Jupyter、VS Code等主流开发环境,能将用户思路转化为实际代码。通过智能代码补全、函数生成和SQL查询转换等功能,CodeSquire有效提升了数据分析和处理效率。该工具还具备代码解释能力,为团队协作提供便利。CodeSquire致力于简化数据科学工作流程,让开发过程更加高效和便捷。
Open Data Science - 打造全球数据科学和人工智能专业人士交流学习的开放社区
AI工具Open Data Science数据科学机器学习人工智能社区平台
Open Data Science汇聚全球数据科学和人工智能专业人士,提供丰富的学习资源和交流机会。平台涵盖课程、竞赛、项目等多样化内容,用户可参与数据比赛、黑客马拉松等活动,加入各类专题讨论组。作为数据科学领域的重要社区,该平台致力于推动开源合作和知识共享,为从业者提供学习成长和职业发展的机会。
Atheros - 顶尖AI产品工程与设计服务
AI工具AI产品开发数据科学工程设计产品创新技术合作
Atheros专注AI驱动产品的工程和设计,汇聚顶级工程师、科学家和设计师资源。公司致力于加速产品开发,解决复杂技术难题,为客户创造商业价值。从创意构思到MVP发布,Atheros提供全流程支持,建立长期合作关系。灵活的付费模式和快速部署能力,助力企业迅速实现AI产品创新。专业领域涵盖机器学习、自然语言处理等先进技术,为各行业提供定制化AI解决方案。
AI Jobs - 领先的人工智能和数据科学领域求职网站
AI工具AI工作机器学习数据科学人工智能职业招聘平台
AI Jobs整合人工智能、机器学习和数据科学领域的职位信息,包含初创企业和大型公司的多样化岗位。网站提供热门公司和职位分类,方便求职者高效查找。平台还为企业提供招聘管理功能,有效连接AI人才与用人单位。
Programmers Force - 巴基斯坦领先AI科技公司提供全球创新技术解决方案
AI工具人工智能技术创新软件开发数据科学Programmers Force
Programmers Force是巴基斯坦领先的AI科技公司,为全球企业提供创新解决方案。业务涵盖技术开发、销售支持、数据科学和法律科技。公司注重员工成长,营造灵活工作环境,培养新一代创新人才,助力企业实现智能化转型。
Next AI Jobs - 人工智能和数据科学领域求职平台
AI工具AI工作人工智能机器学习数据科学Open AI
该平台汇集人工智能、机器学习、自然语言处理和数据科学领域的工作机会。网站提供AI工程师、机器学习专家和数据科学家等多样化岗位,涵盖OpenAI和xAI等知名公司的招聘信息。作为AI人才与行业领先企业的对接平台,Next AI Jobs致力于推动人工智能行业的发展。
AnyGen AI - 综合企业生成式AI平台
AI工具AnyGenLLM企业级AI数据科学云计算
AnyGen AI是一个综合企业生成式AI平台,支持多种大型语言模型、多语言和多云环境。它提供统一接口,可自动生成基于LLM的AI应用,具有安全性、隐私保护和可靠性特点。平台包含LLM Studio、UI生成器、API生成器等功能模块,使数据科学家能灵活选用LLM,快速开发和部署定制AI解决方案,增强企业在生成式AI领域的竞争力。
WisBot - 轻松生成Python代码和Jupyter笔记本的数据科学智能助手
AI工具数据科学Python编程Jupyter Notebook机器学习WisBot
WisBot是一款专为数据科学和机器学习设计的智能助手,可自动生成定制的Jupyter笔记本和Python脚本。它提供高级分析、特征工程和代码优化功能,支持交互式数据探索、端到端模型实验和可视化应用开发。WisBot适用于高级分析、机器学习建模和数据科学学习,能有效提升数据科学工作的效率。
McAnswers - 基于ChatGPT的智能编程助手和问题解决平台
AI工具McAnswers编程错误处理代码生成Web开发数据科学
McAnswers是基于ChatGPT 4.0的智能编程助手平台,为开发者提供多种编程语言的错误修复、代码生成和重构优化服务。平台涵盖Web开发、数据科学、UI/UX设计等领域,支持用户提问各类编程问题并获取AI生成的专业解答,有效提升编程效率。McAnswers致力于简化开发流程,是编程学习和问题解决的有力工具。
Flyte - 灵活高效的数据和机器学习工作流编排解决方案
AI工具Flyte工作流编排数据科学机器学习可扩展性
Flyte是一个高度可扩展和灵活的工作流编排平台,可无缝整合数据、机器学习和分析工具链。它支持数据科学家和工程师轻松构建和管理生产级工作流,实现从本地开发到大规模部署的流畅过渡。Flyte提供强大的扩展性、数据血缘追踪和缓存机制,能处理从简单ETL到复杂机器学习训练等多样化工作流。该平台致力于简化工作流开发,使用户能专注于核心业务逻辑。
Heimdall - 综合无代码平台简化机器学习模型的构建和管理
AI工具Heimdall机器学习数据科学数据工程无代码平台
Heimdall是一个无代码机器学习平台,致力于普及机器学习技术。平台提供一站式解决方案,支持多种机器学习模型的构建、部署和监控。涵盖数据科学和工程任务,如分类、回归、预测和推荐系统。平台特有的The Forge功能可将非结构化数据转换为特征向量,无需编码即可完成。通过集成多种数据源和直观的界面,Heimdall使各类用户都能轻松应用机器学习技术,促进业务创新和发展。
myfuture AI - 创新人工智能和数据科学服务平台
AI工具人工智能数据科学人力资源商业应用领导力培训
myfuture AI利用Serverless技术和Celulas ML框架,为企业提供高效、灵活的人工智能和数据科学解决方案。平台为企业开发数据驱动策略、可视化工具、机器学习模型和算法。工作流程包括接收需求、匹配专家、定制开发和定期汇报。产品涵盖人力资源、商业等多个领域,助力企业创新运营、提升竞争力。平台同时关注AI人才培养,支持企业数字化转型。
shifterator - 文本对比可视化的Python工具包
Shifterator词移分析文本比较可视化数据科学Github开源项目
Shifterator是一个开源的Python包,专门用于构建词位移图,实现文本分析中两个文本之间差异的量化和可视化。它利用垂直条形图展示词汇对文本差异的贡献及方式,增强了情感分析、熵和差异分析的可解释性。研究人员可通过pip轻松安装Shifterator,并利用详细文档创建多种词位移图,从而深入理解和解释文本比较结果。
mlxtend - Python机器学习日常任务扩展库
mlxtend机器学习Python库数据科学开源软件Github开源项目
mlxtend扩展了Python的机器学习功能,专注于提供数据科学日常任务中的实用工具。库中包含多种分类器、集成方法和决策区域可视化功能。它支持pip和conda安装,适合机器学习研究和实践。mlxtend提供详细文档和示例,有助于简化数据科学工作流程。
data-science-interviews - 开源数据科学面试题库及答案集合
数据科学面试问题GitHub项目开源协作DataTalks.ClubGithub开源项目
data-science-interviews是一个开源的数据科学面试问题和答案集合。项目涵盖理论知识、技术能力和概率等多个方面,内容由社区共同维护。用户可以贡献新的问题答案或改进现有内容。此外,项目还提供其他相关资源链接。这一资源旨在帮助数据科学从业者和求职者准备面试,提升专业能力。
scikit-lego - 为scikit-learn提供自定义扩展的开源库
scikit-lego机器学习Python库数据科学开源项目Github
scikit-lego是一个开源Python库,为scikit-learn提供自定义转换器、指标和模型。该项目最初由荷兰多家公司合作开发,现已获得全球贡献。scikit-lego严格遵循scikit-learn标准,提供高质量代码和测试。它包含多种新特性,如自定义数据集、pandas工具、线性模型、朴素贝叶斯、混合模型、元估计器、预处理工具、模型选择方法和评估指标,旨在增强机器学习工作流程的灵活性和功能性。
awesome-materials-informatics - 材料信息学全面资源集锦 助力数据驱动材料研究
材料信息学数据科学开源软件机器学习计算材料学Github开源项目
本资源列表汇集了材料信息学领域的软件工具、云平台、数据集和标准化倡议。内容涵盖开源与商业解决方案,聚焦材料模拟、数据挖掘和机器学习等关键技术。研究人员可借此快速了解行业动态,为数据驱动的材料科学研究提供参考。
data-science-template - 数据科学项目结构化模板,提升团队协作效率
数据科学项目结构最佳实践可维护性可复现性Github开源项目
data-science-template为数据科学团队提供标准化项目结构。该模板整合hydra配置管理、pdoc文档生成、pre-commit代码审查和Poetry依赖管理等工具,提高项目可维护性和可重复性。借助Cookiecutter,团队可快速创建基于此模板的项目,搭建规范的数据科学项目框架,确保代码质量和一致性,有效提升协作效率。
data-science - 开源社区大学提供的数据科学自学课程
数据科学开源教育课程大纲机器学习GitHubGithub开源项目
开源社区大学提供的数据科学自学课程,汇集世界顶尖大学的在线资源。课程覆盖数据科学本科全部内容,包括编程、数学、统计学和机器学习等。学习者可自主安排进度,利用进度跟踪工具和社区支持完成学习。这一免费资源为有志于数据科学领域的学习者提供了全面的教育路径。
blogs - Neo4j驱动的图数据科学实践与洞察
Graph Data ScienceNeo4j数据科学博客文章Jupyter NotebooksGithub开源项目
此仓库收集了一系列支持作者图数据科学博客的Jupyter Notebooks。内容聚焦于使用Neo4j进行图分析,提供实践案例和技术洞察。仓库资源涵盖图数据科学的最新进展和应用,适合开发者和数据科学家学习复杂图分析技术,增强数据驱动决策能力。项目内容同步发布在作者的Medium和WordPress博客上。
mlops-with-aws-datascientists - 面向数据科学家的AWS MLOps实践课程
MLOpsAWS数据科学实践课程DevOpsGithub开源项目
这是一个开源的GitHub仓库,提供由Manifold AI Learning开发的AWS MLOps实践课程。该项目面向数据科学家和DevOps工程师,涵盖AWS平台上的MLOps任务实用技能,包括实践操作和在线研讨会。此外还提供MLOps训练营和Python编程等相关课程资源,旨在帮助学习者掌握AWS环境中的MLOps实践能力。
kedro - 生产级数据科学与工程管道框架
Kedro数据科学管道抽象数据目录项目模板Github开源项目
Kedro是一个开源Python框架,为生产环境中的数据科学项目提供支持。该框架整合了软件工程最佳实践,用于构建可重现、易维护和模块化的数据工程及科学管道。Kedro特性包括标准化项目模板、多功能数据目录、管道抽象、严格的编码规范以及灵活的部署选项。框架致力于促进团队协作,提升工作效率,并推动可复用分析代码的开发。Kedro尤其适合处理大规模原始数据的实际机器学习应用,有效克服了Jupyter笔记本和单次脚本的局限性。
docker-stacks - 交互式计算和数据科学的预配置镜像集
JupyterDocker容器镜像JupyterLab数据科学Github开源项目
Jupyter Docker Stacks提供预配置的Docker镜像,集成Jupyter应用和交互式计算工具。适用于个人Jupyter服务器、团队JupyterHub部署、本地容器Jupyter Notebook运行和自定义Dockerfile开发。支持x86_64和aarch64架构,涵盖基础到数据科学多个版本,满足各类用户需求。镜像包含JupyterLab和Jupyter Notebook前端,支持灵活切换,便于快速部署和使用。
datascience - 数据科学学习路线图 从基础到高级的系统指南
数据科学统计学数据分析数据库概率论Github开源项目
这是一个系统的数据科学学习路线图项目,涵盖了从基础数学到高级统计分析的关键知识点。内容包括矩阵代数、哈希函数、关系代数等基础,以及数据库操作、ETL、NoSQL等实用技能,还有数据可视化和探索性分析等统计学内容。该项目为数据科学学习者提供了一个全面且结构化的学习框架。
Data-science - 数据科学项目的综合资源库和实践指南
数据科学MLOpsPython机器学习GitHubGithub开源项目
Data-science项目汇集了丰富的数据科学资源,涵盖MLOps、数据管理、测试和生产力工具等领域。通过文章、代码和视频教程,该项目全面展示了数据科学工作流程,从项目管理到部署。它为数据科学家和机器学习工程师提供了提高效率、构建可靠项目的实用指南。
gophernotes - Jupyter和nteract的Go语言交互式内核
JupyterGo语言交互式编程数据科学可视化Github开源项目
Gophernotes作为Jupyter和nteract的Go语言内核,实现了在交互式环境中编写和执行Go代码。它支持创建融合代码、公式、可视化和说明文本的文档,便于分享和协作。该工具涵盖了Go的主要语法特性,为数据分析等应用提供了灵活的开发平台,但在Windows系统上使用第三方包时有一定限制。
Data-Science-Interview-Resources - 数据科学面试全面准备资源集锦
数据科学机器学习面试准备算法GitHubGithub开源项目
该项目汇集了数据科学面试的全面准备资源,覆盖简历制作、技能提升和面试技巧等方面。内容包括概率统计、SQL、数据处理、机器学习算法等关键知识点,并提供大量实用链接和视频资料。项目旨在帮助求职者系统备考,适合不同经验水平的数据科学从业者参考使用。
lit - 自学AI实践者必备技术书籍精选
AINLP机器学习编程数据科学Github开源项目
lit项目为自学AI实践者提供了精心策划的技术书籍集锦。涵盖人工智能、数据科学、计算机科学、编程等多个领域的经典著作,从入门到进阶兼具理论深度和实践指导。项目创建者基于个人经验对每本书进行简要介绍,为读者选择合适学习材料提供参考。这一资源有助于系统全面地学习AI相关知识。
codalab-competitions - 促进机器学习和数据科学研究的开源协作平台
CodaLab机器学习平台开源软件研究协作数据科学Github开源项目
CodaLab是一个开源网络平台,专为机器学习和高级计算领域的研究协作而设计。平台提供工作表共享和竞赛参与功能,有效解决数据研究中的常见问题。CodaLab通过简化数据处理和模型评估流程,显著提高研究效率。平台支持多种编程语言和框架,适应不同研究需求。其开源特性也允许用户根据特定需求进行定制和扩展。用户可在codalab.lisn.fr体验CodaLab Competition。项目支持快速部署,并提供完善的文档和社区支持。
Time-Series-Analysis-with-Python-Cookbook - Python时间序列分析与预测实战指南
时间序列分析Python数据科学机器学习预测Github开源项目
这本书全面介绍Python时间序列分析和预测技术,涵盖数据获取、预处理和高级建模。内容包括统计方法、机器学习和深度学习算法,以及使用TensorFlow、PyTorch等框架进行预测。通过实用代码示例和案例研究,读者可以学习处理复杂时间序列数据、进行异常检测,并解决实际业务问题。适合数据分析师和开发者提升时间序列分析技能。
AlphaPy - 多功能机器学习框架 整合市场分析与体育预测
AlphaPy机器学习数据科学预测模型金融分析Github开源项目
AlphaPy是一个基于Python的综合机器学习框架,集成了scikit-learn、Keras和XGBoost等多种先进模型。它不仅提供集成模型生成功能,还包含MarketFlow和SportFlow等专用工具,用于市场分析和体育赛事预测。此外,AlphaPy支持交易系统开发和投资组合分析,为数据科学家和金融分析师提供了全面的解决方案。
Compendium-of-free-ML-reading-resources - 机器学习免费学习资源集合 书籍论文和在线教程
机器学习深度学习数据科学统计学线性代数Github开源项目
该项目是一个综合性机器学习免费资源集合,涵盖数据分析、数学、统计、机器学习和深度学习等领域。收录内容包括经典教材、最新论文、PDF电子书和在线教程,以英文原版为主。项目提供系统的机器学习知识体系和高质量学习材料,适合入门和进阶学习。资源全面、内容权威、持续更新,定期收录最新开放获取资源,为自学者和研究人员提供最新知识和便利。
ML-DL-scripts - 机器学习和深度学习的全面脚本库 从分类到部署的解决方案
机器学习深度学习PythonGitHub数据科学Github开源项目
ML-DL-scripts是一个综合性的机器学习和深度学习Python脚本库。这个项目涵盖了从分类、回归到聚类和时间序列分析等多个领域,同时提供了PyTorch、Fastai和Keras等主流深度学习框架的使用示例。项目还包括图像处理、自然语言处理和异常检测等实际应用案例,以及基于Docker的模型部署配置。这个代码库为数据科学研究和机器学习应用提供了丰富的技术参考资源。
scikit-fda - Python实现的功能数据分析库
scikit-fda函数数据分析Python统计学数据科学Github开源项目
scikit-fda是一个功能数据分析(FDA)的Python库,为处理依赖连续参数的数据提供全面工具。它支持数据表示、探索分析、预处理,以及功能数据的推断、分类、回归和聚类。兼容Python 3.8+版本,可通过PyPI或conda-forge安装。这个开源项目为数据科学家和研究人员提供了灵活的FDA工具集,简化了复杂数据的分析过程。