Project Icon

DS-1000

数据科学代码生成基准测试集

DS-1000是一个数据科学代码生成基准测试集,包含1000个涵盖Matplotlib、Numpy、Pandas等主流库的数据科学问题。项目提供简化数据格式,支持通过Hugging Face或本地文件加载。DS-1000采用严格的测试方法评估代码正确性,为数据科学代码生成模型提供全面评估标准。

dask - 开源灵活的并行计算库 助力大规模数据分析
DaskGithubPython库并行计算开源开源项目数据分析
Dask是一个开源的灵活并行计算库,专为大规模数据分析设计。它支持多种数据结构和算法,与NumPy、Pandas等Python数据科学工具无缝集成。Dask提供高效的并行计算能力,能处理超出单机内存的大型数据集,适用于数据科学、机器学习等领域。活跃的社区支持进一步增强了其在数据分析中的应用价值。
ILearnDeepLearning.py - 深度学习和数据科学的开源实践项目集
GithubILearnDeepLearning.pyMedium开源项目数据科学深度学习神经网络
此开源项目库集合了多个与深度学习和数据科学相关的小项目,通过实际操作帮助用户理解复杂的神经网络问题。内容包括详细的代码示例和可视化展示,涵盖梯度下降、神经网络数学原理、过拟合分析、优化器选择、卷积神经网络理论及自定义对象检测模型的训练等。适合希望深入了解和实践深度学习技术的用户,内容实用且丰富。
dataset-viewer - 全面的数据集浏览支持与管理工具
APIGitHubGithubHugging Facebugsdataset viewer开源项目
Dataset viewer 通过 API 提供预处理数据,方便用户浏览和管理 Hugging Face Hub 上的所有数据集。用户可分页查看数据,每页包含 100 行,并通过底部按钮进行导航、过滤、搜索数据和查看基本统计信息。前端组件未开源,遇到问题或需要新功能,可以通过 GitHub 反馈。用户还可通过贡献想法、回答问题、报告错误与改进建议来支持项目改进。
TSDB - 高效便捷的时间序列数据集加载库
GithubPyPOTSTSDB开源工具开源项目数据挖掘时间序列数据集
TSDB是一个时间序列数据集加载库,支持172个公开数据集的一键加载。该工具简化了研究人员和工程师的数据获取流程,使他们能专注于数据处理。TSDB具备数据下载、加载和缓存管理功能,并支持缓存目录迁移。作为PyPOTS工具箱的组成部分,TSDB为时间序列数据挖掘提供了基础支持。
Daily-DeepLearning - 全面计算机基础、Python应用、数据科学及机器学习指南
GithubPython开源项目操作系统数据结构机器学习深度学习
提供丰富的计算机科学教育资源,涵盖数据结构、操作系统、计算机网络等基础课程。Python和数据科学部分包括numpy、pandas、matplotlib等流行库的使用教程。机器学习和深度学习部分涉及逻辑回归、集成学习、RNN、CNN等理论及实践内容,适合初学者及进阶学习者掌握计算机科学与人工智能技术。
Complete-Life-Cycle-of-a-Data-Science-Project - 数据科学项目全生命周期实践指南
APIGithubweb爬虫开源项目数据收集数据科学数据集
该项目提供了数据科学项目完整生命周期的实践指南。涵盖数据收集、清洗、特征工程、模型训练及部署全过程。详细介绍网络爬虫、API、数据库等数据获取方法,并汇总多个开放数据集资源。同时包含数据预处理、特征选择、模型评估等关键环节的最佳实践。对数据科学学习者和从业人员具有重要参考价值,有助于全面把握数据科学项目流程。
500-AI-Machine-learning-Deep-learning-Computer-vision-NLP-Projects-with-code - 涵盖机器学习、深度学习、计算机视觉和自然语言处理等领域的AI项目列表
Artificial Intelligence Project ListComputer visionDeep learningGithubMachine learningNLP开源项目
该项目集合包括超过500个人工智能项目,涵盖机器学习、深度学习、计算机视觉和自然语言处理等多个领域。每个项目均附带代码链接,适合各层次开发者使用。项目持续更新,确保所有链接有效,用户也可提交请求和贡献代码。
DeepLearningProject - 全面教程涵盖数据集创建与深度学习
GithubHarvard UniversityPyTorchPython开源项目机器学习深度学习
本教程详细介绍了从创建自定义数据集到应用传统和深度学习算法的完整机器学习管道。基于哈佛大学高级数据科学课程项目,内容更新为PyTorch版本,适合希望深入理解和实践机器学习的用户。
bigcodebench - 高难度代码生成基准测试评估LLM编程能力
BigCodeBenchGithub代码生成大语言模型开源项目编程能力评估基准
BigCodeBench是一个具有挑战性的代码生成基准测试,用于评估大型语言模型的实际编程能力。它提供复杂指令和多样函数调用,包括数据集、生成和评估脚本。基于EvalPlus框架,BigCodeBench实现精确评估和排名,提供预生成样本以加速研究。支持多种评估环境,采用unittest进行代码测试,为研究人员提供全面工具。
machine-learning - 机器学习与数据科学教程,深度学习、模型部署与强化学习
Githubmachine-learning开源项目强化学习时间序列模型部署深度学习
本项目持续更新,介绍了数据科学和机器学习各个主题。内容涵盖深度学习、模型部署、运筹学和强化学习等,提供Jupyter Notebook格式教程,结合Python科学栈(如numpy、pandas)和开源库(如scikit-learn、TensorFlow、PyTorch)进行教学示范,平衡数学符号与实际应用。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号