Project Icon

PySyft

隐私保护下的数据科学:无需获取数据副本使用非公开信息

PySyft革新数据科学,允许在不查看或复制数据的情况下使用非公开信息。通过连接Datasite,数据所有者控制数据保护,数据科学家直接运行Python代码进行统计分析和机器学习,支持Linux、macOS、Windows、Docker和Kubernetes,适用于多种开发环境。

ibis - 统一 Python 数据框架 API 实现多后端数据分析
GithubIbisPythonSQL开源项目数据分析数据框架库
Ibis 是一个 Python 数据框架库,支持 20 多种后端。它提供统一 API,适用于本地和远程数据分析。Ibis 具有惰性计算、交互式探索功能,支持 Python 和 SQL 代码混合使用。通过修改单行代码即可切换不同后端,提高了数据分析的可移植性。
pythia-2.8b-v0 - 支持可解释性研究的多尺寸语言模型,适合科学研究应用
EleutherAIGithubHuggingfacePythia可解释性大型语言模型开源项目机器学习模型
Pythia模型套件旨在支持大型语言模型的可解释性研究,提供多种尺寸的模型以及去重和未去重的数据版本。尽管不以提升下游性能为主要目标,但测试显示在某些任务中表现卓越。基于Transformer架构的Pythia-2.8B可进行微调研究,适用于探索语言模型的训练过程和变化情况。项目采用Apache 2.0许可,模型及检查点可通过Hugging Face获取,促进语言模型的训练与科研开发。
practical-machine-learning-with-python - 实际应用中的机器学习与深度学习指南
GithubPractical Machine Learning with PythonPython开源项目数据科学机器学习深度学习
通过结构化的三层方法和实际案例,本书帮助读者掌握机器学习和深度学习技能。内容涵盖scikit-learn、pandas、tensorflow等工具,提供数据处理、特征工程、建模和部署的详细指导,以及多个跨行业的案例研究,支持独立完成端到端的机器学习项目。
datajoint-python - 基于关系原则的科学工作流管理框架 DataJoint
DataJointGithubPython框架关系数据模型开源项目数据管理科学工作流管理
DataJoint for Python作为开源科学工作流管理框架,基于关系数据模型设计。框架提供一致的数据组织、计算和查询方法,适用于处理大规模实验数据。项目始于2009年,现已被多个实验室采用。DataJoint支持简便安装,提供完善的文档和教程资源,并包含针对神经科学的示例管道。该框架致力于优化数据处理流程,提高科研工作效率。
pachyderm - 自动化数据处理与版本控制平台
GithubKubernetesPachyderm开源项目数据版本控制数据管道数据血统
Pachyderm是一个开源的数据工程平台,提供自动化的数据处理流水线和版本控制功能。该平台支持复杂的数据转换,并具备数据血缘跟踪能力。基于Kubernetes构建,Pachyderm实现了自动扩展和并行处理,可部署在主流云平台和本地环境。它为数据工程团队提供了一个高效的CI/CD引擎,适用于各类数据处理场景。
private-gpt - 离线运行的AI文档问答系统
AIAPIGithubPrivateGPT大语言模型开源项目隐私
PrivateGPT是一个离线AI文档问答系统,无需网络连接即可使用大型语言模型进行文档分析和问答。该项目提供API接口,支持文档ingestion、上下文聊天、补全和嵌入生成等功能,可用于构建私密的AI应用。系统还包含Gradio用户界面,方便测试API功能。此外,PrivateGPT提供批量下载模型、监控文档等辅助工具,便于用户部署和使用。
pythia-1b-deduped - Pythia模型家族为大规模语言模型的可解释性研究提供了全面支持
EleutherAIGithubHuggingfacePythia开源项目数据集模型科研语言模型
Pythia Scaling Suite由EleutherAI开发,专注于大规模语言模型可解释性研究,包含16个模型,这些模型使用相同的数据集并提供154个中间检查点,托管于Hugging Face。尽管未专门针对下游性能优化,Pythia模型的表现仍可与OPT和GPT-Neo套件媲美甚至超越,适用于科研和实验用途,并支持进一步微调。
portable-secret - 便携式加密工具,无需特殊软件的隐私保护方案
GithubPortable SecretWeb Cryptography API加密密码管理开源项目隐私保护
Portable Secret作为一款便携式加密工具,无需安装特殊软件即可保护隐私。它支持在常规通信渠道中传输加密消息、图片和文件,同时允许在普通存储位置保管敏感信息。用户只需使用浏览器即可进行解密操作,广泛适用于安全文档交换、关键密钥存储和应急文件备份等场景。该项目采用AES-GCM加密算法和PBKDF2密钥派生函数,严格遵循NIST和OWASP的安全标准,为用户提供了一个简单易用且安全可靠的隐私保护方案。
data-science - 数据科学初学者实践教程集合
GithubJavaScriptPython开源项目数据分析数据可视化数据科学
Data Science for Beginners项目提供了一系列Jupyter Notebooks和网页开发代码,涵盖数据科学完整工作流程。项目使用Python、HTML5和JavaScript(特别是D3.js),展示了scikit-learn和PyCaret等工具的应用。内容包括数据收集、预处理、分析、文本分析和可视化,适合数据科学初学者学习实践。项目还包含数据叙事部分,指导如何改进数据可视化,以及提供了作者Medium博客和Observable个人资料的链接,供进一步学习。
ydata-synthetic - 使用尖端生成模型实现合成数据生成,支持表格与时间序列数据
CTGANGANGithubYData Synthetic开源项目数据生成时间序列数据
ydata-synthetic项目提供了多种工具用于合成数据生成,支持前沿的生成模型如Generative Adversarial Networks (GANs)和高斯混合模型。该项目可以生成保护隐私的合成数据,且有助于消除数据偏差,平衡和扩展数据集。全新streamlit应用程序允许用户在无需编程的情况下快速生成合成数据。常见问题、快速入门指南和Jupyter Notebooks实例帮助用户轻松入门。加入Discord社区获取更多技术支持。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

白日梦AI

白日梦AI提供专注于AI视频生成的多样化功能,包括文生视频、动态画面和形象生成等,帮助用户快速上手,创造专业级内容。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

讯飞绘镜

讯飞绘镜是一个支持从创意到完整视频创作的智能平台,用户可以快速生成视频素材并创作独特的音乐视频和故事。平台提供多样化的主题和精选作品,帮助用户探索创意灵感。

Project Cover

讯飞文书

讯飞文书依托讯飞星火大模型,为文书写作者提供从素材筹备到稿件撰写及审稿的全程支持。通过录音智记和以稿写稿等功能,满足事务性工作的高频需求,帮助撰稿人节省精力,提高效率,优化工作与生活。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号