开发 Kaggle 笔记本
这是《开发 Kaggle 笔记本:为成为 Kaggle 笔记本大师铺平道路》一书的代码仓库,由 Packt 出版。
这本书讲的是什么?
《开发 Kaggle 笔记本》旨在将您引入广阔的数据分析世界,重点关注如何利用 Kaggle 笔记本资源帮助您在这一领域达到精通水平,并在 Kaggle 笔记本排名中脱颖而出。本书结构为探索分析世界的七个步骤,探讨了 Kaggle 笔记本中的可用功能,以及各种数据分析技术和不同类型的数据集。
您将学到什么
- 通过笔记本方式处理新数据集或竞赛以进行数据分析并引人注目
- 开始探索新的数据源,从数据摄取工具到处理摄取数据中的各种问题
- 使用可重用组件构建代码结构
- 深入分析各种类型的大小数据集
- 通过分析内容使自己从众多参与者中脱颖而出
- 改进笔记本风格:配色方案、内容组织、视觉效果和主题
- 运用讲故事技巧吸引观众,提高演示清晰度,增强影响力
这本书适合谁?
本书适合对数据科学和机器学习有浓厚兴趣,希望使用 Kaggle 笔记本提升技能并在 Kaggle 笔记本排名中晋升的广大读者。 Kaggle 新手,无论背景如何,都能从中受益 经验丰富的贡献者,希望提升数据摄取、准备、探索和可视化等各种技能 专家级贡献者,希望向大师学习以晋升至 Kaggle 高级排名 已经使用 Kaggle 进行学习和竞赛的专业人士
每章的笔记本
下表列出了与每章相关的笔记本链接。第一列为章节编号。第二列为书籍仓库中资源(笔记本或实用程序脚本)的链接。第三列为 Kaggle 上资源的链接。通过点击 Kaggle 上笔记本的链接,您可以直接复刻笔记本并在平台上开始使用。
章节号 | 章节标题 | 笔记本/实用程序脚本 (GitHub) | 在 Kaggle 上打开 |
---|---|---|---|
3 | 开始我们的旅程 – 在泰坦尼克号灾难中生存 | 泰坦尼克号 - 数据世界环游之旅的开始 | |
4 | 休息一下,在伦敦喝杯啤酒或咖啡 | 伦敦的咖啡或啤酒 - 你的选择! | |
英格兰所有酒吧 - 数据探索 | |||
地理空间工具 | |||
绘图样式工具 | |||
星巴克全球分布 - 数据探索 | |||
5 | 回到工作岗位,优化发展中国家的小额贷款 | Kiva 小额贷款 - 数据探索 | |
理解贫困以优化小额贷款 | |||
6 | 你能预测蜜蜂亚种吗? | 数据质量统计 | |
蜜蜂亚种分类 | |||
Plotly 工具 | |||
7 | 文本分析是你所需要的全部 | Jigsaw 评论文本探索 | |
Jigsaw 简单基线 | |||
8 | 分析声学信号以预测下一次模拟地震 | LANL 地震数据探索和基线 | |
9 | 你能找出哪部电影是深度伪造的吗? | 深度伪造探索性数据分析 | |
人脸检测 MTCNN | |||
人脸对象检测 | |||
视频工具 | |||
10 | 用 Kaggle 模型释放生成式 AI 的力量 | 使用 Llama 2、Langchain 和 ChromaDB 的 RAG | |
使用 Llama 2 和 Langchain 的简单顺序链 | |||
使用Llama.cpp测试量化后的Llama 2 | |||
测试LlaMa v2的数学能力 | |||
使用llama.cpp测试量化后的Llama 2(在CPU上) | |||
使用Code Llama生成Python代码(13b) | |||
11 | 结束我们的旅程:如何保持相关性和领先地位 | 伦敦咖啡还是啤酒 - 由你选择(改进版)! | |
Kaggle用户的活跃程度如何? |
在Discord服务器上了解更多信息
您可以在Discord服务器上更深入地参与,获取最新更新并与社区进行讨论,请访问Discord
下载免费PDF
如果您已经购买了本书的印刷版或Kindle版,您可以免费获得一个无DRM限制的PDF版本。只需点击链接即可领取您的免费PDF。 免费电子书
我们还提供了一个包含本书中使用的截图/图表彩色图像的PDF文件,请访问GraphicBundle
了解作者
_Dr. Gabriel Preda_是Endava(一家主要的软件服务公司)的首席数据科学家。他曾在金融服务、银行、投资组合管理、电信和医疗保健等多个行业的项目中工作,为各种业务问题开发机器学习解决方案,包括风险预测、客户流失分析、异常检测、任务推荐和文档信息提取。此外,他在竞争性机器学习领域非常活跃,目前拥有三次Kaggle大师称号,并以其Kaggle笔记本而闻名。