#Pandas
ai_all_resources - 综合性的AI资源集合,涵盖数学、机器学习与深度学习
Github开源项目PythonDeep LearningMachine LearningNumpyPandas
该资源库汇集了Andrej Karpathy、Andrew Ng等知名专家的优质教程以及各大高校和社区的相关资源。内容涵盖基础数学、高级算法、MOOC课程和社区活动,旨在促进AI知识的分享与学习。资源类型多样,适合不同层次的学习者,帮助系统学习AI知识,获取实践经验,促进个人和职业发展。
pystore - 快速高效的Pandas时间序列数据存储库
Github开源项目数据存储Parquet时间序列PandasPyStore
PyStore是专为Pandas时间序列数据设计的快速存储库。它利用Pandas、Numpy、Dask和Parquet技术,实现高效的数据存储和查询。支持本地文件系统,每秒可处理数百万行数据。PyStore提供集合管理、快照和元数据查询功能,适合大规模时间序列数据的存储和分析。
searcharray - 将Pandas字符串列转换为搜索索引的Python工具
Github开源项目全文搜索BM25PandasSearchArray词项索引
SearchArray是一个Python库,用于将Pandas字符串列转换为词项索引。它支持BM25和TFIDF评分,实现高效的词和短语搜索。该工具提供自定义分词器、内存映射和相似度计算功能,简化了Python数据处理中的词法搜索。SearchArray适用于搜索相关性实验和结果重排序,可与其他数据处理任务无缝集成。