finagg: 财务数据处理的利器
在当今数据驱动的金融世界中,快速获取和处理大量金融数据变得越来越重要。finagg 应运而生,它是一款专为财务数据聚合和分析而设计的 Python 工具包,为金融专业人士、数据科学家和开发者提供了强大而灵活的解决方案。
强大功能一览
finagg 的核心功能包括:
- 实现了多个流行的免费金融 API 接口
- 提供工具将这些 API 的历史数据聚合到 SQL 数据库中
- 具备将聚合数据转换为适用于分析和 AI/ML 的特征的能力
这些功能使 finagg 成为处理金融数据的理想工具,无论是进行市场分析、风险评估,还是构建预测模型。
支持的数据源
finagg 支持多个知名的金融数据源,包括:
- 经济分析局 (BEA) 数据
- 联邦储备经济数据 (FRED)
- 证券交易委员会 (SEC) 文件
- Yahoo! Finance 的历史股票数据
通过这些多样化的数据源,用户可以获取从宏观经济指标到个股财务报表的广泛数据。
快速上手
使用 pip 安装最新稳定版本:
pip install finagg
或者从 GitHub 安装最新开发版本:
git clone https://github.com/theOGognf/finagg.git
pip install ./finagg/
安装完成后,可以选择安装推荐的数据集到本地 SQL 数据库:
finagg install -ss economic -ts indices -z -r
这将指导您获取所需的免费 API 密钥,并将它们存储在本地的 .env
文件中。
基本用法示例
finagg 提供了多种方式来访问和处理数据。以下是一些基本用法示例:
- 直接访问 API 数据:
import finagg
# 获取 BEA 数据
bea_data = finagg.bea.api.gdp_by_industry.get(year=[2019]).head(5)
# 获取 FRED 数据
fred_data = finagg.fred.api.series.observations.get(
"CPIAUCNS",
realtime_start=0,
realtime_end=-1,
output_type=4
).head(5)
# 获取 SEC 文件数据
sec_data = finagg.sec.api.company_facts.get(ticker="AAPL").head(5)
- 使用已安装的原始数据探索常用特征:
# 获取 FRED 最常用的经济特征
economic_features = finagg.fred.feat.economic.from_raw().head(5)
# 获取 SEC 季度报告特征
quarterly_features = finagg.sec.feat.quarterly.from_raw("AAPL").head(5)
# 获取特定股票的季度和日线特征聚合
fundamental_features = finagg.fundam.feat.fundam.from_raw("AAPL").head(5)
- 使用已安装的特征探索精炼的数据聚合:
# 获取某个股票所属行业的平均季度报告特征
industry_features = finagg.sec.feat.quarterly.industry.from_refined(ticker="AAPL").head(5)
# 获取某个股票的行业标准化季度报告特征
normalized_features = finagg.sec.feat.quarterly.normalized.from_refined("AAPL").head(5)
# 获取按某个行业标准化的季度报告特征排序的股票列表
sorted_tickers = finagg.sec.feat.quarterly.normalized.get_tickers_sorted_by(
"NORM(EarningsPerShareBasic)",
year=2019
)[:5]
配置选项
finagg 提供了多种配置选项,使用户可以根据自己的需求进行灵活设置:
-
API 密钥和用户代理:
- 可以通过环境变量设置,如
BEA_API_KEY
,FRED_API_KEY
等 - 也可以在程序中直接传递给 API 实现
- 可以通过环境变量设置,如
-
数据存储位置:
- 可通过
FINAGG_ROOT_PATH
,FINAGG_HTTP_CACHE_PATH
,FINAGG_DATABASE_URL
等环境变量自定义
- 可通过
-
其他行为配置:
- 如
FINAGG_DISABLE_HTTP_CACHE
可用于禁用 HTTP 请求缓存
- 如
依赖库
finagg 依赖以下主要 Python 库:
- pandas: 用于快速、灵活和富有表现力的数据结构表示
- requests: 用于 HTTP 请求
- requests-cache: 用于缓存 HTTP 请求
- SQLAlchemy: 提供 SQL Python 接口
- yfinance: 用于从 Yahoo! Finance 获取历史股票数据
适用场景
finagg 的设计初衷是为金融应用创建强化学习环境,但其功能已经扩展到更广泛的应用场景:
- 市场分析: 利用多源数据进行全面的市场趋势分析
- 风险评估: 结合宏观经济指标和个股数据进行风险建模
- 投资组合优化: 使用历史数据和计算的特征进行投资组合构建
- 金融研究: 为学术研究提供丰富的数据源和处理工具
- 算法交易: 为交易策略的开发和回测提供数据支持
- 金融 AI/ML 应用: 提供规范化的数据特征,便于构建机器学习模型
未来展望
作为一个开源项目,finagg 正在不断发展和完善。未来可能的发展方向包括:
- 支持更多的金融数据源
- 增强数据处理和特征工程能力
- 提供更多的预置分析模型和可视化工具
- 优化性能,支持更大规模的数据处理
- 增加与其他金融分析工具的集成
结语
finagg 为金融数据处理提供了一个强大而灵活的解决方案。无论您是金融专业人士、数据科学家还是开发者,finagg 都能为您的工作流程带来显著的效率提升。通过简化数据获取和处理过程,finagg 让您能够将更多精力集中在数据分析和模型构建上,从而在竞争激烈的金融市场中获得优势。
立即开始使用 finagg,探索其强大功能,让您的金融数据分析工作更上一层楼!
🔗 相关链接: