deep-significance
deep-significance 提供完全测试的显著性测试功能,包括几乎随机顺序(ASO)方法、bootstrap 检验和置换随机化方法。结合 Bonferroni 校正和样本大小分析,兼容 PyTorch、TensorFlow 和 NumPy 数据结构。支持多模型、多数据集和样本级别的比较,帮助用户准确评估模型性能,避免因随机因素导致的错误结论。