#特征提取

Hierarchical-Localization - 模块化的6自由度视觉定位工具箱实现分层定位方法
hloc视觉定位特征提取特征匹配图像检索Github开源项目
这是一个用于6自由度视觉定位的开源工具箱。它采用分层定位方法,结合图像检索和特征匹配技术,提供快速、准确和可扩展的定位能力。该工具箱整合了图像匹配和运动恢复结构(SfM)领域的研究成果,可重现多个室内外视觉定位基准的最佳结果,并支持实现和调试新的定位流程。
Learnery - 个性化在线教育平台 助力高效学习
AI工具字体识别特征提取视觉设计字符识别排版分析
Learnery平台提供个性化在线教育服务,利用智能技术定制学习路径。课程内容涵盖学术科目和职业技能,适合不同背景的学习者。平台配备互动学习工具和实时反馈系统,提高学习效果。用户可随时获取优质教育资源,实现持续学习。平台特色包括AI驱动的个性化课程推荐、实时协作工具和多样化的学习资源库,满足从K12到成人教育的各类需求。
tsfresh - 时间序列特征自动提取和分析的Python开源工具
tsfresh时间序列特征提取机器学习PythonGithub开源项目
tsfresh是一个开源Python库,专注于时间序列数据的自动特征提取。它集成了统计学、时间序列分析、信号处理和非线性动力学的算法,并提供了特征选择机制。该工具可处理多种采样数据和事件序列,提供100多种预定义特征,并通过内置过滤程序评估特征重要性。tsfresh支持回归和分类任务,兼容sklearn、pandas和numpy,可在本地或集群环境运行,为时间序列分析提供了高效解决方案。
tsfel - 多领域时间序列特征提取Python库
TSFEL时间序列特征提取Python库数据分析Github开源项目
TSFEL是一个开源的Python库,专门用于时间序列特征提取。该库提供超过65种特征,覆盖统计、时间、频谱和分形等多个领域。TSFEL支持在线和离线使用,具有用户友好的界面和完整的文档。它注重计算效率,并提供复杂度评估功能。TSFEL的设计易于扩展,支持添加自定义特征。这个库适用于研究人员和数据科学家,能够简化时间序列特征提取的过程。
emotion2vec - 通用语音情感表示模型开源实现
emotion2vec语音情感识别自监督预训练特征提取情感表征Github开源项目
emotion2vec是一个开源的语音情感表示模型,采用自监督预训练方法提取跨任务、跨语言和跨场景的通用情感特征。该模型在IEMOCAP等数据集上取得了领先性能,并在多语言和多任务上展现出优异表现。项目开源了预训练模型、特征提取工具和下游任务训练脚本,为语音情感分析研究提供了有力支持。
functime - 高性能时间序列机器学习Python库
时间序列机器学习全局预测特征提取PolarsPython库Github开源项目
functime是一个面向大规模时间序列数据分析的Python库,提供高效的全局预测和特征提取功能。它支持时间序列预处理、交叉验证和性能评估,通过惰性Polars变换实现优化。该库能快速处理海量时间序列,支持外生特征和自动化调优,并集成LLM代理用于预测分析,适用于各种机器学习和数据分析任务。
hctsa - MATLAB时间序列分析与特征提取工具包
Github开源项目hctsa时间序列分析特征提取数据可视化机器学习
hctsa是一款功能强大的MATLAB时间序列分析工具包,专注于特征提取和比较分析。它能从单变量时间序列中提取大量特征,并提供多种分析工具。主要功能包括数据标准化、聚类、降维、特征识别和分类模型评估。该工具包适用于多领域的时间序列研究,能够深入挖掘数据特征,进行全面的比较分析。
catch22 - 精选时间序列特征提取库
catch22时间序列特征数据挖掘机器学习特征提取Github开源项目
catch22是一个包含22个时间序列特征的开源库,由C语言编写,支持Python、R、Matlab和Julia等多种编程语言。这些特征是从7000多个候选中精选而来,在93个实际时间序列分类问题中表现优异。catch22提供了跨平台的安装方法和使用接口,包括各语言的原生版本和C编译版本。该工具主要用于高效提取时间序列的动态特征,适用于多种研究和应用场景。
tsflex - 高效灵活的时间序列处理和特征提取Python工具包
tsflex时间序列处理特征提取数据分析Python库Github开源项目
tsflex是一个Python工具包,用于时间序列处理和特征提取。它支持多变量、多模态时间序列数据,并可与多种处理和特征提取库集成。tsflex采用基于视图的操作,实现低内存占用和快速执行。该工具包提供直观的API,对序列数据几乎没有假设,能处理异步数据。此外,tsflex还具备特征选择、执行时间记录和序列化等高级功能。
tsfeatures - 时间序列特征提取的Python工具库
tsfeatures时间序列特征提取Python数据分析Github开源项目
tsfeatures是一个Python库,用于计算时间序列数据的多种特征。作为R语言tsfeatures包的Python实现,它提供了自相关、异方差、熵、平稳性等统计指标的计算功能。该库支持自定义特征函数和处理不同频率的时间序列数据,并允许与R版本结果进行对比。tsfeatures适用于需要进行时间序列分析和建模的数据处理场景。
tsfeatures - 高效提取时间序列特征的R工具包
tsfeatures时间序列R包特征提取数据分析Github开源项目
tsfeatures是一个R包,专门用于从时间序列数据中提取多种特征。它能分析趋势、季节性、线性度等,并处理不同频率和周期的时间序列。该包输出易于理解的特征指标,适用于时间序列分析、预测和分类等领域。tsfeatures可通过CRAN安装,支持多种时间序列特征提取方法,使用简单灵活。
d2-net - 深度学习驱动的联合特征检测与描述
D2-NetCNN特征提取计算机视觉深度学习Github开源项目
D2-Net是一个用于联合检测和描述局部图像特征的卷积神经网络模型。该项目提供模型实现、预训练权重、特征提取脚本和MegaDepth数据集训练流程。D2-Net在图像匹配和3D重建等计算机视觉任务中表现优异,提高了特征提取的准确性和效率。项目支持多尺度特征提取,并包含在不同数据集上训练的模型权重。
ddpm-cd - 基于扩散模型的遥感变化检测方法
DDPM-CD遥感变化检测扩散模型特征提取语义理解Github开源项目
DDPM-CD项目提出了一种新的遥感变化检测方法,利用预训练的去噪扩散概率模型(DDPM)作为特征提取器。该方法首先在大量遥感图像上预训练DDPM模型,然后微调轻量级变化分类器,利用DDPM提取的特征和变化标签进行训练。实验表明,DDPM-CD在多个变化检测数据集上性能优异,展示了DDPM在变化检测中的有效性。
PFENet - 优化少样本分割的先验引导特征增强网络
PFENet少样本分割特征提取语义分割深度学习Github开源项目
PFENet作为少样本分割网络的代表作,利用先验引导特征增强技术优化分割效果。在PASCAL-5i和COCO等主流数据集上,PFENet展现出卓越性能。该开源项目包含完整实现代码、预训练模型和详细文档,为计算机视觉研究提供了宝贵资源。
Mesh_Segmentation - 3D网格分割与特征提取技术发展概览
mesh processing特征提取分割深度学习计算机图形学Github开源项目
本项目整理了3D网格分割和特征提取领域的重要研究进展,涵盖2019年至2024年间的创新技术,如变形自动编码器、窗口变换器和图卷积网络等。同时收录了相关数据集、课程资源和关键论文,为该领域研究人员提供全面参考,促进3D网格处理技术的发展。
pyAudioAnalysis - Python音频分析库 实现特征提取分类和分割
音频分析机器学习特征提取分类器Python库Github开源项目
pyAudioAnalysis是一个开源的Python音频分析库,提供音频特征提取、分类、分割等功能。它支持分类器训练评估、未知声音分类、事件检测、监督/非监督分割、回归模型训练和数据可视化。通过Python接口或命令行,可实现复杂的音频分析任务。适用于音乐识别、语音处理等领域,为音频分析提供全面解决方案。
speech-emotion-recognition - 开源多模型语音情感识别系统
语音情感识别机器学习模型深度学习模型特征提取Emo-db数据集Github开源项目
speech-emotion-recognition是一个开源的语音情感识别系统,基于Emo-db数据集开发。该项目支持SVM、随机森林、神经网络、CNN和LSTM等多种机器学习和深度学习模型。系统使用Python实现,提供完整的数据预处理、特征提取和模型训练工作流程。项目设计简单易用,适合研究人员和开发者进行语音情感分析的研究和应用开发。该系统可应用于客户服务、情感计算、人机交互等领域,具有模型多样化、使用灵活、易于扩展等优点。
resnest14d.gluon_in1k - ResNeSt14d:基于分割注意力机制的深度学习模型
timm特征提取ImageNet-1k模型Github开源项目图像分类ResNeStHuggingface
ResNeSt14d是一款基于ResNet的分割注意力图像分类模型,由研究团队在ImageNet-1k数据集上训练。此模型拥有10.6M的参数和2.8 GMACs,支持224x224的图像尺寸。提供多种功能,包括图像分类、特征提取和图像嵌入。通过timm库实现预训练模型调用,支持快速有效的图像分析和计算机视觉任务。
Dmeta-embedding-zh - 提供多任务处理的句子相似度与特征提取模型
Huggingface分类特征提取开源项目模型Github句子相似度Dmeta-embedding重排序
此开源项目专注于实现多语言特征提取与文本分类的多任务模型,适用于多种MTEB数据集场景。模型实现句子相似度的有效评估,并在分类、聚类、再排序和检索任务中展现出良好的性能。采用多种数学计算方法,如余弦相似度、曼哈顿距离、欧氏距离等,确保结果的精确性与适应性。项目支持中英文文本处理,适用于学术研究及商业应用中的多种场景。
allenai-specter - 基于Sentence-Transformers的科学文献相似度建模
Github科学出版物模型句子嵌入开源项目句子相似性Huggingface特征提取AllenAI SPECTER
该模型将AllenAI SPECTER转化为Sentence-Transformers框架,可用于将科学文献的标题和摘要映射至向量空间以计算相似度。在安装Sentence-Transformers库后,用户能轻松进行相似度计算,同时也支持从HuggingFace Transformers加载模型。本文档还展示了如何使用池化操作聚合上下文词嵌入。
convnext_small.fb_in22k - 支持多任务图像处理的预训练模型
ImageNetGithub开源项目特征提取图像分类ConvNeXttimmHuggingface模型
ConvNeXt是一个经过ImageNet-22k预训练的图像分类模型,具备66.3M参数和8.7 GMACs。本文介绍其关键特性及在图像特征提取中的应用,旨在帮助专业用户理解和有效利用该模型进行视觉任务。
resnet50.tv_in1k - ResNet-B模型实现高效图像识别与分析
图像分类Huggingface特征提取开源项目模型ResNet-BGithubImageNetTimm
ResNet-B模型是一款专为图像分类和特征提取而设计的工具,其特点包括ReLU激活和7x7卷积,适合224x224像素图像。在ImageNet-1k数据集上训练,具备优异的参数和计算性能。通过timm库,用户可以轻松将其应用于图像分类、特征提取和图像嵌入等多种场景。
tf_efficientnet_b0.in1k - 基于EfficientNet架构的tf_efficientnet_b0.in1k模型解析
图像分类ImageNet-1kHuggingfacetimmGithub开源项目模型特征提取EfficientNet
tf_efficientnet_b0.in1k是一个基于EfficientNet架构的图像分类模型,在ImageNet-1k数据集上使用Tensorflow训练,并由Ross Wightman移植到PyTorch。该模型具有5.3M参数和0.4 GMACs,支持细节丰富的224x224像素图像应用。其功能包括图像分类、特征映射提取和图像嵌入,非常适合在timm库中进行各种深度学习研究和应用,提供一种高效的图像处理方案。
dinov2-small-imagenet1k-1-layer - 视觉特征学习的Transformer模型
DINOv2特征提取开源项目模型GithubHuggingface自监督学习图像分类Vision Transformer
DINOv2方法无监督预训练的Vision Transformer,适用于影像特征学习增强场景。此小尺寸模型能在ImageNet-1k数据集上执行分类任务,通过提取特征来辅助下游任务。尽管模型未包含微调头,但可附加线性层进行标准分类,适合高精度视觉特征需求的应用。
multilingual-e5-large-pooled - 多语言支持的句子相似性与特征提取模型
特征提取开源项目模型GithubMTEBHuggingface分类multilingual-e5-large句子相似度
此项目基于多语言处理,融合Sentence Transformers技术,专注于句子相似性与特征提取。支持多语言,适用于分类、重排序、文本聚类等多种场景。模型在各种任务中表现优异,如MTEB AmazonCounterfactualClassification和MTEB BUCC中的分类与双语文本挖掘,表现出色。采用MIT许可证,具有高度使用灵活性。
bge-base-en-v1.5 - 增强文本处理能力的多任务学习模型
sentence-transformers特征提取句子相似性分类句子聚类Github开源项目Huggingface模型
bge-base-en-v1.5模型通过多任务学习优化自然语言处理技术,覆盖分类、检索、聚类和重排任务。在多个MTEB数据集上表现优异,例如在亚马逊情感分类任务中达到93.39%的准确率,在AskUbuntu重排任务中MRR达到74.28%。该模型具有MIT开源许可,适用于多种英语任务,为研究人员和开发者提供有效支持。
bge-m3-korean - 多语言句子相似度与文本分析模型
向量空间Sentence TransformerHuggingface语义相似性特征提取开源项目多语言模型Github
该模型基于BAAI/bge-m3,通过KorSTS和KorNLI进行微调,支持多语言语义相似性分析与文本分类等任务,利用Sentence Transformer将句子和段落映射为1024维稠密向量,适用于多种文本嵌入应用。
bge-large-en-v1.5 - Transformers.js适配的ONNX模型及其应用简介
Github模型ONNX句子嵌入开源项目余弦相似度Transformers.jsHuggingface特征提取
该开源项目使用ONNX权重,以在Transformers.js环境下实现模型兼容。通过特征提取管道,用户能够高效计算句子嵌入,实现文本语义分析与快速检索,提升JavaScript环境下的文本处理效率。
twitter-roberta-large-2022-154m - 训练于154M推文的RoBERTa-large模型(2022年数据)及其应用
推特GithubRoBERTa-large模型开源项目Huggingface特征提取掩码语言模型自然语言处理
本项目提供了一种经过2022年12月底前154M条推文训练的RoBERTa-large模型,主要用于推文数据的理解和解析。它通过Twitter Academic API获取并过滤推文,实现了高级文本预处理、掩码语言模型和特征提取的应用示例。用户可借助标准Transformers接口进行推文分析及嵌入提取,同时适用于对比在不同时间段训练的模型的预测结果和困惑度得分,为研究人员提供更深入分析推特时间序列数据的工具。
vit_base_patch8_224.dino - 将自监督DINO方法应用于视觉变换器以增强图像特征提取能力
Github模型ImageNet开源项目图像分类自监督学习Vision TransformerHuggingface特征提取
该项目利用Vision Transformer (ViT) 和自监督DINO方法进行图像特征提取,支持图像分类和嵌入应用。模型在ImageNet-1k数据集上进行了预训练,具有85.8M参数,能够处理224 x 224分辨率的图像。由于其参数利用效率高,该模型在大规模数据集上表现良好,适合精确特征提取的视觉任务,增强图像识别及分析能力。通过`timm`库可轻松实现模型调用和图像处理,满足多种计算机视觉应用需求。
vit_large_patch16_384.augreg_in21k_ft_in1k - 使用ImageNet数据集进行图像分类的Vision Transformer模型
Vision Transformer特征提取模型比较模型Github开源项目图像分类预训练模型Huggingface
该Vision Transformer模型专用于图像分类,最初在ImageNet-21k上进行扩展和正则化训练,并在ImageNet-1k上进行微调。由原作者使用JAX开发,后移植至PyTorch框架。模型的显著特点包括支持384x384图像尺寸,参数量达到304.7M,提升图像识别的准确性。该模型简化了图像分类和图像嵌入生成的过程。高效的数据增强和正则化策略进一步提升了模型性能,是计算机视觉研究与应用的有效工具。
convnextv2_nano.fcmae_ft_in1k - 基于FCMAE的ConvNeXt-V2高效图像分类与特征提取模型
Github开源项目特征提取图像分类Huggingface深度学习ConvNeXt V2ImageNet-1k模型
ConvNeXt-V2模型通过全卷积掩码自动编码器框架进行预训练,并在ImageNet-1k数据集上进行微调。该模型具备15.6百万参数,支持多种图像尺寸处理,训练尺寸为224x224,测试尺寸为288x288。借助timm库,它可执行图像分类、特征提取和图像嵌入,适用于多种应用场景。
pnasnet5large.tf_in1k - PNASNet大规模图像分类与特征提取模型
模型PNasNetImageNet-1k开源项目Huggingface图像分类特征提取Github深度学习
pnasnet5large.tf_in1k是基于Progressive Neural Architecture Search技术开发的图像分类模型,在ImageNet-1k数据集上训练而成。该模型拥有8610万参数,计算量为25.0 GMACs,支持331x331像素的图像输入。它不仅可用于图像分类,还能进行特征图提取和图像嵌入。研究人员和开发者可通过timm库轻松调用此预训练模型,提高图像处理效率。
vit_tiny_patch16_224.augreg_in21k_ft_in1k - 基于ViT架构的轻量级图像分类与特征提取模型
ImageNet模型图像分类GithubtimmVision Transformer特征提取开源项目Huggingface
vit_tiny_patch16_224.augreg_in21k_ft_in1k是一个轻量级Vision Transformer模型,专为图像分类和特征提取而设计。该模型在ImageNet-21k上预训练,并在ImageNet-1k上微调,采用了增强的数据增强和正则化技术。它拥有570万参数,能处理224x224尺寸的图像,在保持高效性能的同时提供准确的视觉分析能力。
vit_small_patch14_dinov2.lvd142m - 基于Vision Transformer的自监督图像特征提取模型
模型图像分类GithubtimmDINOv2Vision Transformer特征提取开源项目Huggingface
这是一个基于Vision Transformer架构的图像特征提取模型。该模型采用DINOv2自监督学习方法,在LVD-142M数据集上预训练,拥有2210万参数,支持处理518x518尺寸的图像。模型可应用于图像分类和特征提取任务,并提供了相关的使用示例代码。作为一个无监督学习的视觉模型,它能够提取稳健的图像特征表示。
audioFlux - 多维音频与音乐分析特征提取库,支持深度学习
audioFlux音频分析特征提取深度学习MIRGithub开源项目
audioFlux是一个开源工具库,专注于音频和音乐的分析及特征提取。支持多种时间频率变换方法和多种特征组合,适用于分类、分离、音乐信息检索(MIR)和自动语音识别(ASR)等任务。该库跨平台且核心由高性能C语言实现,支持FFT硬件加速,适合大规模数据处理。最新版本引入了多种音高算法及音高移位和时间伸缩算法。