#数据处理
awesome-node-based-uis - 精选节点式UI开发资源:库与应用汇总
node-based UI可视化编程图形界面工作流程数据处理Github开源项目
本资源列表汇集了节点式用户界面开发相关的工具和库,涵盖多种编程语言的渲染器、布局算法和实用工具。同时收录了众多基于节点的应用,包括工作流自动化、AI、数据处理、3D图形等领域。为节点式UI开发者和设计师提供全面的参考资源。
awesome-opensource-data-engineering - 全面的数据工程开源项目资源库
开源数据工程数据处理数据分析数据管理Github开源项目
该资源库汇集了数据工程领域的开源项目,覆盖数据分析、业务智能、数据湖和数据治理等方面。包含Apache Spark、Flink等分析工具,Debezium、Kafka等数据捕获和消息系统,以及各种数据格式、集成工具和工作流管理系统。为数据工程实践提供了全面的开源解决方案参考。
Examine - 基于Lucene.Net的高效索引搜索库
ExamineLucene.Net索引搜索数据处理开源软件Github开源项目
Examine是一个基于Lucene.Net的开源.NET索引搜索库。它提供简单易用的API,支持快速索引和搜索大量数据,允许配置多个独立定制的索引。Examine具有高度可扩展性,提供基于Lucene的索引实现和流畅的搜索API。该库适用于需要高性能搜索功能的.NET应用,可通过NuGet轻松集成。
elasticsearch-py - Elasticsearch官方Python客户端 全面集成搜索引擎功能
ElasticsearchPython客户端数据索引搜索功能数据处理Github开源项目
elasticsearch-py是Elasticsearch的官方Python客户端库,为开发者提供全面的搜索引擎集成功能。该库支持自动发现集群节点、持久连接和负载均衡,同时确保TLS和HTTP认证的安全性。它能够轻松处理Python数据类型与JSON的转换,并提供线程安全的请求机制。通过丰富的API辅助函数,开发者可以高效地与Elasticsearch交互,简化数据索引、搜索和分析流程。
pvnet_v2_summation - 英国光伏电力预测的先进融合模型
开源项目模型数据处理GithubHuggingface光伏输出英国PVNet_summation
通过汇总PVNet模型的GSP层预测,该项目提供英国光伏电力的国家级预测。由openclimatefix开发,模型训练基于2017-2020年数据,并在2021年数据上进行了验证,从而提高了预测的准确性。
llmlingua-2-bert-base-multilingual-cased-meetingbank - 基于BERT的多语言提示词压缩模型
Huggingface开源项目LLMLingua-2模型提示词压缩Github数据处理文本优化大语言模型
LLMLingua-2-Bert是一个基于BERT多语言模型开发的提示词压缩工具,通过数据蒸馏技术实现任务无关的提示词压缩功能。该模型可识别并保留提示词中的关键信息,在维持原始语义的基础上减少token使用量。模型支持多语言处理,提供API接口,适用于需要控制提示词长度的各类AI应用场景。
anonymizer-beto-cased-flair - 利用BETO嵌入增强西班牙语法律文件匿名化
法律系统AymurAIHuggingface性别暴力Github数据处理开源项目匿名化模型
此模型结合BETO嵌入与BiLSTM-CRF架构,专为西班牙语法律文件匿名化而定制。由collective.ai在AymurAI项目框架下开发,它在布宜诺斯艾利斯刑事法院N°10试行,旨在半自动执行数据匿名化及分析,对性别暴力案提高司法透明度。因数据源于特定地区,使用者需注意跨域法律制度差异。
相关文章
PyTorch Geometric: 强大的图神经网络库
3 个月前
MLOps工具和最佳实践全面指南
3 个月前
Data-Juicer: 为大模型提供更高质量、更丰富、更易"消化"的数据
3 个月前
Unstructured: 开源非结构化数据预处理工具
3 个月前
DataChain: 现代化的AI数据处理框架
3 个月前
Dim: 革新开放数据管理的智能工具
3 个月前
探索小型语言模型:从数据收集到模型训练的全流程指南
3 个月前
ChatGLM-LoRA-RLHF-PyTorch:通过LoRA和RLHF为ChatGLM模型微调的完整流程
3 个月前
Python机器学习(第三版)代码仓库详解
3 个月前