#元数据

datachain - 帮助机器学习和AI工程师进行数据分析的数据框架库
DataChainAI数据处理元数据PythonGithub开源项目
DataChain是一个为AI特定场景设计的数据框架库。它通过在非结构化文件上构建的元数据层,帮助机器学习和AI工程师进行数据分析。支持处理各种存储中的原始文件并实现数据集版本控制。用户可以使用Python接口进行数据转换和元数据丰富。项目特色包括功能链式数据处理方法和数据版本控制,并区分CPU和GPU负载, 适用于分布式计算。
YouTube-Agent.bundle - Plex YouTube视频元数据插件安装指南
PlexYouTube插件元数据API密钥Github开源项目
YouTube-Agent.bundle插件用于为Plex媒体服务器提供YouTube视频的元数据支持。通过文件名或.info.json文件中的视频ID查询相关信息,用户需自行配置YouTube API密钥并遵守命名规范以确保插件正常工作。详细的安装、使用和命名指引可参考说明。
Architecture-of-consoles - 解析经典游戏机的架构与硬件设计
Architecture of Consoles翻译文章元数据文件夹Github开源项目
该项目提供详细的游戏机架构文章,涵盖多个经典游戏机模型。资料以Pandoc Markdown格式呈现,包含元数据和R语言代码片段。用户可查看特定游戏机的架构,并可以协助翻译内容及纠正错误。通过贡献翻译和改进建议,用户能够参与到全球游戏机架构的交流,帮助知识传播到更广泛的受众中。
metadata-action - 实现 Docker 镜像元数据自动管理
DockerGitHub Actions元数据CI/CD容器化Github开源项目
metadata-action 是一个 GitHub Action,用于从 Git 引用和 GitHub 事件中提取元数据。它可与 Docker Build Push action 集成,自动为 Docker 镜像添加标签。支持语义化版本、分支名、提交哈希等多种标签策略,并可生成符合 OCI 规范的镜像标签。这个工具简化了 CI/CD 流程中的镜像管理,有效提升开发效率。
acl-anthology - ACL Anthology 计算语言学开放获取论文库
ACL Anthology自然语言处理学术论文库元数据开源项目Github
ACL Anthology是计算语言学和自然语言处理领域的开放获取论文库。该项目收录ACL主办的会议和期刊论文,提供元数据、论文检索、在线阅读和引用生成等功能。ACL Anthology开源了网站代码和Python API,方便研究人员访问和利用数据。项目旨在促进计算语言学研究的开放获取和知识共享,是NLP领域的重要学术资源。
MultiHop-RAG - 评估跨文档RAG能力的多跳查询数据集
MultiHop-RAG检索增强生成跨文档评估问答数据集元数据Github开源项目
MultiHop-RAG是一个评估检索增强生成(RAG)系统跨文档能力的问答数据集。它包含2556个多跳查询,每个查询的证据分布在2至4个文档中,并考虑文档元数据,模拟真实RAG应用中的复杂场景。该项目提供检索和问答示例以及评估脚本,帮助研究人员和开发者改进RAG系统的多文档推理能力。
sqlpkg - SQLite 扩展包的非官方注册中心和管理工具
SQLite包注册表扩展元数据搜索Github开源项目
sqlpkg 是一个非官方的 SQLite 扩展包注册中心,主要提供 SQLite 扩展的元数据。该项目允许用户搜索和安装 SQLite 扩展,同时也支持开发者添加自己的包。sqlpkg 旨在简化 SQLite 扩展的使用和管理过程,为 SQLite 社区提供一个集中的扩展资源平台。sqlpkg 包含一个在线搜索平台(sqlpkg.org)和命令行包管理工具。用户可以通过这些工具方便地查找、安装所需的 SQLite 扩展。此外,开发者可以选择将自己的扩展包添加到注册中心,但这不是使用 sqlpkg 的必要条件。
reflect-metadata - JavaScript和TypeScript的元数据反射API库
元数据反射装饰器TypeScriptJavaScriptGithub开源项目
reflect-metadata库为JavaScript和TypeScript项目提供元数据反射功能。开发者可以通过它在类和成员上操作元数据,使用装饰器语法,并利用其API进行元数据的定义和管理。这个工具在依赖注入、类型检查、反射和测试等多个应用场景中发挥作用,有助于统一和增强类与对象的功能实现。
Datascale - 将SQL查询转化为数据库关系图和血缘流程图的在线工具
AI工具数据库图表SQL查询元数据ER图Datascale
Datascale是一个在线数据库建模工具,可从SQL查询和DDL语句自动生成ER图和血缘流程图。这款工具支持数据模型的可视化和组织管理,有助于理解和维护复杂的数据结构及转换逻辑。通过简化数据建模过程,Datascale旨在提升团队协作效率,为数据专业人员提供有力支持。
sdmx-rest - 统计数据和元数据的HTTP访问标准
SDMX REST API统计数据元数据HTTP开发者文档Github开源项目
sdmx-rest项目是一个开源的REST API规范,旨在通过HTTP协议实现统计数据和元数据的程序化访问。该项目包含Open API定义和开发者文档,为实现标准化的数据交换系统提供了必要工具。这一解决方案适用于数据提供者和消费者,有助于促进跨平台和跨组织的数据共享。
Hama.bundle - 为Plex设计的动漫元数据智能匹配代理
HAMAPlex元数据AniDBTVDBGithub开源项目
Hama.bundle是一款专为Plex设计的动漫元数据代理。它可智能匹配AniDB、TVDB和TMDB的数据,提供海报、剧集截图和简介等信息。此外,Hama.bundle还支持本地媒体资源、多语言标题和集合映射,并生成详细日志便于社区更新数据库。这为动漫爱好者提供了强大而灵活的媒体库管理工具。
detection - 跨平台网络和主机安全检测规则集
检测和狩猎签名网络规则主机检测规则元数据规则集Github开源项目
Detection是一个开源项目,提供了一套相互关联的网络和主机检测规则,旨在提高威胁检测和追踪的可见性和上下文。该项目支持Snort 3、Yara和ClamAV规则,每个规则包含相应元数据,便于交叉引用。项目还提供辅助脚本,用于自动生成基于哈希和证书的Yara规则,为网络安全专业人员提供了实用的工具集,有助于增强安全防御能力。目前支持的规则类型包括Snort 3、Yara和ClamAV,未来还将扩展支持更多签名和格式,持续增强其在网络安全领域的应用价值。
data - 开源Python视频和元数据集合
Python视频数据开源贡献元数据CC0许可Github开源项目
pyvideo/data是一个开源项目,专注于收集和整理Python相关的视频资源及其元数据。项目包含大量Python演讲、教程和会议录像,采用CC0许可发布。开发者可通过GitHub参与贡献,共同扩充这个Python视频资料库。项目特别注重保护视频所有者的权益,维护了一个不允许发布的视频ID列表。
exiftool-vendored.js - Node.js 的高性能跨平台 ExifTool 库
ExifToolNode.js元数据跨平台图像处理Github开源项目
exiftool-vendored.js 为 Node.js 提供快速、跨平台的 ExifTool 访问。这个库具有优异的性能和可靠性,支持读写标签、提取嵌入二进制和恢复元数据。它为常见标签提供强大的类型定义,支持 ExifTool 自动更新,并有完善的测试覆盖。该库被 PhotoStructure 等500多个项目用于处理照片和视频元数据。
tubeup - 多平台视频归档工具 自动上传至互联网档案馆
Tubeup视频上传Internet Archiveyt-dlp元数据Github开源项目
Tubeup是一款开源的视频归档工具,基于yt-dlp实现多平台视频下载,并自动上传至互联网档案馆。支持归档单个视频、播放列表和账户,适用于Linux和macOS系统。提供命令行界面,可自定义元数据和代理设置。具备Docker支持,便于快速部署。
obsidian-dataview - 将Obsidian笔记库转化为可查询数据库的强大插件
ObsidianDataview数据查询Markdown元数据Github开源项目
Obsidian Dataview插件将笔记库转为可查询数据库,提供多种查询方式处理Markdown数据。支持元数据添加,可创建动态视图,增强Obsidian数据管理和可视化功能。适用于需要高效组织和分析笔记数据的用户。
ytmdl - YouTube音乐下载器与智能元数据标记工具
YouTube音乐下载元数据命令行工具PythonGithub开源项目
ytmdl是一款集成YouTube音乐下载和智能元数据标记功能的开源工具。它可从YouTube提取音频,并自动从iTunes、Spotify等多个数据源获取并添加完整的歌曲信息。支持多种音频格式和灵活配置,ytmdl为用户提供了一种简便方式来获取高质量音乐文件及其相关元数据。
bag-database - ROS bag文件管理与搜索的开源Web应用
Bag DatabaseROS元数据Web应用REST APIGithub开源项目
Bag Database是一个开源的ROS bag文件管理Web应用。它可以自动监控目录、解析元数据,并提供Web界面用于搜索、下载和处理bag文件。该工具还包含REST API,支持自动化操作。Bag Database旨在提高ROS项目的文件管理效率,适用于各类ROS开发环境。
Memacs - Emacs和Org mode用户的数字生活元数据管理工具
MemacsOrg mode数据源时间戳元数据Github开源项目
Memacs是专为Emacs和Org mode用户开发的元数据管理工具。它可从邮件、社交媒体、浏览记录等多种数据源提取信息,生成Org mode兼容文件。用户可通过Memacs轻松回顾过往活动、约会和交互,有效管理数字生活。该工具模块化设计,支持高度定制,助力用户增强个人信息管理能力,实现数字记忆的高效检索与回顾。