Project Icon

html-query

将HTML内容快速转换为JSON的命令行工具

html-query是一个命令行工具,用于从HTML中提取数据并转换为JSON格式。它采用类似JSON的CSS选择器语法,支持选择文本、属性、父元素和兄弟元素。该工具适用于网页爬虫和数据分析等场景,能够高效地从复杂HTML结构中提取信息,提高数据处理效率。

notion-exporter - 将Notion页面快速导出为Markdown和CSV
CSVGithubMarkdownNotion ExporterTypeScript库命令行工具开源项目
notion-exporter是一个命令行工具和TypeScript库,可从Notion页面导出Markdown和CSV文件。它模拟Notion的导出功能,提供一致的结果。支持CLI脚本调用和库集成,实现自动化导出。用户通过提供Cookie即可使用,简化了Notion内容的导出流程。适用于构建内容管理系统或自动化工作流程。
crawlee - 功能强大的网页爬虫和浏览器自动化库
CrawleeGithubNode.js开源项目数据抓取浏览器自动化网络爬虫
Crawlee是一个功能丰富的网络爬虫和浏览器自动化库,适用于各种网页数据采集和自动化任务。它提供HTTP和无头浏览器爬取的统一接口,支持持久化队列、可插拔存储和自动扩展。Crawlee具有代理轮换功能,能模拟人性化的爬取行为,有效避开常见的反爬虫措施。该库易于配置和使用,可快速构建稳定高效的爬虫系统。Crawlee基于Node.js开发,支持TypeScript,并提供了完善的文档和示例,方便开发者快速上手和集成。
HyperTag - 语义搜索和标签系统集成的智能文件管理工具
CLI工具GithubHyperTag开源项目文件组织标签系统语义搜索
HyperTag整合了灵活的标签系统和先进的语义搜索功能,为文件管理提供创新解决方案。这款工具可无缝应用于现有文件结构,支持包括PDF在内的文本文档和图像的智能搜索。通过命令行界面和实验性网页应用,HyperTag旨在优化文件组织和检索流程,显著提升信息访问效率。其核心设计理念是缩短思考到文件获取的时间,为用户带来更智能、高效的文件管理体验。
pptx2md - PowerPoint转Markdown的高效开源转换工具
GithubMarkdown转换PPTX2MDPowerPoint开源项目文档格式转换自动化工具
pptx2md是一个开源的PowerPoint转Markdown工具,支持保留标题、列表、文本格式、图片和表格等元素。它提供自定义目录功能,可输出为Markdown、Tiddlywiki和Madoko等格式。该工具安装简便,命令行操作灵活,适用于学术写作、技术文档和演示内容转换。pptx2md还支持图片提取、特殊字符转义和演讲者注释等功能,为用户提供全面的PPT到Markdown的转换体验。
neoqs - 现代化的轻量级查询字符串解析库
GithubTypeScriptneoqs字符串化开源项目查询字符串解析
neoqs是qs的TypeScript重写版本,提供现代化、轻量级且完全兼容的查询字符串解析和生成功能。该库支持零依赖、ESM优先设计,保持与qs相同的API。neoqs能够解析嵌套对象和数组,同时提供深度限制和参数数量限制等安全选项。此外,neoqs还提供legacy build以兼容旧版浏览器和Node环境。
awesome-geojson - GeoJSON工具和资源的综合性列表
GeoJSONGithub地图编辑地理数据开源项目数据转换空间分析
awesome-geojson项目汇集了丰富的GeoJSON工具和资源,为地理数据处理提供全面解决方案。项目涵盖操作工具、编辑器、验证器、转换工具及相关服务和数据集,支持从基础GeoJSON操作到高级空间分析。这一精选列表适合开发者、GIS专业人士和数据科学家使用,便于快速找到所需的GeoJSON数据处理工具和资源。
awesome-web-scraper - 多语言网页抓取与爬虫工具资源汇总
GithubWeb Scraper开源工具开源项目数据抓取编程语言网络爬虫
awesome-web-scraper项目汇集了多种编程语言的网页抓取和爬虫工具,涵盖Java、C/C++、C#、Erlang、Python、PHP、Node.js、Ruby、Go和Rust等语言。该项目提供每个工具的简要说明和GitHub链接,便于开发者快速选择适合的解决方案。这些工具可用于网页数据抓取、内容提取和网站爬取,适用于搜索引擎构建、数据分析和自动化测试等场景。作为一个精选资源列表,awesome-web-scraper为开发者提供了宝贵的参考。
wtf_wikipedia - 高效的Wikipedia数据结构化解析工具
GithubJavaScript库wtf_wikipedia开源项目数据提取维基百科解析
wtf_wikipedia是一个专业的JavaScript库,用于解析和提取Wikipedia数据。这个工具可以将复杂的维基文本转换为结构化数据,提取纯文本、链接、图片和模板等信息。支持客户端和服务器端使用,能处理完整的Wikipedia数据转储,适合进行Wikipedia数据分析和应用开发。
yahooquery - 快速获取雅虎财经数据的Python库
GithubPythonYahoo Finance APIyahooquery开源项目数据分析金融数据
yahooquery是一个非官方雅虎财经API的Python封装库,能快速检索多个股票代码的数据,并以Pandas数据框呈现。它支持异步请求,通过API端点获取数据,提高了效率和可靠性。此外,yahooquery还为雅虎财经高级用户提供额外功能。
llm-scraper - 通过TypeScript库从网页提取结构化数据
GithubLLM ScraperPlaywrightTypeScript代码生成开源项目网页数据提取
LLM Scraper 是一个 TypeScript 库,使用 LLM 从网页提取结构化数据。支持本地和多种 AI 提供商,提供代码生成功能,基于 Playwright 框架,支持四种格式模式。使用 Zod 定义模式,确保全面的类型安全性。适用于需要高效数据提取和代码生成的开发者。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

白日梦AI

白日梦AI提供专注于AI视频生成的多样化功能,包括文生视频、动态画面和形象生成等,帮助用户快速上手,创造专业级内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

讯飞绘镜

讯飞绘镜是一个支持从创意到完整视频创作的智能平台,用户可以快速生成视频素材并创作独特的音乐视频和故事。平台提供多样化的主题和精选作品,帮助用户探索创意灵感。

Project Cover

讯飞文书

讯飞文书依托讯飞星火大模型,为文书写作者提供从素材筹备到稿件撰写及审稿的全程支持。通过录音智记和以稿写稿等功能,满足事务性工作的高频需求,帮助撰稿人节省精力,提高效率,优化工作与生活。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号