dom-to-semantic-markdown
dom-to-semantic-markdown是一款为大型语言模型优化的HTML DOM转换工具。它保留网页内容的语义结构,提取关键元数据,通过URL重构和内容精简降低token使用量。该项目具备主要内容检测和表格列跟踪功能,提升了语言模型处理网页信息的效率。这为开发者提供了一个高效的网页内容语义化解析方案。