Project Icon

pyresparser

简历解析器:支持PDF和DOCx格式文件

pyresparser是一个简易的简历解析工具,可以从简历中提取姓名、电子邮件、手机号码、技能、工作经验、学校名称、学位和职位等信息。支持PDF和DOCx文件,易于集成到Python项目中。该工具使用spaCy和nltk进行自然语言处理,并提供便捷的命令行界面。更多信息和安装指南,请参阅官方文档。

Resumenalyzer - 创新简历审核和优化平台
AI工具ATS系统招聘流程求职工具简历优化简历分析
Resumenalyzer是一款专业的简历分析和优化平台,为求职者提供深入的简历审核服务。这个创新工具能帮助用户了解简历在ATS系统和招聘人员眼中的表现,并提供改进建议。通过使用Resumenalyzer,求职者可以在短时间内显著提升简历质量,增加被接受的几率和获得面试机会,从而在竞争激烈的美国就业市场中占据优势。
pylyzer - Rust打造的高速Python代码分析工具
GithubPythonpylyzer开源项目性能语言服务器静态代码分析
pylyzer是一款用Rust开发的Python静态代码分析工具,具有显著的性能优势。该工具提供清晰的错误报告和全面的LSP功能,支持类型检查、推断和内置模块解析。pylyzer基于Erg编程语言的类型系统,可作为VSCode扩展使用,为Python开发者提供高效的代码分析体验。
OCRmyPDF - 扫描PDF文件的OCR转换与优化工具
GithubOCRmyPDFPDF文档多语言支持开源软件开源项目文字识别
OCRmyPDF是一款开源的命令行工具,专门用于为扫描PDF文件添加OCR文本层。它支持多语言识别、页面旋转和倾斜校正,并能生成符合长期存储标准的PDF/A文件。此工具可优化PDF图像,常常生成比原文件更小的输出。OCRmyPDF利用多核处理技术,能高效处理大型文档,已在数百万PDF文件上得到验证。它为用户提供了将不可搜索的扫描文档转换为可搜索、可复制的PDF文件的简便方法。
camelot - 专业的PDF表格数据提取Python库
CamelotGithubPDF表格提取Python库开源项目数据分析
Camelot是一个开源的PDF表格提取Python库,提供高度可配置的设置以精确控制提取过程。它支持将提取的表格直接转换为pandas DataFrame,并可输出为CSV、JSON、Excel等多种格式。Camelot还提供了提取质量评估指标,有助于筛选高质量结果。这个工具适用于需要从PDF文档中提取结构化数据的数据分析师和开发者。
spaCy - 高性能自然语言处理库
GithubPythonspaCy开源项目热门神经网络模型自然语言处理训练系统
spaCy 是一个高级自然语言处理库,支持Python和Cython,适用于实际产品开发。它提供预训练管道,支持70种以上语言的分词和训练,拥有最先进的速度和神经网络模型,可用于词性标注、句法解析、命名实体识别、文本分类等多种任务。spaCy 同时支持多任务学习和使用预训练变换器,如BERT,适合生产环境下的训练系统,模型打包,部署和工作流管理,是商业开源软件,遵循MIT许可证。
pymeta - 基于Python的开源文件元数据提取工具
GithubPyMeta信息收集元数据提取开源项目文件搜索网络爬虫
PyMeta是一个基于Python3的开源文件元数据提取工具。它可以通过Google和Bing搜索并下载特定类型的文件,如PDF、Excel、Word和PowerPoint等,然后提取这些文件的元数据。这个工具主要用于信息收集,能够帮助发现域名、用户账户、命名规则和软件版本等信息。PyMeta具有多线程下载、灵活搜索选项和代理支持等功能,适用于需要进行元数据分析的各类场景。
LapisCV - 基于Markdown的简洁专业简历创建工具
GithubLapisCVMarkdownObsidianTypora开源项目简历模板
LapisCV是一个基于Markdown格式的简历创建工具,兼容Obsidian和Typora编辑器。该工具提供即用型模板,风格简洁正式,编辑便捷,支持实时预览。LapisCV具备多页简历功能,适合各种求职和求学需求。工具允许自定义主题色、字体和布局等样式。此外,LapisCV还支持头像插入和PDF导出,方便用户制作专业简历。
pytextclassifier - PyTextClassifier:支持多种文本分类和聚类算法的高性能工具库
GithubPyTextClassifier开源工具包开源项目文本分类聚类算法自适应文本分析
PyTextClassifier是一款高性能的Python工具库,提供多种文本分类和聚类算法,支持二分类、多分类、多标签分类和Kmeans聚类。适用于情感分析和文本风险分类,设计简明易用,算法高效清晰。支持句子和文档级的文本任务,兼容英文和中文文本。包含FastText、TextCNN、TextRNN和BERT等深度学习模型,适合各类生产环境。
lingua-py - 多语言检测工具,支持75种语言的高效文本解析
GithubLinguaRust实现开源项目文本分类自然语言处理语言检测
该工具能够高效检测文本所属语言,适用于自然语言处理中的文本分类和拼写检查等预处理步骤。这款灵活的小库在长文本和短文本上都能保持高准确率,不依赖外部API或服务,可完全离线使用。相比其他开源库,具有更高的精度和更低的内存占用,尤其适合处理短文本如微博信息。
llmsherpa - PDF智能解析与大语言模型应用框架
GithubLLM SherpaLayoutPDFReaderPDF解析向量搜索开源项目文档结构分析
LLM Sherpa是一个开源项目,提供LayoutPDFReader工具用于智能解析PDF文档结构,包括章节、段落和表格。该工具支持精确分块并保留上下文信息,适用于向量搜索和生成式AI应用。项目提供API接口,便于集成到各类大语言模型应用中,如问答系统和文本摘要。LLM Sherpa简化了PDF处理流程,为开发者提供了高效的大语言模型应用开发框架。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号