#Python

upos-multi - 多语言支持的高效词性标注模型
多语言Github模型模型训练开源项目词性标注PythonFlairHuggingface
Flair提供的默认多语言词性标注模型支持12种语言,F1评分达到96.87%。基于Flair embeddings和LSTM-CRF构建,可以通过pip安装整合至应用中,并使用Flair脚本进行自定义训练,提升文本分析能力。适用于广泛的自然语言处理任务,为多语言内容的词性识别提供准确支持。
awesome-quant - 量化金融领域顶级开源库和资源汇总
量化金融Python交易回测金融工具Github开源项目
该项目汇总了量化金融领域的顶级开源库和资源,涵盖Python、R、Matlab等多种编程语言。内容包括数值计算、金融工具定价、交易和回测等方面的工具。量化分析师、算法交易者和金融工程师可以在此快速找到所需资源,提升开发效率。
awesome-python-typing - Python类型注解全面资源指南
Python类型检查静态类型动态类型mypyGithub开源项目
该项目汇集了Python类型注解相关的全面资源,包括静态和动态类型检查器、存根包、附加类型、实用工具和集成方案。涵盖了从mypy到pyre等主流类型检查器,以及用于注解添加、类型处理和测试的多种工具。此外还提供了相关PEP文档链接,为开发者提供了系统的Python类型注解参考资料。
awesome-asgi - ASGI生态系统全面资源指南
ASGIPythonWeb框架异步编程服务器Github开源项目
本资源清单汇集了ASGI生态系统中的核心组件,包括服务器、框架、应用和库等。内容涵盖应用开发、身份验证、监控、代理、实时通信、安全、序列化和无服务器等多个领域。此外还收录了ASGI相关的参考文档、演讲、实验项目和教程等资料。该清单旨在为开发者提供ASGI技术栈的全面概览,助力跟踪优质项目,推动异步Python Web开发的进步。
best-of-python - Python优质开源项目精选排行榜
Python开源库GitHub数据序列化项目排名Github开源项目
这是一个定期更新的Python开源项目排行榜,收录390个优质项目,累计1800万星标,覆盖28个类别。排名基于GitHub指标和包管理器数据计算的项目质量评分。涵盖数据处理、Web开发、机器学习等领域的顶尖Python库,为开发者提供发现优质资源的平台。排行榜包括数据序列化、数据框架、算法设计、加密、DevOps、GUI开发等28个分类,全面展示Python生态系统。每个项目都附有星标数、贡献者数、最近更新等关键信息,方便开发者快速了解和选择适合的工具库。
Sun-Valley-ttk-theme - Tkinter应用界面现代化主题工具
Sun Valley ttk themeTkinterPythonGUI主题美化Github开源项目
Sun-Valley-ttk-theme是一个为Tkinter应用提供现代化界面的主题工具包。通过简单的代码集成,可以显著提升应用的视觉效果。该工具支持亮暗主题切换,易于安装使用,并能自动适配系统主题。此外,它还提供Windows标题栏颜色定制功能。Sun-Valley-ttk-theme以简洁和易集成为特点,适合Tkinter开发者使用。
awesome-micropython - MicroPython库与开发资源全面指南
MicroPython开发板嵌入式系统物联网PythonGithub开源项目
本项目汇集了丰富的MicroPython资源,包括AI、音频处理、通信协议等领域的库,以及相关框架、软件和工具。此外,还收录了社区资源、教程和开发工具,为MicroPython开发者提供全面的参考。这些资源旨在提高微控制器和嵌入式系统开发的效率,适合各级MicroPython开发者使用。
awesome-python-resources - Python学习资源大全,从入门到专业的全面指南
Python编程资源学习路径开源项目计算机科学Github
项目整合了Python领域的多样化学习资源,包括算法、数据结构、后端开发、数据科学和机器学习等方向。精心筛选的书籍、视频课程和在线平台资源适合各级开发者,支持系统学习和专业领域深耕。资源库全面覆盖从基础到高级的Python知识,为开发者提供了完整的学习路径。
awesome-flask - Flask精选资源 Python Web开发的全面指南
FlaskPythonWeb开发框架开源Github开源项目
本项目汇集了Flask框架的优质资源,包括第三方扩展、开发工具、API支持、认证机制和数据库集成等。同时收录了官方文档、教程、社区讨论和技术会议信息,为Flask开发者提供全面的学习和参考指南。涵盖从入门到进阶的各个方面,助力开发者高效构建Python Web应用。
elasticsearch-dsl-py - 简化Elasticsearch查询和文档操作的Python高级库
Elasticsearch DSLPython搜索数据库查询Github开源项目
elasticsearch-dsl-py是一个基于官方低级客户端构建的Python高级库,旨在简化Elasticsearch查询的编写和执行。该库提供了更便捷的方式来编写和操作查询,紧密贴合Elasticsearch JSON DSL的术语和结构。它还包含一个可选的文档处理包装器,支持将文档作为Python对象进行操作,包括定义映射、检索和保存等功能。elasticsearch-dsl-py兼容多个Elasticsearch版本,并提供了丰富的示例和详细文档供参考。
Maryam - Maryam 模块化OSINT框架助力高效数据采集
OWASP Maryam开源框架OSINT数据收集PythonGithub开源项目
Maryam是一款基于OSINT的模块化开源框架,旨在快速全面地从开放源和搜索引擎中收集数据。该框架支持Linux、FreeBSD等多种操作系统,提供命令行界面和Web API。Maryam可用于DNS搜索、YouTube和Google搜索等多种场景,持续更新并计划引入基于语言模型的搜索功能,进一步增强数据收集和分析能力。
search-tweets-python - Python工具简化Twitter搜索数据访问和分析
Twitter API搜索Python认证命令行工具Github开源项目
该项目是Twitter高级和企业搜索API的Python封装,提供命令行工具和库。支持30天及全档案搜索,具备自动分页、流式传输、多种认证等功能。兼容Tweet解析器,支持搜索计数,可减少API调用并快速获取推文数量。整体简化了Twitter搜索数据的访问和分析流程,适用于需要处理大量Twitter数据的开发者。
python-seo-analyzer - Python网站SEO分析与优化工具
PythonSEO分析网站爬虫技术SEOBeautifulSoup4Github开源项目
python-seo-analyzer是一个开源的SEO分析工具,可爬取网站结构、统计文本内容并识别技术SEO问题。支持命令行和API调用,能分析标题标签、额外标签和内部链接。输出JSON或HTML格式报告,便于网站SEO优化。该工具支持Python 3.6+环境,可通过pip安装或使用Docker运行。
scout - Python开发的轻量级搜索服务器,集成全文搜索与文档数据库
Scout全文搜索RESTfulSQLitePythonGithub开源项目
Scout是一款基于Python和SQLite的RESTful搜索服务器。它集成了全文搜索和文档数据库功能,支持多索引、密钥认证和元数据过滤。Scout特点包括轻量级设计、易于部署、支持文件附件和多种排序算法。该项目以低资源占用和简单配置著称,为开发者提供了高效且功能丰富的搜索解决方案。
speed-camera - 基于计算机视觉的开源运动目标速度测量系统
Speed Camera物体运动追踪树莓派OpenCVPythonGithub开源项目
speed-camera是一个基于Python和OpenCV的开源运动目标速度测量系统。它支持树莓派、Windows和Unix平台,兼容多种摄像头,可自动检测和跟踪画面中最大移动物体并计算速度。系统提供灵活配置、数据记录和Web界面,适用于交通监控等场景。此外还集成了数据分析、图表生成等管理工具,方便用户进行后续处理。
flask-msearch - Flask全文搜索扩展 支持多种搜索引擎
Flask-Msearch全文搜索Python数据库索引Web开发Github开源项目
flask-msearch是一个为Flask应用提供全文搜索功能的扩展。它支持简单搜索、Whoosh和Elasticsearch等多种搜索后端。该扩展可为SQLAlchemy模型轻松添加搜索功能,支持自定义索引名称、模式和分析器。flask-msearch提供创建、更新和删除索引的方法,并支持关联模型索引。此扩展适合需要在Flask应用中集成全文搜索功能的开发者使用。
deffcode - 基于FFmpeg的跨平台视频帧解码处理库
DeFFcodeFFmpeg视频帧解码跨平台PythonGithub开源项目
DeFFcode是一个基于FFmpeg的跨平台视频帧解码库。它可实时生成低延迟的视频帧,支持多种输入源,提供对底层管道的完整控制,并保持与OpenCV兼容的编码语法。DeFFcode支持GPU加速、关键帧提取和元数据提取等功能,适用于计算机视觉应用开发。
keyvi - 基于有限状态机的高性能键值存储系统
keyvi键值存储有限状态机PythonC++Github开源项目
keyvi是一个开源的键值存储系统,采用有限状态机数据结构,在优化存储空间和查询速度方面表现出色。其主要特性包括高空间效率、快速查询、共享内存支持和强大的可扩展性。keyvi还支持模糊字符串匹配和地理位置匹配功能。该系统可用作嵌入式存储或通过keyvi-server实现网络访问。keyvi提供C++和Python接口,适合处理静态数据集和构建近实时索引。
k-means-constrained - K均值聚类算法的约束优化实现
k-means聚类算法机器学习数据挖掘PythonGithub开源项目
k-means-constrained库为K均值聚类算法引入了簇大小约束功能。它巧妙地将簇分配问题转化为最小成本流问题,并借助Google OR-Tools的C++实现高效求解。作为scikit-learn KMeans的扩展,该库保持了兼容的API设计,适合需要精确控制簇规模的聚类应用场景。支持Python 3.8+环境,可通过pip便捷安装。
mlflow-docker - Docker化MLflow环境的快速部署方案
MLFlowDockerS3MySqlPythonGithub开源项目
mlflow-docker项目提供了一个简化的Docker配置,用于快速部署MLflow环境。该方案集成了Minio S3作为工件存储和MySQL作为MLflow后端存储。项目通过.env文件配置和docker compose命令实现一键部署,同时提供了Python开发所需的bash脚本。此外,项目还包含客户端配置脚本,便于在Python开发中使用MLflow。这一解决方案适用于需要迅速搭建MLflow项目环境的开发者。
sdwebuiapi - Stable Diffusion WebUI的Python API封装库
APIStable DiffusionWebUIPython图像生成Github开源项目
sdwebuiapi是为AUTOMATIC1111/stable-diffusion-webui设计的Python API封装库。它支持txt2img、img2img等核心功能,并提供异步调用、脚本支持和多个扩展接口。该库简化了与Stable Diffusion WebUI的交互过程,便于开发者在项目中集成AI图像生成功能。使用简洁的Python代码,即可实现复杂的图像处理任务。
llama-2-tiny-random - 小型架构高效实现文本生成
GithubPython开源项目文本生成模型初始化transformersHuggingfaceLlama-2模型
基于Llama-2-7b-chat-hf配置进行随机初始化,通过修改隐藏层、注意力头等参数设置,以低资源消耗实现文本生成,适合低成本运算的研究及开发场景。
german-sentiment-bert - 基于BERT架构的德语情感分析模型
模型BERTGithub开源项目Huggingface机器学习Python自然语言处理德语情感分类
该项目开发了一个基于BERT架构的德语情感分类模型。模型在184万个德语样本上训练,数据来源包括社交媒体和各类评论。提供Python包便于使用,支持情感预测和概率输出。在多个数据集上表现优异,最高F1分数达0.9967。可应用于对话系统等德语情感分析场景。
t5-base-qg-hl - 基于T5架构的问答生成模型
模型训练问题生成开源项目模型Github高亮标记HuggingfaceT5Python
该模型采用T5-base架构,专注于生成基于答案的问句。通过在文本中使用<hl>标记来突出答案范围,并以</s>结束文本,即可生成相关问题。这一工具提供了直观的使用体验,适合需要自动生成理解型问题的场景,有助于提高文本处理效率。
speechless-code-mistral-7b-v1.0 - 全面支持多语言的代码生成与推理模型
SpeechlessCoderHuggingface模型优化文本生成开源项目模型GPTQGithubPython
该项目展示了一款专注于代码生成和推理的模型,具备提升推理和规划能力的特点。其多种量化选项支持8位以下的CPU+GPU推断,使其在多种编程语言上均表现不俗。模型经过微调,覆盖了201,981个样本的数据集,包括编码、推理和规划样本,支持Alpaca指令格式。在HumanEval基准测试中通过率达51.22%,适用于多种编程语言的验证,如Python、Java、C++等,为编程助手和代码验证提供支持。
CodeLlama-7B-Python-GGUF - 适用于多平台的文本生成开源模型
Github模型量化开源项目CodeLlamaGGUFPythonHuggingface
CodeLlama 7B Python GGUF格式模型提供多平台下的文本生成功能。由llama.cpp团队推出的GGUF格式,替代GGML,增强了标记和元数据支持。兼容多种UI和库,如text-generation-webui和LM Studio,并提供多种量化选项,以适应不同硬件需求,支持与LangChain等Python项目的高级整合。
pythia-12b-deduped - 面向解释性研究的大模型工具集
EleutherAIPythia文本预测Python模型Github开源项目大语言模型Huggingface
Pythia Scaling Suite是EleutherAI开发的用于解释性研究的大语言模型集合。该套件包含八种尺寸的模型,每种尺寸有去重和非去重版本,均在相同的数据集和顺序下训练,提供科学实验的受控环境,支持对大型语言模型的行为与功能研究。用户可以在Hugging Face上获取154个中间检查点,并通过开源代码库进行调整和扩展。
CodeLlama-34b-hf - 面向代码生成与理解的大型语言模型
Code LlamaHuggingface代码合成预训练模型Github开源项目模型PythonMeta
这是一个预训练和微调的语言模型,专注于代码生成和理解,参数规模可达34亿。适用于多样化的代码合成任务,特别针对Python进行了优化。基于Transformer架构,该模型为商业应用和研究提供了安全可靠的支持。
codegen-350M-mono - Python程序合成的自动回归语言模型
Github程序合成模型CodeGen开源项目自动回归语言模型PythonHuggingfaceGoogle TPUs
该模型基于大量Python语言数据训练,旨在合成程序。它可以通过英文提示生成代码,从而用于代码补全任务。
CodeLlama-7b-hf - 大规模预训练模型助力代码生成与解析
模型参数使用政策Python代码合成LLAMA 2模型Github开源项目Huggingface
Code Llama是一套从7亿到340亿参数的生成文本模型,设计用于代码合成与理解。这些模型基于Hugging Face Transformers架构,提供7B基础版本,具备代码补全和填充功能。针对Python的特定变体也已开发,以便提供更佳的技术支持。探索Code Llama可以如何为项目提供技术支持,满足多样的商业与研究需求。
dolphin-2.5-mixtral-8x7b-GGUF - Dolphin 2.5 Mixtral 8X7B模型兼容多种推理环境,支持多种量化选项
量化方法GPU推理开源项目Dolphin 2.5 Mixtral 8X7B模型Huggingface兼容性PythonGithub
Dolphin 2.5 Mixtral 8X7B是Eric Hartford推出的一款采用GGUF格式的模型。它支持多种比特选项的量化推理,并兼容llama.cpp、KoboldCpp、LM Studio等环境。模型设计注重性能与资源平衡,适合多种应用场景。