#Github

Gender-Classification - DistilBERT微调模型实现高精度性别分类
数据分类模型训练开源项目模型性别识别Huggingface深度学习GithubDistilBERT
Gender-Classification是一个基于distilbert-base-uncased模型微调的性别分类项目。模型经过5轮训练,在验证集上达到了接近100%的分类准确率。项目采用Adam优化器和线性学习率调度器,学习率为2e-05。模型基于Transformers 4.25.1和PyTorch 1.13.0框架开发,为性别识别任务提供了一个参考实现。
TextRecognitionDataGenerator - 多语言文本识别数据生成工具
TextRecognitionDataGeneratorOCR图像生成文本识别合成数据Github开源项目
TextRecognitionDataGenerator是一款开源的文本识别数据生成工具。支持多种语言如拉丁文、中文和日文等,可自定义字体、背景、文本扭曲和模糊效果。工具提供命令行界面和Python模块,便于集成到训练流程中。适用于OCR和文本识别模型的数据集制作,支持手写体文本生成功能。
ombre-v3-sdxl - 文本生成图像技术与动漫美学的全新融合应用
AI绘图Stable Diffusion开源项目模型Huggingface人物角色Github动漫艺术创作
ombre-v3-sdxl是基于Stable Diffusion XL的文本生成图像模型,专注于创造动漫和美学风格的图像。该模型融合多种艺术风格,适合生成独特的角色和艺术作品。通过文本描述,它能生成高质量、富有艺术感的图像,可应用于动漫创作、游戏设计等领域。模型由qelt开发,基于merges模型构建,遵循FAIPL-1.0-SD许可协议。
CrystalReality - 融合写实与艺术风格的开源图像生成模型
GithubCrystal Reality开源项目人物写实模型融合AI绘画HuggingfaceStable Diffusion模型
CrystalReality是基于CrystalClearRemix和RealisticVision 1.2合并开发的开源图像生成模型。通过特定的模型权重配比,结合了写实风格和艺术效果。该模型在人物肖像生成方面表现突出,能够输出细节丰富的面部特征,并支持多种场景创作,包括时尚人像和自然风光等。
blip2-itm-vit-g - 基于Transformers的图像文本匹配模型
模型训练环境影响Github开源项目模型卡片模型Huggingfacetransformers机器学习
BLIP2-ITM-ViT-G是一个基于Transformers架构的多模态模型,专门用于图像-文本匹配任务。该模型使用ViT-G作为视觉编码器,通过预训练实现图像与文本之间的语义关系理解和匹配。它可直接应用于图文相关性判断,也可作为下游任务的基础模型进行微调,适用于图像检索、跨模态搜索等应用场景。
pumpkin-book - 西瓜书公式详解与机器学习理论补充
机器学习西瓜书南瓜书周志华公式推导Github开源项目
南瓜书是一个开源项目,对周志华《机器学习》(西瓜书)中的复杂公式进行解析和补充。项目提供详细的公式推导过程,帮助读者理解机器学习核心概念。包含在线阅读、PDF下载和视频教程,适合深入学习机器学习理论的读者。由数学基础扎实的贡献者编写,旨在提升机器学习学习者的理论水平。
nheko - 原生桌面体验的Matrix聊天客户端
NhekoMatrix聊天应用桌面客户端端到端加密Github开源项目
nheko是一款基于Matrix协议的原生桌面客户端应用,旨在提供类似主流聊天软件的使用体验。它支持端到端加密、VoIP通话、用户注册和房间管理等核心功能。nheko采用简洁的界面设计,支持多种主题,并允许用户自定义表情和贴纸。此外,nheko还提供D-Bus API接口,支持与第三方插件集成,增强了应用的灵活性和功能性。
imgutils - 全面的动漫图像处理Python库 集成多种AI技术
imgutils图像处理动漫风格Python库深度学习Github开源项目
imgutils是一个功能丰富的Python库,专为动漫风格图像处理而设计。该库集成了多种先进AI模型,提供差分检测与聚类、角色图像预训练、物体检测、线稿生成等功能。此外,imgutils还支持单色图像检测、图像分级、标签生成和截断图像检查等实用工具。这些功能使其成为处理动漫图像数据集和进行图像分析的理想选择。
opus-mt-gem-gem - 多语言Transformer机器翻译模型 支持日耳曼语系互译
BLEU评分语言对开源项目模型Huggingface翻译模型测试集gem-gemGithub
OPUS-MT-GEM是一个基于Transformer架构的开源机器翻译模型,专注于28种日耳曼语系语言的互译需求。该模型通过SentencePiece技术进行文本预处理,采用32k规模词表,支持德语、英语、荷兰语等主流日耳曼语系语言。在WMT新闻翻译测试集上,英德互译的BLEU评分达到30分以上,展现出可靠的翻译能力。模型需要在输入句子开头添加目标语言标识符以指定翻译方向。
koelectra-base-v3-discriminator - 韩语ELECTRA预训练判别器模型
分词器开源项目预训练模型模型Huggingface韩语ELECTRAGithub判别器
koelectra-base-v3-discriminator是第三代韩语ELECTRA预训练语言模型判别器,采用base规模参数配置。模型内置韩语文本处理功能,通过tokenizer实现文本标记化和ID转换,主要应用于文本分类、伪造内容检测等自然语言处理任务。项目采用Apache 2.0许可证开源发布。
reasoning-on-graphs - 基于大语言模型和知识图谱的忠实可解释推理
Reasoning on GraphsRoG大型语言模型知识图谱解释性推理Github开源项目
利用大语言模型与知识图谱,提供优化的规划-检索-推理框架,实现忠实与可解释的推理。预训练权重和自动下载的数据集简化了关系路径生成和答案推理过程,并支持多种大语言模型的插拔式推理,使推理结果更具解释性和灵活性。
tessdata - Tesseract OCR多语言数据文件库支持传统和LSTM引擎
TesseractOCR语言数据LSTM模型tessdataGithub开源项目
tessdata是Tesseract 4.0.0及更高版本的语言数据文件库。它包含传统引擎和LSTM神经网络引擎的模型,支持多语言识别。项目提供整数化处理的LSTM模型,平衡了速度和精度。tessdata还有多个版本可选,适应不同性能需求。所有数据采用Apache-2.0许可证,为OCR技术发展贡献资源。
DeepSeek-Prover-V1.5-RL - 集成强化学习与蒙特卡洛树搜索的数学定理证明系统
Github开源项目人工智能模型定理证明HuggingfaceDeepSeek-Prover机器学习模型
DeepSeek-Prover-V1.5是基于Lean 4开发的定理证明开源语言模型,结合了证明助手反馈的强化学习技术和改进型蒙特卡洛树搜索算法。在miniF2F和ProofNet等标准测试中分别达到63.5%和25.3%的准确率,验证了其在数学定理证明领域的实用价值。
piku - 轻量级Git推送式应用部署工具
piku部署工具Git推送服务器管理应用程序部署Github开源项目
piku是一个轻量级应用部署工具,支持通过Git推送将应用部署到服务器。它兼容多种编程语言,如Python、Node.js和Java,提供虚拟主机和SSL功能。piku适用于低端设备和云服务器,遵循12因子应用原则,为开发者提供简单高效的部署方式。该工具支持多应用管理、独立扩展,适用于ARM和Intel架构,可在各种云提供商和裸机上运行。
text2text - 跨语言文本处理的综合工具包
Text2Text跨语言模型自然语言处理文本生成语言翻译Github开源项目
提供跨语言文本生成、翻译、嵌入和问答等功能的NLP工具包,支持百种语言。可在Google Colab平台免费运行,适用学术研究、企业应用和个性化开发。通过示例和快速入门指南,用户能快速掌握强大的多语言模型,高效处理文本。
fonoster - 开源可编程通信平台 连接电话与互联网服务
Fonoster电信服务开源云计算APIGithub开源项目
Fonoster是一个开源可编程电信平台,旨在替代Twilio。它通过云端工具将电话服务与互联网连接,提供多租户、PBX功能、可编程语音应用和NodeJS SDK等特性。Fonoster支持Amazon S3存储、Let's Encrypt加密和OAuth2认证,为开发者提供灵活工具以构建创新通信应用。
lifecycle - Cloud Native Buildpacks 规范的标准实现工具
LifecycleCloud Native BuildpacksAPI支持容器化开源项目Github
Lifecycle 是 Cloud Native Buildpacks 规范的标准实现工具,支持多版本平台和构建包 API。它提供构建、运行和重构基础镜像的功能,包含分析器、检测器等多个组件。这些组件可独立使用,也可通过创建器统一执行。Lifecycle 旨在简化云原生应用的构建和部署流程,为开发者提供标准化的应用打包解决方案。
webMAN-MOD - 增强PS3功能的多用途自制插件
webMAN MODPlayStation 3插件FTP服务器文件管理Github开源项目
webMAN MOD是针对PlayStation 3的多功能自制插件,源于DeanK的webMAN/sMAN项目。此插件具备Web服务器、FTP服务器、文件管理器、NETISO、NTFS支持、手柄模拟、PS3MAPI、任务自动化及内存调试等多种功能。它兼容各种定制固件,支持便捷的安装和更新,并整合了多种图形界面和功能插件。webMAN MOD适用于所有PS3型号,为用户提供一体化的易用解决方案,满足各种需求。
openfoodfacts-ai - 开源食品数据库的人工智能实验平台
Open Food FactsAI机器学习数据分析食品数据库Github开源项目
openfoodfacts-ai是一个致力于食品数据人工智能研究的开源项目。该平台集成了多个实验性AI项目,包括营养表格识别、食品分类预测和标签检测等。其主要目标是优化Open Food Facts数据库,为研究人员和开发者提供高质量的食品数据和AI模型。项目重视社区贡献,定期组织线上会议,并提供完善的文档支持。
CoreML-Models - 为iOS开发者提供的Core ML机器学习模型下载与集成资源库
Core ML机器学习模型iOS开发XcodeImage ClassifierGithub开源项目
提供多种分类、检测、分割、超分辨率、低光增强、图像恢复和生成等Core ML模型资源,方便iOS开发者下载并集成到Xcode项目。通过Google Drive下载并参照示例项目了解具体使用方法。
platform-sms - 多渠道短信发送平台
短信网关SDK应用管理渠道管理JavaGithub开源项目
platform-sms是一个开源的多渠道短信网关服务,适用于中小型公司。支持阿里云、腾讯云、亿美等渠道,提供应用管理、渠道管理、单发和延时短信功能。基于Java开发,依赖MySQL和Redis,具有Web管理界面和客户端SDK,便于快速集成和使用。
FotoPhoto - 开源AI图像模型实现照片级写实与艺术创作
人像写真Stable DiffusionGithub开源项目图像生成模型Huggingface风景摄影艺术创作
FotoPhoto通过结合Foto Assisted Diffusion与FennPhoto两个模型的技术特点,在图像生成领域实现了突破。这个开源模型可生成包括人像、风景、食物在内的多类型图像,在保持照片级写实效果的同时,也能呈现艺术化风格。其特色在于面部细节和皮肤纹理的精确渲染,以及对整体画面氛围的把控。
ImageJ - 跨平台的科学图像处理和分析工具
ImageJJava科学图像处理开源软件MavenGithub开源项目
ImageJ是一款公共领域的科学图像处理和分析软件,由Java编写,能在不同平台上运行。主要功能包括作为Maven项目的依赖库,以及通过Ant和Maven从源代码进行构建。ImageJ拥有丰富的社区资源,如官方网站、Wiki、邮件列表和论坛,为用户提供广泛支持。适合科研人员和开发者,欢迎社区贡献。
SFR-Embedding-Mistral - 基于Mistral的开源多语言文本嵌入模型
性能指标模型评估Github模型数据集MTEB机器学习开源项目Huggingface
SFR-Embedding-Mistral是基于Mistral架构的多语言文本嵌入模型,通过MTEB基准测试验证其在文本分类、语义匹配和信息检索领域的性能表现。模型在AmazonPolarity分类测试中实现95.97%准确率,可用于多语言文本向量化处理。
llm-resource - 大模型资源汇总及实用技术详解
LLMTransformerGPT-2ChatGPTMOEGithub开源项目
LLM百宝箱是大模型相关资源的综合汇总,包括算法、训练、推理、数据工程、压缩和测评等方面。用户可以通过目录和链接快速找到相关内容,如Transformer和GPT模型的原理和源码解析,以及混合专家模型(MoE)等前沿技术。此外,还提供了LLM微调、对齐和推理优化的实现方案和技巧,帮助开发者和研究者深入掌握并应用大模型技术。
auto-j - 开源大语言模型评估工具
Auto-J对齐评估大语言模型生成式评判开源Github开源项目
Auto-J是一款开源的大语言模型评估工具,可评估模型与人类偏好的对齐程度。该工具覆盖58个真实场景,支持成对响应比较和单一响应评估,并提供详细的自然语言评论。Auto-J具有通用性强、灵活性高、可解释性好等特点,在多项评估任务中表现优异,为大语言模型的对齐研究提供支持。
artoo - Ruby驱动的机器人编程框架
Artoo机器人Ruby硬件控制物联网Github开源项目
Artoo是一个基于Ruby的机器人编程框架,提供简洁而强大的DSL用于机器人和物理计算。它支持Arduino、树莓派等多种硬件平台,具备RESTful API和WebSocket功能。Artoo支持测试驱动开发,便于编写和测试机器人代码。该框架适用于构建各类机器人系统。
llm-leaderboard - 为LLM模型提供的全球性能排行榜
LLM-Leaderboard语言模型榜单开源评估指标Github开源项目
由社区合力打造的LLM模型排行榜,提供交互式仪表板和丰富的性能比较。用户可查看各模型在Chatbot Arena Elo、HellaSwag、HumanEval-Python、LAMBADA等指标上的表现。项目特别关注开源模型的本地部署和商业应用,欢迎各类贡献和修改。
exiftool-vendored.js - Node.js 的高性能跨平台 ExifTool 库
ExifToolNode.js元数据跨平台图像处理Github开源项目
exiftool-vendored.js 为 Node.js 提供快速、跨平台的 ExifTool 访问。这个库具有优异的性能和可靠性,支持读写标签、提取嵌入二进制和恢复元数据。它为常见标签提供强大的类型定义,支持 ExifTool 自动更新,并有完善的测试覆盖。该库被 PhotoStructure 等500多个项目用于处理照片和视频元数据。
Qwen2.5-Coder-7B-Instruct-GGUF - 基于Qwen2.5的7B参数代码专用模型支持超长文本输入与代码生成
GGUF格式大语言模型Github开源项目指令微调模型HuggingfaceQwen2.5-Coder代码生成
Qwen2.5-Coder-7B-Instruct-GGUF是一款开源的代码专用大语言模型,通过5.5万亿token的训练提升了代码生成和推理能力。模型采用transformers架构,参数规模为7.61B,具备32K-128K的长文本处理能力。该模型在保持通用能力的同时优化了编程相关任务,支持GGUF格式并可通过llama.cpp部署,适用于代码智能体等实际应用场景。
gliner_medium-v2.1 - 多功能通用型命名实体识别模型GLiNER
Github开源项目命名实体识别GLiNER模型自然语言处理Huggingface机器学习人工智能
GLiNER是一种基于双向Transformer编码器的命名实体识别模型,可识别任意类型的实体。该模型为资源受限场景提供了实用的替代方案,克服了传统NER模型仅限预定义实体的局限性,同时避免了大型语言模型的高成本问题。GLiNER支持多语言,提供不同规模的版本,安装使用简便。在NER基准测试中表现优异,适用于多种应用场景。
control_v11p_sd15_openpose - 基于OpenPose的人体姿态控制AI图像生成模型
姿态检测Stable Diffusion开源项目图像生成模型ControlNet人工智能HuggingfaceGithub
这是一个基于Stable Diffusion v1-5的图像生成控制模型,专注于人体姿态控制。相比1.0版本,该模型改进了OpenPose实现,增强了手部和面部细节控制,并优化了训练数据集。它能生成更自然准确的图像,为创作者提供精确的人物姿态控制功能。该模型可与Stable Diffusion v1-5无缝集成,适用于需要精细人体姿态控制的AI图像生成场景。
starchat2-15b-v0.1 - 基于StarCoder2微调的双能力开源语言模型
大模型语言模型Github开源项目代码生成StarChat2模型Huggingface人工智能
StarChat2-15b-v0.1是一款基于StarCoder2的开源语言模型,拥有160亿参数规模。该模型通过合成数据集微调,在MT Bench、IFEval聊天评测及HumanEval代码测试中展现了均衡性能。模型支持600多种编程语言,具备代码生成和对话交互功能。开发者可通过Transformers框架调用,需注意模型存在输出偏差等局限性。
najal-v1-sdxl - 基于Stable Diffusion XL的二次元角色生成模型
Stable Diffusion人工智能艺术开源项目text-to-image模型Huggingface动漫风格模型融合Github
najal-v1-sdxl是一个基于Stable Diffusion XL的动漫角色生成模型,专注于二次元人物和艺术风格创作。该模型基于qelt/merges架构,生成具有美感的动漫角色图像。可用于角色设计和插画制作,支持自定义艺术风格。
Llama-3.2-3B-GGUF - 高性能多语言型大语言模型支持8种语言
Github机器学习开源项目模型语言模型多语言人工智能HuggingfaceLlama 3.2
Llama-3.2-3B是Meta开发的多语言大型语言模型,支持8种语言,适用于对话和代理任务。本项目使用llama.cpp对原模型进行量化,保留了128k上下文长度和分组查询注意力等特性。该模型在行业基准测试中表现优异,可用于聊天、知识检索、摘要等自然语言生成任务,适合商业和研究使用。
BLEURT-20 - 基于深度学习的文本相似度智能评估工具
Github开源项目BLEURT-20模型评估自然语言处理PyTorch模型Huggingface机器学习
BLEURT-20是一个基于Transformer架构的文本相似度评估模型,由PyTorch实现。该模型通过简单的API接口提供服务,支持pip快速安装。BLEURT-20能够评估参考文本和候选文本之间的相似度,输出范围为0-1的评分。模型集成了配置、分类和分词器组件,适用于多种NLP任务中的文本质量评估场景。作为开源项目,BLEURT-20为研究人员和开发者提供了一个可靠的文本相似度比较工具。