#开源项目

koelectra-base-v3-discriminator - 韩语ELECTRA预训练判别器模型

分词器开源项目预训练模型模型Huggingface韩语ELECTRAGithub判别器

koelectra-base-v3-discriminator是第三代韩语ELECTRA预训练语言模型判别器，采用base规模参数配置。模型内置韩语文本处理功能，通过tokenizer实现文本标记化和ID转换，主要应用于文本分类、伪造内容检测等自然语言处理任务。项目采用Apache 2.0许可证开源发布。

reasoning-on-graphs - 基于大语言模型和知识图谱的忠实可解释推理

Reasoning on GraphsRoG大型语言模型知识图谱解释性推理Github开源项目

利用大语言模型与知识图谱，提供优化的规划-检索-推理框架，实现忠实与可解释的推理。预训练权重和自动下载的数据集简化了关系路径生成和答案推理过程，并支持多种大语言模型的插拔式推理，使推理结果更具解释性和灵活性。

tessdata - Tesseract OCR多语言数据文件库支持传统和LSTM引擎

TesseractOCR语言数据LSTM模型tessdataGithub开源项目

tessdata是Tesseract 4.0.0及更高版本的语言数据文件库。它包含传统引擎和LSTM神经网络引擎的模型，支持多语言识别。项目提供整数化处理的LSTM模型，平衡了速度和精度。tessdata还有多个版本可选，适应不同性能需求。所有数据采用Apache-2.0许可证，为OCR技术发展贡献资源。

DeepSeek-Prover-V1.5-RL - 集成强化学习与蒙特卡洛树搜索的数学定理证明系统

Github开源项目人工智能模型定理证明HuggingfaceDeepSeek-Prover机器学习模型

DeepSeek-Prover-V1.5是基于Lean 4开发的定理证明开源语言模型，结合了证明助手反馈的强化学习技术和改进型蒙特卡洛树搜索算法。在miniF2F和ProofNet等标准测试中分别达到63.5%和25.3%的准确率，验证了其在数学定理证明领域的实用价值。

piku - 轻量级Git推送式应用部署工具

piku部署工具Git推送服务器管理应用程序部署Github开源项目

piku是一个轻量级应用部署工具，支持通过Git推送将应用部署到服务器。它兼容多种编程语言，如Python、Node.js和Java，提供虚拟主机和SSL功能。piku适用于低端设备和云服务器，遵循12因子应用原则，为开发者提供简单高效的部署方式。该工具支持多应用管理、独立扩展，适用于ARM和Intel架构，可在各种云提供商和裸机上运行。

text2text - 跨语言文本处理的综合工具包

Text2Text跨语言模型自然语言处理文本生成语言翻译Github开源项目

提供跨语言文本生成、翻译、嵌入和问答等功能的NLP工具包，支持百种语言。可在Google Colab平台免费运行，适用学术研究、企业应用和个性化开发。通过示例和快速入门指南，用户能快速掌握强大的多语言模型，高效处理文本。

fonoster - 开源可编程通信平台连接电话与互联网服务

Fonoster电信服务开源云计算APIGithub开源项目

Fonoster是一个开源可编程电信平台，旨在替代Twilio。它通过云端工具将电话服务与互联网连接，提供多租户、PBX功能、可编程语音应用和NodeJS SDK等特性。Fonoster支持Amazon S3存储、Let's Encrypt加密和OAuth2认证，为开发者提供灵活工具以构建创新通信应用。

lifecycle - Cloud Native Buildpacks 规范的标准实现工具

LifecycleCloud Native BuildpacksAPI支持容器化开源项目Github

Lifecycle 是 Cloud Native Buildpacks 规范的标准实现工具，支持多版本平台和构建包 API。它提供构建、运行和重构基础镜像的功能，包含分析器、检测器等多个组件。这些组件可独立使用，也可通过创建器统一执行。Lifecycle 旨在简化云原生应用的构建和部署流程，为开发者提供标准化的应用打包解决方案。

webMAN-MOD - 增强PS3功能的多用途自制插件

webMAN MODPlayStation 3插件FTP服务器文件管理Github开源项目

webMAN MOD是针对PlayStation 3的多功能自制插件，源于DeanK的webMAN/sMAN项目。此插件具备Web服务器、FTP服务器、文件管理器、NETISO、NTFS支持、手柄模拟、PS3MAPI、任务自动化及内存调试等多种功能。它兼容各种定制固件，支持便捷的安装和更新，并整合了多种图形界面和功能插件。webMAN MOD适用于所有PS3型号，为用户提供一体化的易用解决方案，满足各种需求。

openfoodfacts-ai - 开源食品数据库的人工智能实验平台

Open Food FactsAI机器学习数据分析食品数据库Github开源项目

openfoodfacts-ai是一个致力于食品数据人工智能研究的开源项目。该平台集成了多个实验性AI项目，包括营养表格识别、食品分类预测和标签检测等。其主要目标是优化Open Food Facts数据库，为研究人员和开发者提供高质量的食品数据和AI模型。项目重视社区贡献，定期组织线上会议，并提供完善的文档支持。

CoreML-Models - 为iOS开发者提供的Core ML机器学习模型下载与集成资源库

Core ML机器学习模型iOS开发XcodeImage ClassifierGithub开源项目

提供多种分类、检测、分割、超分辨率、低光增强、图像恢复和生成等Core ML模型资源，方便iOS开发者下载并集成到Xcode项目。通过Google Drive下载并参照示例项目了解具体使用方法。

platform-sms - 多渠道短信发送平台

短信网关SDK应用管理渠道管理JavaGithub开源项目

platform-sms是一个开源的多渠道短信网关服务，适用于中小型公司。支持阿里云、腾讯云、亿美等渠道，提供应用管理、渠道管理、单发和延时短信功能。基于Java开发，依赖MySQL和Redis，具有Web管理界面和客户端SDK，便于快速集成和使用。

FotoPhoto - 开源AI图像模型实现照片级写实与艺术创作

人像写真Stable DiffusionGithub开源项目图像生成模型Huggingface风景摄影艺术创作

FotoPhoto通过结合Foto Assisted Diffusion与FennPhoto两个模型的技术特点，在图像生成领域实现了突破。这个开源模型可生成包括人像、风景、食物在内的多类型图像，在保持照片级写实效果的同时，也能呈现艺术化风格。其特色在于面部细节和皮肤纹理的精确渲染，以及对整体画面氛围的把控。

ImageJ - 跨平台的科学图像处理和分析工具

ImageJJava科学图像处理开源软件MavenGithub开源项目

ImageJ是一款公共领域的科学图像处理和分析软件，由Java编写，能在不同平台上运行。主要功能包括作为Maven项目的依赖库，以及通过Ant和Maven从源代码进行构建。ImageJ拥有丰富的社区资源，如官方网站、Wiki、邮件列表和论坛，为用户提供广泛支持。适合科研人员和开发者，欢迎社区贡献。

SFR-Embedding-Mistral - 基于Mistral的开源多语言文本嵌入模型

性能指标模型评估Github模型数据集MTEB机器学习开源项目Huggingface

SFR-Embedding-Mistral是基于Mistral架构的多语言文本嵌入模型，通过MTEB基准测试验证其在文本分类、语义匹配和信息检索领域的性能表现。模型在AmazonPolarity分类测试中实现95.97%准确率，可用于多语言文本向量化处理。

llm-resource - 大模型资源汇总及实用技术详解

LLMTransformerGPT-2ChatGPTMOEGithub开源项目

LLM百宝箱是大模型相关资源的综合汇总，包括算法、训练、推理、数据工程、压缩和测评等方面。用户可以通过目录和链接快速找到相关内容，如Transformer和GPT模型的原理和源码解析，以及混合专家模型（MoE）等前沿技术。此外，还提供了LLM微调、对齐和推理优化的实现方案和技巧，帮助开发者和研究者深入掌握并应用大模型技术。

auto-j - 开源大语言模型评估工具

Auto-J对齐评估大语言模型生成式评判开源Github开源项目

Auto-J是一款开源的大语言模型评估工具,可评估模型与人类偏好的对齐程度。该工具覆盖58个真实场景,支持成对响应比较和单一响应评估,并提供详细的自然语言评论。Auto-J具有通用性强、灵活性高、可解释性好等特点,在多项评估任务中表现优异,为大语言模型的对齐研究提供支持。

artoo - Ruby驱动的机器人编程框架

Artoo机器人Ruby硬件控制物联网Github开源项目

Artoo是一个基于Ruby的机器人编程框架，提供简洁而强大的DSL用于机器人和物理计算。它支持Arduino、树莓派等多种硬件平台，具备RESTful API和WebSocket功能。Artoo支持测试驱动开发，便于编写和测试机器人代码。该框架适用于构建各类机器人系统。

llm-leaderboard - 为LLM模型提供的全球性能排行榜

LLM-Leaderboard语言模型榜单开源评估指标Github开源项目

由社区合力打造的LLM模型排行榜，提供交互式仪表板和丰富的性能比较。用户可查看各模型在Chatbot Arena Elo、HellaSwag、HumanEval-Python、LAMBADA等指标上的表现。项目特别关注开源模型的本地部署和商业应用，欢迎各类贡献和修改。

exiftool-vendored.js - Node.js 的高性能跨平台 ExifTool 库

ExifToolNode.js元数据跨平台图像处理Github开源项目

exiftool-vendored.js 为 Node.js 提供快速、跨平台的 ExifTool 访问。这个库具有优异的性能和可靠性,支持读写标签、提取嵌入二进制和恢复元数据。它为常见标签提供强大的类型定义,支持 ExifTool 自动更新,并有完善的测试覆盖。该库被 PhotoStructure 等500多个项目用于处理照片和视频元数据。

Qwen2.5-Coder-7B-Instruct-GGUF - 基于Qwen2.5的7B参数代码专用模型支持超长文本输入与代码生成

GGUF格式大语言模型Github开源项目指令微调模型HuggingfaceQwen2.5-Coder代码生成

Qwen2.5-Coder-7B-Instruct-GGUF是一款开源的代码专用大语言模型，通过5.5万亿token的训练提升了代码生成和推理能力。模型采用transformers架构，参数规模为7.61B，具备32K-128K的长文本处理能力。该模型在保持通用能力的同时优化了编程相关任务，支持GGUF格式并可通过llama.cpp部署，适用于代码智能体等实际应用场景。

gliner_medium-v2.1 - 多功能通用型命名实体识别模型GLiNER

Github开源项目命名实体识别GLiNER模型自然语言处理Huggingface机器学习人工智能

GLiNER是一种基于双向Transformer编码器的命名实体识别模型，可识别任意类型的实体。该模型为资源受限场景提供了实用的替代方案，克服了传统NER模型仅限预定义实体的局限性，同时避免了大型语言模型的高成本问题。GLiNER支持多语言，提供不同规模的版本，安装使用简便。在NER基准测试中表现优异，适用于多种应用场景。

control_v11p_sd15_openpose - 基于OpenPose的人体姿态控制AI图像生成模型

姿态检测Stable Diffusion开源项目图像生成模型ControlNet人工智能HuggingfaceGithub

这是一个基于Stable Diffusion v1-5的图像生成控制模型，专注于人体姿态控制。相比1.0版本，该模型改进了OpenPose实现，增强了手部和面部细节控制，并优化了训练数据集。它能生成更自然准确的图像，为创作者提供精确的人物姿态控制功能。该模型可与Stable Diffusion v1-5无缝集成，适用于需要精细人体姿态控制的AI图像生成场景。

starchat2-15b-v0.1 - 基于StarCoder2微调的双能力开源语言模型

大模型语言模型Github开源项目代码生成StarChat2模型Huggingface人工智能

StarChat2-15b-v0.1是一款基于StarCoder2的开源语言模型，拥有160亿参数规模。该模型通过合成数据集微调，在MT Bench、IFEval聊天评测及HumanEval代码测试中展现了均衡性能。模型支持600多种编程语言，具备代码生成和对话交互功能。开发者可通过Transformers框架调用，需注意模型存在输出偏差等局限性。

najal-v1-sdxl - 基于Stable Diffusion XL的二次元角色生成模型

Stable Diffusion人工智能艺术开源项目text-to-image模型Huggingface动漫风格模型融合Github

najal-v1-sdxl是一个基于Stable Diffusion XL的动漫角色生成模型，专注于二次元人物和艺术风格创作。该模型基于qelt/merges架构，生成具有美感的动漫角色图像。可用于角色设计和插画制作，支持自定义艺术风格。

Llama-3.2-3B-GGUF - 高性能多语言型大语言模型支持8种语言

Github机器学习开源项目模型语言模型多语言人工智能HuggingfaceLlama 3.2

Llama-3.2-3B是Meta开发的多语言大型语言模型,支持8种语言,适用于对话和代理任务。本项目使用llama.cpp对原模型进行量化,保留了128k上下文长度和分组查询注意力等特性。该模型在行业基准测试中表现优异,可用于聊天、知识检索、摘要等自然语言生成任务,适合商业和研究使用。

BLEURT-20 - 基于深度学习的文本相似度智能评估工具

Github开源项目BLEURT-20模型评估自然语言处理PyTorch模型Huggingface机器学习

BLEURT-20是一个基于Transformer架构的文本相似度评估模型，由PyTorch实现。该模型通过简单的API接口提供服务，支持pip快速安装。BLEURT-20能够评估参考文本和候选文本之间的相似度，输出范围为0-1的评分。模型集成了配置、分类和分词器组件，适用于多种NLP任务中的文本质量评估场景。作为开源项目，BLEURT-20为研究人员和开发者提供了一个可靠的文本相似度比较工具。

GSPlayer - Swift开发的iOS视频播放器支持自定义UI和预加载功能

GSPlayer视频播放器iOS开发Swift缓存机制Github开源项目

GSPlayer是一个开源的iOS和macOS视频播放器框架，使用Swift 5开发。它提供自定义UI、简洁API、缓存机制、预加载功能、列表视图集成和全屏播放等特性。通过CocoaPods集成，GSPlayer为移动应用开发者提供了灵活高效的视频播放解决方案。

prometheus-8x7b-v2.0 - 基于Mistral的开源评估型语言模型

Prometheus 2语言模型Github开源项目RLHF人工智能评估Huggingface机器学习模型

Prometheus-8x7b-v2.0是一个基于Mistral-Instruct构建的开源评估型语言模型，通过30万条标注数据训练而成。该模型支持绝对评分和相对排名两种方式，可对其他语言模型进行细粒度评估，是GPT-4评估功能的开源替代方案。模型提供完整的使用文档，适用于语言模型性能比较和评估研究。

Qwen2.5-7B-bnb-4bit - 采用4bit量化技术加速Qwen2.5-7B模型并降低70%内存占用

大语言模型Qwen2.5开源项目Unsloth模型模型微调Huggingface深度学习Github

基于Qwen2.5-7B的量化优化版本，通过4bit量化技术将内存占用降低70%。模型拥有76亿参数，具备128K上下文长度和29种语言处理能力，支持编码、数学运算和长文本生成等功能。该版本在保持原有性能的同时实现轻量化部署，可用于后续的模型微调与定制开发。

faster-distil-whisper-large-v3 - 基于CTranslate2的Whisper语音识别优化模型

语音识别Github开源项目CTranslate2模型模型转换Huggingfacefaster-whisperWhisper

基于distil-whisper/distil-large-v3的CTranslate2转换模型，专注于提升语音识别效率。模型采用FP16格式存储权重，支持多语言转录功能，可灵活调整计算类型。项目提供完整的使用示例和转换文档，方便开发者快速集成和部署。

Qwen2.5-14B-Instruct-GGUF - 针对不同硬件环境优化的大模型量化版本

Qwen2.5-14B-Instruct模型推理开源项目模型HuggingfaceGPU运算模型量化Github人工智能模型

Qwen2.5-14B-Instruct模型的量化优化项目，通过F16到Q2_K等多种精度量化方案，将模型体积压缩至5.36GB-29.55GB范围。项目集成了ARM芯片优化版本和创新的I-quant量化技术，实现了模型性能、速度与硬件适配的平衡。量化版本涵盖了从高精度到轻量级的多个选项，方便在不同计算资源条件下部署使用。

Llama-3.2-3B-Instruct-uncensored-LoRA_final-Q4_K_M-GGUF - 高效微调的3B参数英文指令型大语言模型

深度学习Github开源项目HuggingfaceUnsloth模型训练AI开发Llama模型

Llama-3.2-3B-Instruct-uncensored-LoRA_final-Q4_K_M-GGUF是基于Llama-3.2-3B-Instruct-uncensored模型微调的开源大语言模型。该模型使用Unsloth和Huggingface的TRL库训练，提高了2倍的训练速度。由PurpleAILAB开发，采用Apache 2.0许可证，主要用于英语文本生成任务。这是一个参数量为3B的指令型模型，适合需要快速部署的应用场景。

umberto-commoncrawl-cased-v1 - 高性能意大利语预训练语言模型支持全词遮蔽技术

意大利语言模型开源项目预训练模型命名实体识别UmBERTo自然语言处理模型HuggingfaceGithub

该模型是一个意大利语预训练语言模型，基于OSCAR语料库训练，支持命名实体识别和词性标注等自然语言处理任务。模型采用全词遮蔽技术，在多个基准测试中准确率达到98%以上。开发者可通过Hugging Face平台快速部署和使用该模型。

GenSim - 利用大型语言模型实现机器人仿真任务自动生成

GenSim机器人模拟任务生成大语言模型GPTGithub开源项目

GenSim项目通过大型语言模型生成仿真环境和任务。用户可使用Gradio Demo和GPTs进行互动。本仓库提供安装及使用指南，涵盖任务生成、添加、移除，及LLM微调等。GenSim还支持多任务训练基准测试，多种生成和训练脚本。项目代码位于GitHub，供用户反馈和交流。

alisthelper - 跨平台Alist管理工具简化文件管理体验

alisthelperFlutter桌面应用开源项目文件管理Github

alisthelper是一款开源的Alist管理工具，基于Flutter开发，支持Windows和macOS平台。它提供自动启动、系统托盘最小化、开机自启和自定义启动参数等功能，简化了Alist桌面版的使用流程。这款免费无广告的应用为Alist用户提供了更高效、灵活的文件管理体验。

相关文章

Article Cover

Visual-Chinese-LLaMA-Alpaca 学习资料汇总 - 多模态中文大语言模型

Article Cover

LLM-groundedDiffusion学习资料汇总 - 用大语言模型增强文本到图像扩散模型的提示理解

Article Cover

awesome-llm-agents学习资料汇总 - 大语言模型智能体精选列表

Article Cover

ChatLLM学习资料汇总 - 轻松玩转LLM兼容OpenAI与LangChain

Article Cover

ollama-grid-search学习资料汇总-自动化评估和比较LLM模型的桌面应用

Article Cover

awesome-llm-role-playing-with-persona学习资料汇总 - 大语言模型角色扮演与人格赋予技术综述

Article Cover

NeMo-Curator学习资料汇总 - GPU加速的大语言模型数据处理工具包

Article Cover

pykoi-rlhf-finetuned-transformers学习资料汇总 - 开源RLHF统一接口

Article Cover

ChainFury入门指南 - 开源生产级LLM链式引擎

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号