#开源项目

whisper-large-v3-turbo - 精简版Whisper语音识别系统的突破性进展

自动语音识别语音识别Github开源项目模型多语言模型蒸馏HuggingfaceWhisper

Whisper large-v3-turbo通过模型蒸馏技术对原版Whisper进行优化，将解码层从32减少到4层，在仅造成轻微性能损失的情况下显著提升了处理速度。该模型继承了Whisper优秀的多语言处理能力，支持超过100种语言的语音识别和翻译任务，能够适应不同场景的音频输入。基于高效的架构设计，此模型在降低计算资源需求的同时保持了稳定的识别准确率。

siege - 强大的开源网站压力测试和基准测试工具

压力测试网络性能基准测试开源工具HTTP协议Github开源项目

Siege是一款开源的网站压力测试和基准测试工具，可模拟多用户并发访问单个或多个URL。它支持HTTP/1.0和1.1协议、GET和POST方法、cookies和基本认证，并提供详细的性能报告。Siege帮助开发者和系统管理员评估网站在高负载下的表现，其特点包括高度可配置、易用性和全面的数据分析。这使Siege成为网站性能评估和优化的有力工具。

opensphere - 统一的高维球面人脸识别训练评估框架

OpenSphere人脸识别深度学习超球面PyTorchGithub开源项目

OpenSphere是基于PyTorch的高维球面人脸识别库,提供统一的训练和评估框架。该项目将损失函数与其他组件解耦,支持公平比较不同损失函数。OpenSphere实现了多种先进的损失函数和网络架构,包括SphereFace系列,并集成了丰富的数据集。这一开源平台旨在为相关研究提供可复现的基准环境。

github-contributions-ios - iOS 主屏幕上的 GitHub 贡献图小部件

GitHubiOS贡献图小部件开源Github开源项目

这款 iOS 应用允许在主屏幕上展示 GitHub 贡献图，让开发者轻松追踪自己的编码活动。支持多种小部件尺寸和颜色主题，用户只需输入 GitHub 用户名即可使用。适用于 iOS 15.0 及以上版本，为开发者提供了便捷直观的方式来查看和展示 GitHub 活动，帮助他们更好地管理和展示自己的编程贡献。

Scenimefy - 半监督图像翻译实现真实风景到动漫场景的转换

Scenimefy动漫场景生成图像翻译半监督学习人工智能Github开源项目

Scenimefy项目开发了一种半监督图像翻译方法，可将真实风景照片转换为动漫场景。该方法结合了StyleGAN生成的伪配对数据集和无监督学习技术，解决了动漫数据集稀缺的问题。项目同时发布了一个包含5,958张新海诚风格动漫场景的数据集，为相关研究提供了重要资源。

Emu3-VisionTokenizer - Emu3多模态模型通过单一预测方法实现突破性能

多模态模型Github开源项目Emu3模型Huggingface图像生成视频生成人工智能

Emu3是一套创新的多模态模型,采用单一的下一个令牌预测方法进行训练。该模型将图像、文本和视频统一处理,从头训练单个Transformer模型。在生成和理解任务中,Emu3的表现超越了SDXL、LLaVA-1.6和OpenSora-1.2等知名模型,无需复杂架构。Emu3能生成高质量图像、理解视觉语言,并通过简单预测生成连贯视频,展现了多模态AI的新可能。

toru - 命令行动漫种子流媒体工具

命令行工具种子流媒体动漫搜索开源项目ToruGithub

Toru是一款面向动漫爱好者的命令行工具，支持浏览和搜索nyaa.si上的最新动漫内容。用户可通过MPV等播放器直接从命令行流式观看动漫，Toru将内容以localhost形式提供，便于访问。此工具还可作为磁力链接的种子客户端使用，支持Linux、MacOS、Android和Windows等多个平台，简化了流媒体观看和种子下载流程。

awesome-regression-testing - 视觉回归测试资源大全

视觉回归测试自动化测试浏览器自动化UI测试SeleniumGithub开源项目

awesome-regression-testing是一个综合性视觉回归测试资源库。它包含了丰富的工具、框架和在线服务信息，涵盖浏览器自动化、测试框架等多个方面。此外还收录了相关博客文章和教程。该项目适合开发人员、QA工程师和UX设计师使用，为视觉回归测试提供了全面的开源和商业解决方案参考。

densenet201.tv_in1k - DenseNet图像分类模型实现高效特征提取与精准分类

ImageNetDenseNetGithub开源项目图像分类计算机视觉Huggingface深度学习模型

DenseNet201是一个在ImageNet-1k数据集上训练的图像分类模型。该模型拥有2000万参数，支持224x224像素输入，适用于图像分类、特征图提取和图像嵌入等任务。其密集连接的卷积网络结构不仅提供准确的分类结果，还能生成丰富的特征表示。模型通过timm库提供预训练权重，便于快速部署和使用。

transformer-debugger - 深入洞察小型语言模型行为的自动化调试工具

Transformer Debugger自动可解释性稀疏自编码器语言模型神经元查看器Github开源项目

Transformer Debugger是一款由OpenAI超级对齐团队开发的工具，专门用于分析小型语言模型的特定行为。该工具结合了自动化解释技术和稀疏自编码器，无需编写代码即可快速探索模型行为。它能识别影响特定行为的关键组件，自动生成解释，并追踪组件间的连接，从而揭示神经元回路。通过支持对前向传播的干预和观察，Transformer Debugger为研究人员提供了深入分析语言模型内部机制的强大功能。

mGPT - 基于GPT架构的大规模多语种自然语言处理模型

GPTMegatron开源项目自然语言处理模型Huggingface多语言模型深度学习Github

作为一个基于GPT-3架构的多语言处理模型，mGPT具备13亿参数量，覆盖25个语系的61种语言。模型采用Wikipedia和Colossal Clean Crawled Corpus作为训练数据，结合Deepspeed与Megatron框架实现并行计算，在低资源语言处理领域达到与XGLM相当的性能水平。模型训练过程中处理了488亿UTF字符，借助256个NVIDIA V100 GPU完成了为期14天的训练。

LLM4RS - 将ChatGPT应用于推荐系统的实证研究

ChatGPT推荐系统排序策略大语言模型实验分析Github开源项目

LLM4RS项目从信息检索角度评估了ChatGPT在推荐系统中的表现。研究对比了点式、配对式和列表式排序方法，发现ChatGPT在多个领域数据集上表现突出，其中列表式排序在成本和性能间达到最佳平衡。项目还探讨了ChatGPT解决冷启动问题和提供可解释推荐的潜力。LLM4RS提供了全面的评估框架、数据集和实验结果，为研究大语言模型在推荐系统中的应用提供了重要参考。

dgs-4th-darkness-040ad-sdxl - Stable Diffusion XL模型优化动漫和小马风格图像生成

Github开源项目图像模型文生图AI绘画动画Stable DiffusionHuggingface模型

dgs-4th-darkness-040ad-sdxl是一个基于Stable Diffusion XL的文本到图像模型，专注于生成动漫和小马风格的图像。该模型由DigitalGarbage开发，旨在为创作者提供一个生成高质量动漫和小马风格插图的工具。通过文本描述，模型能够生成相应风格的图像。

github-trending-backup - GitHub热门项目自动备份与趋势追踪工具

GitHub爬虫编程语言趋势分析自动化Github开源项目

github-trending-backup是一个自动化工具，每日抓取并备份GitHub上多种编程语言的热门项目。该工具支持包括Go、Rust、Python在内的20多种编程语言，将结果以Markdown格式保存。这为开发者提供了追踪和了解技术趋势的便捷方式。通过每日更新，该项目确保开发者能及时获取GitHub上最受关注的开源项目信息。

Ensemble-Pytorch - PyTorch集成学习框架助力模型优化

Ensemble-PyTorch深度学习模型集成pytorch机器学习Github开源项目

Ensemble-Pytorch是一个为PyTorch设计的集成学习框架，旨在提高深度学习模型的性能和鲁棒性。该框架支持多种集成策略，如Fusion、Voting、Bagging和Gradient Boosting，适用于分类和回归任务。作为PyTorch生态系统的一部分，Ensemble-Pytorch提供简洁的API和详细文档，便于研究人员和开发者实现和优化集成模型。

twitter-saucenao - Twitter图片源查找开源项目

TwitterSauceNaoAPI图片源搜索开源项目Github

twitter-saucenao是一个开源的Twitter机器人项目，利用SauceNao API查找图片或动画截图的原始来源。尽管因Twitter API定价调整而停止运行，项目仍提供详细的部署指南。该工具曾为用户提供便捷的图片溯源服务，展现了技术在辅助识别和分享视觉内容方面的应用。

password-model - 基于RoBERTa的密码误报过滤分类模型

代码安全Github开源项目RoBERTaCredential Digger密码检测模型Huggingface机器学习

这个基于RoBERTa的文本分类模型为Credential Digger工具提供密码扫描误报过滤功能。该模型由SAP OSS在泄漏检测数据集上完成微调，能有效识别和过滤代码扫描中的误报密码，提升了代码安全分析的准确度。集成在Credential Digger中的这个模型简化了开发者的安全审查工作流程。

android-app - LISTEN.moe Android应用：原生开发的音乐流媒体工具

Android应用LISTEN.moe音乐流媒体开源项目移动开发Github

LISTEN.moe官方Android应用采用原生开发，集成OkHttp、Apollo和Jetpack Compose UI等技术。应用支持Android Auto和自动填充功能，提供流畅的音乐流媒体体验。项目开源且支持多语言，通过CrowdIn进行众包翻译。用户可从Google Play和F-Droid平台下载使用。

multi-hmr - 单次处理实现多人全身3D人体网格重建

人体网格重建多人检测计算机视觉深度学习Multi-HMRGithub开源项目

Multi-HMR是一种高效的单次处理模型，用于多人全身人体网格重建。该模型仅需一张RGB图像输入，即可在相机空间中重建多个人的3D模型。项目在BEDLAM、EHF等多个数据集上实现了领先性能，并提供预训练模型和演示代码，可应用于图像中的多人3D重建任务。

secretflow - 统一隐私保护数据分析与机器学习框架

SecretFlow隐私计算数据智能机器学习密码学协议Github开源项目

SecretFlow框架集成了多个隐私计算项目，包括Kuscia、SCQL和SPU等。它通过抽象设备层、设备流层、算法层和工作流层的设计，实现了对水平和垂直分区数据的高效分析。这一开源项目为隐私保护数据分析和机器学习提供了全面的技术支持，推动了隐私计算领域的发展。

mt5-xxl - 基于mC4语料库的大规模多语言文本转换模型

Github开源项目自然语言处理模型Huggingface多语言模型mT5机器学习预训练语言模型

这款由Google研发的大规模多语言预训练文本转换模型基于mC4语料库训练，覆盖101种语言。模型采用统一的文本到文本格式，在多语言自然语言处理任务中展现出优异性能。经过下游任务微调后可投入实际应用，其完整代码和模型检查点已开源，为多语言NLP研究和应用奠定基础。

AnimeDex - 基于Web技术的动漫观看项目

AnimeDexLiteGitHubTelegram动漫项目Github开源项目

AnimeDex是一个使用HTML、CSS和JavaScript开发的动漫在线观看项目。作为AnimeDex的新版本，该项目旨在提供简洁高效的观看体验。虽然AnimeDex已停止维护，但开发者推荐使用其后续版本AnimeDexLite。项目代码可在GitHub上获取，同时提供Telegram频道和群组供交流使用。

neural-engine - 如何利用Apple Neural Engine提升机器学习模型的性能以及其局限性的介绍

Neural Engine苹果机器学习NPUCore MLGithub开源项目

本页面全面介绍了如何利用Apple Neural Engine提升机器学习模型的性能，并指出其局限性。探讨NPU的工作原理，解答常见问题，解析部分Core ML模型为何无法充分利用ANE。还提供了具体设备支持列表和编程指南，帮助开发者优化模型，实现iPhone和iPad上的最佳计算性能。

pola-photo-flux - AI生成复古即时照片风格图像

Stable Diffusion人工智能艺术Flux Dev开源项目相机滤镜图像生成模型HuggingfaceGithub

pola-photo-flux是一款AI图像生成模型，基于Stable Diffusion技术开发。它能够创建具有即时照片效果的图像，模拟宝丽来等经典相机的独特风格。模型在Replicate平台上使用开源材料进行训练，并遵循Flux Dev的开源许可。使用时，只需在提示词中包含'polaroid style'即可激活特定风格。适用于多种创作场景，包括人像、自然和静物摄影等，为数字艺术创作提供了新的可能性。

Video-LLaVA-7B-hf - 基于LLM的统一视觉模型实现图像和视频的智能处理

多模态模型语言模型Github视觉识别开源项目Video-LLaVA视频分析Huggingface模型

Video-LLaVA是一个基于Vicuna-13b的开源多模态模型，通过统一的视觉表示编码器实现图像和视频内容的并行处理。该模型采用语言对齐投影方式，无需图像-视频配对数据即可完成训练。模型支持图像和视频的混合输入，可应用于内容理解、问答和描述等视觉分析任务。

Totoro - 多平台支持的动漫追踪与观看工具

Totoro动漫追踪MyAnimeListAniList视频播放Github开源项目

Totoro是一个开源的动漫追踪和观看工具，支持MyAnimeList、AniList和Simkl等平台的自动更新。该工具提供断点续播、跳过片头和Discord Rich Presence等功能。Totoro还包括季度新番列表和个人观看列表管理，方便用户管理观看进度。该工具注重用户体验，同时尊重内容提供方权益。

tartarus-startpage - 可自定义的多功能浏览器起始页

Tartarus-startpageGitHub项目自定义起始页开源软件网页设计Github开源项目

Tartarus-startpage是一个基于JavaScript开发的开源浏览器起始页项目，源于Dawn项目并进行了功能扩展。它具有多标签页布局、时钟和天气组件、快速链接等功能，并支持本地图标加载。用户可通过配置对话框自定义界面，使用搜索对话框访问多个搜索引擎。该项目提供多种动画横幅、键盘快捷键和鼠标操作，创造了实用且可个性化的浏览器起始页体验。

ChatTTS.Site - 开源对话文本转语音系统ChatTTS使用指南

AI工具ChatTTS语音合成对话系统开源项目多语言支持

ChatTTS.Site为开发者提供ChatTTS开源文本转语音项目的综合指南。网站详细介绍了ChatTTS的核心功能，如逼真语音生成和中英双语支持，并提供本地部署、Colab运行和Hugging Face部署等多种使用教程。网站还包含常见问题解答，帮助用户深入理解ChatTTS技术。对于需要在对话场景中实现高质量语音合成的开发者和研究人员，这是一个实用的资源平台。

Qwen2.5-Coder-7B-Instruct-GGUF - 深度学习模型的多规格量化版本适配不同硬件和性能要求

大语言模型开源项目GGUFQwen2.5-Coder-7B-Instruct模型Huggingface量化Githubllama.cpp

本项目为Qwen2.5-Coder-7B-Instruct模型提供了从15GB到2.78GB的多种量化版本。采用llama.cpp最新技术，包括K-quants和I-quants两种量化方案，并针对ARM架构优化。用户可根据设备内存容量和性能需求选择适合版本。各版本保留原始模型核心功能，适用于多种部署场景。

desktop - 跨平台图形界面HTTP客户端工具

HTTPieAPI调试工具桌面应用跨平台自动更新Github开源项目

HTTPie Desktop是一款跨平台HTTP客户端工具，为Mac、Windows和Linux系统提供图形界面。该工具支持自动更新，简化了API测试、调试和Web服务交互过程。开发者和IT专业人士可通过官方网站或GitHub releases页面下载安装，Linux版本需使用AppImageLauncher。HTTPie Desktop是HTTPie项目的桌面版本，为用户提供了命令行之外的另一种选择。

bart-paraphrase - BART大型语言模型文本释义转换工具

开源项目自然语言处理模型文本生成模型微调HuggingfaceBART机器翻译Github

BART文本释义模型基于序列到序列架构开发,整合了BERT双向编码器与GPT单向解码器技术,通过Quora、PAWS和MSR数据集训练,实现文本的变换与释义功能。模型提供简洁的API接口,便于集成到自然语言处理应用中。

iso8583 - Go语言实现的ISO 8583金融交易报文处理库

ISO8583Go金融交易报文解析开源项目Github

iso8583是一个Go语言实现的ISO 8583报文处理库,支持自定义规范、构建解析报文和检查字段。该项目经过实际环境验证,可靠稳定。它简化了银行交易处理功能的开发和集成。这个高性能、可扩展且易用的库适用于处理卡交易、转账、查询等多种金融交易报文。

Juggernaut_final - 人工智能文生图模型能力展示

AI绘图Stable Diffusion开源项目图像生成模型人工智能HuggingfaceCivitAIGithub

这是一个基于Stable Diffusion的图像生成模型，通过Hugging Face API提供服务。项目展示了多组样本图像，包括API调用生成的图像和原作者的演示作品。该模型已在CivitAI平台发布，可供查看详细信息和使用说明。

llvm-project - 开源编译器基础设施和工具链

LLVM编译器基础设施Clang中间表示代码优化Github开源项目

LLVM是一个开源编译器基础设施项目，提供用于构建优化编译器和工具链的框架。核心组件包括LLVM后端、Clang前端、libc++标准库和LLD链接器。LLVM支持多种编程语言，提供中间表示处理和代码生成工具。项目致力于提高编译效率和代码性能，为开发者提供灵活的编译工具集。LLVM广泛应用于编译器开发、静态分析和运行时优化等领域。

AssetCatalogTinkerer - 优化iOS应用资源目录图像的查看与导出工具

Asset Catalog Tinkerer资源目录图像查看导出功能QuickLook插件Github开源项目

AssetCatalogTinkerer是一款专为iOS应用开发设计的工具，用于打开和查看资源目录文件(.car)。它可以显示和导出目录中的图像，支持单个或批量操作。该工具集成了QuickLook插件，实现资源目录的快速预览。此外，AssetCatalogTinkerer还能读取主题存储文件，方便查看UI组件资源。这个工具能够提高开发者和设计师的工作效率。

obsidian-media-db-plugin - Obsidian多源媒体信息导入插件

Obsidian插件媒体数据库API查询模板Github开源项目

obsidian-media-db-plugin是一款Obsidian插件，支持从多个API查询并导入电影、剧集、动漫、游戏、音乐和维基文章等信息。插件功能包括标题和ID搜索、自定义模板、批量导入和元数据字段自定义。它集成了Jikan、OMDb、MusicBrainz等多个API，为Obsidian用户提供了便捷的媒体信息管理功能。

相关文章

Article Cover

Visual-Chinese-LLaMA-Alpaca 学习资料汇总 - 多模态中文大语言模型

Article Cover

LLM-groundedDiffusion学习资料汇总 - 用大语言模型增强文本到图像扩散模型的提示理解

Article Cover

awesome-llm-agents学习资料汇总 - 大语言模型智能体精选列表

Article Cover

ChatLLM学习资料汇总 - 轻松玩转LLM兼容OpenAI与LangChain

Article Cover

ollama-grid-search学习资料汇总-自动化评估和比较LLM模型的桌面应用

Article Cover

awesome-llm-role-playing-with-persona学习资料汇总 - 大语言模型角色扮演与人格赋予技术综述

Article Cover

NeMo-Curator学习资料汇总 - GPU加速的大语言模型数据处理工具包

Article Cover

pykoi-rlhf-finetuned-transformers学习资料汇总 - 开源RLHF统一接口

Article Cover

ChainFury入门指南 - 开源生产级LLM链式引擎

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号