#Github
wav2vec2-large-xlsr-53-french - 法语语音识别模型实现自动语音文本转录
开源项目模型Common VoiceGithubXLSR语音识别机器学习法语Huggingface
该开源模型通过针对法语的深度训练,实现了法语语音到文本的自动转录功能。模型支持处理16kHz采样率的语音输入,在标准测试集上展现出较低的错误率。模型提供完整的使用示例和评估工具,可用于法语语音识别相关应用开发。
mpv-upscale-2x_animejanai - 实时动漫视频超分辨率增强工具
Real-ESRGANmpv视频上采样AI增强ONNX模型Github开源项目
mpv-upscale-2x_animejanai是一个基于mpv播放器的动漫视频实时超分辨率工具。它采用2x_AnimeJaNai模型,可将1080p内容实时提升至4K分辨率。该工具兼容NVIDIA、AMD和Intel Arc显卡,提供多种预设配置以平衡性能和画质,同时支持自定义设置。除了提高视频清晰度,它还能修复缩放和模糊问题,使动漫画面呈现出近似原生4K的效果。该工具集成了多种2x_AnimeJaNai模型,包括针对HD和SD动漫源的特定优化版本。用户可根据硬件性能选择不同的处理模式,实现从性能到画质的灵活平衡。此外,该项目还提供了一个配置编辑器,方便用户进行个性化调整。
Qwen2.5-14B - 基于transformer架构的多语言预训练模型 具备超长文本理解能力
Qwen2.5Github长文本理解自然语言处理Huggingface多语言支持开源项目模型大语言模型
Qwen2.5-14B是一个基于transformer架构的预训练语言模型,具备147亿参数规模。该模型在编程、数学等专业领域表现突出,支持中英法德等29种语言处理,并可处理超长文本内容。模型整合了多项技术优化,在结构化数据理解和指令执行方面表现优异,可作为各类下游AI任务的基础模型使用。
high-quality-nix-content - Nix生态系统视觉资源库:梗图、表情和壁纸集合
NixNixOS开源项目视觉内容社区贡献Github
该项目汇集了Nix和NixOS相关的高质量视觉内容,包括梗图、表情符号和壁纸。内容展现了Nix生态系统的特色和社区文化,反映了技术特点和社区创意。项目鼓励用户探索和贡献,丰富这一开源视觉资源库。提供数百种精选视觉元素,涵盖Nix核心概念、常用命令和社区梗jokes,适合Nix爱好者日常使用和分享。
gemma-2-2b-jpn-it-gguf - 基于Gemma的日语大模型跨平台量化部署版
日语语言模型llama.cppGemma模型部署GithubHuggingface量子化开源项目模型
基于Google Gemma-2-2b-jpn-it模型的量子化优化项目,通过llama.cpp、LM Studio和LLMFarm实现在Windows、Mac及iOS平台的轻量级部署。该项目遵循Gemma开源协议,提供高效的日语大模型部署解决方案。
opus-mt-th-en - 开源泰英机器翻译模型实现48.1 BLEU评分
Thai模型Tatoeba机器翻译GithubOPUSHuggingfaceEnglish开源项目
基于transformer-align架构开发的泰语到英语机器翻译模型,通过SentencePiece技术预处理数据,模型在Tatoeba测试集上达到48.1 BLEU评分和0.644 chrF值。项目支持泰语到英语的单向翻译,采用Apache-2.0许可证发布。
Moopa - 开源动漫流媒体平台 集成AniList追踪功能
Moopa动漫流媒体开源项目Next.jsAniListGithub
Moopa是一个开源的动漫流媒体平台,基于Consumet API开发。该平台提供无广告观看体验,支持AniList整合以追踪动漫进度。Moopa采用Next.js和Tailwind构建,具有现代化设计和友好界面。平台特色包括配音动画、场景搜索和漫画阅读器。此外,Moopa支持PWA和移动端响应式设计,保证快速加载和流畅体验。
Perp-Neg-stablediffusion - Perp-Neg算法突破二维扩散模型限制实现三维生成
Perp-NegStable DiffusionAI绘图图像生成3D模型Github开源项目
Perp-Neg-stablediffusion项目开发了新型负面提示算法,将二维扩散模型扩展至三维领域,缓解了Janus问题。该技术改进了Stable Diffusion的图像生成能力,并实现了三维物体生成。项目开源代码允许研究者探索Perp-Neg在图像合成和三维建模等领域的应用。
openchat-3.5-0106 - 基于Mistral的7B开源语言模型在多项测试中超越大型模型
语言模型开源项目基准测试模型人工智能GithubOpenChat开源Huggingface
OpenChat-3.5-0106是基于Mistral-7B架构开发的开源语言模型,具备编程、数学推理和对话等功能。模型支持8192上下文长度,提供编程专用和通用两种模式。在HumanEval、GSM8K等基准测试中,该模型展现出超越部分大型商业模型的性能。此外,模型还集成了实验性的评估器功能
manga-tui - 在终端中阅读和下载漫画的开源工具
Manga-tui终端漫画阅读器Rust终端图像渲染开源项目Github
manga-tui是一个基于终端的开源漫画阅读和下载工具。它提供高级搜索功能,支持在兼容图形协议的终端中直接阅读漫画,并本地存储阅读历史。该工具支持多语言设置,可轻松下载漫画。manga-tui为漫画爱好者提供了独特的命令行体验,特别适合熟悉Linux环境的用户。
mit-b1 - SegFormer分层Transformer编码器用于语义分割
机器学习图像分割GithubSegFormerHuggingface语义分割开源项目模型Transformer
mit-b1是SegFormer模型的预训练编码器,采用分层Transformer结构,在ImageNet-1k数据集上完成预训练。该模型主要用于语义分割任务的微调,可通过添加轻量级全MLP解码头实现。mit-b1在ADE20K和Cityscapes等基准测试中表现优异,为语义分割提供了高效的特征提取能力,适用于多种下游任务。
stable-diffusion-3-medium-GGUF - 高性能GGUF格式量化模型集合,支持多种精度的文生图应用
stable-diffusion-3HuggingfaceAI绘图量化模型开源项目模型GGUF模型压缩Github
该项目提供了基于Stable Diffusion 3 Medium的GGUF格式量化模型集合。包含4位至32位不同精度的版本,模型大小从4.55GB到31.5GB不等。使用stable-diffusion.cpp进行量化,可通过sd-api-server快速部署。这些模型适用于需要在各种硬件条件下平衡性能和资源的文生图应用场景。
moirai-1.0-R-base - 基于Transformer的通用时间序列预测模型
时间序列预测开源项目数据分析Moirai模型预训练模型机器学习模型GithubHuggingface
Moirai-1.0-R-base是一个基于掩码编码器的通用时间序列预测Transformer模型,在LOTSA数据集上预训练。该模型包含9100万参数,使用补丁嵌入和变量ID编码方法,可处理多变量时间序列数据进行预测。模型支持自定义预测长度和上下文窗口设置,通过uni2ts库实现部署。作为Moirai系列的中型版本,该模型在性能和计算效率方面达到平衡。
AI-Competition-Collections - 全面的AI竞赛经验和技巧开源资源集
AI比赛经验数据竞赛计算机视觉自然语言处理机器学习Github开源项目
这是一个综合性AI竞赛资源库,囊括计算机视觉、自然语言处理、语音识别等领域的比赛经验和技巧。项目汇总了顶级赛事的解决方案,同时提供竞赛平台和相关公众号信息。对AI开发者和竞赛参与者而言,此资源库提供了丰富的学习和参考材料。
DeepSeek-V2-Lite-Chat - 单卡40G部署的轻量级混合专家语言模型
开源项目深度学习模型人工智能大规模语言模型机器学习GithubDeepSeek-V2Huggingface
DeepSeek-V2-Lite采用MLA注意力机制和DeepSeekMoE架构,是一款轻量级混合专家模型。模型总参数量16B,激活参数2.4B,仅需单张40G显卡即可部署。模型支持32k上下文长度,在MMLU、C-Eval等英中文基准测试中表现优异,提供基础和对话两个版本。
EasyVtuber - 基于AI的实时虚拟形象生成工具
EasyVtuberAI虚拟主播角色脸部生成实时动画视频会议Github开源项目
EasyVtuber是一个开源的虚拟形象生成工具,利用面部特征识别和GAN技术实现实时动画效果。该项目支持在Google Meet、Zoom等视频会议平台上使用自定义卡通或漫画角色。EasyVtuber提供了详细的安装指南和自定义角色创建教程,使虚拟形象互动变得简单易用。该工具要求Python 3.8以上版本,Pytorch 1.7以上版本,并依赖pyvirtualcam、mediapipe和opencv-python等库。然而,值得注意的是,EasyVtuber在RTX 2070以下的显卡上可能无法实现实时运行。
repokemon - 融合宝可梦名称的 GitHub 仓库展示平台
RepokémonGitHub宝可梦数据抓取开源项目Github
Repokemon 是一个创新的开源项目,通过 GitHub API 搜索与宝可梦同名的仓库,并展示星标数最多的匹配结果。该项目不仅提供了一个独特的 GitHub 仓库展示平台,还包含了数据抓取、图像处理和性能优化等多个实用开发脚本。Repokemon 为开发者和宝可梦爱好者同时创造了一个有趣的交集,展示了开源社区的创造力。
qinglong_controlnet-lllite - 轻量级动漫图像控制模型集成多种处理功能
ControlNet-LLLite深度学习模型Github模型训练开源项目HuggingfaceAI绘画图像处理
ControlNet-LLLite是一套基于ControlNet架构的轻量级图像控制模型,针对动漫图像处理进行了优化。它支持动漫人物面部分割、线条提取、深度图生成和色彩重构等功能。项目提供多个预训练模型,如AnimeFaceSegment、Normal和T2i-Color,可与ComfyUI和SD-WebUI集成。这套工具适用于需要精确控制动漫图像生成和编辑的场景。
Waifu2x-GUI - 多功能动漫风格媒体放大和优化工具
Waifu2x GUI图像放大动画风格视频处理AI增强Github开源项目
Waifu2x-GUI整合了多种先进算法,用于处理动漫风格的图像、GIF和视频。提供放大、降噪、特效应用等功能,支持批量处理和自定义设置。软件界面直观,适合各层次用户使用,并具备自动更新功能。
Noromaid-13B-v0.3-GGUF - 高效本地部署的大规模语言模型GGUF量化版本,支持多种精度选项
NoromaidGithubllama.cppHuggingfaceAI推理GGUF开源项目模型量化模型
Noromaid-13B模型的GGUF量化版本提供2-8位精度选项,支持CPU和GPU部署。模型采用Alpaca提示模板,与llama.cpp等框架兼容。文件大小范围为5.43GB至13.83GB,Q4_K_M版本可实现性能与质量的平衡。模型基于cc-by-nc-4.0和Meta Llama 2许可发布。
sdxl-instructpix2pix-768 - 基于SDXL的指令式图像编辑模型
深度学习Github开源项目图像编辑模型HuggingfaceSDXL图像生成人工智能
该项目将InstructPix2Pix方法应用于Stable Diffusion XL (SDXL)模型,开发了一个能够根据文本指令精确编辑图像的AI系统。它可以执行多种图像编辑任务,如改变天空景象、转换绘画风格和调整人物年龄等。项目通过diffusers库提供简便的使用接口。作为一个实验性模型,该项目仍有优化空间,开发者欢迎用户反馈和讨论。
nakama - 开源高性能可扩展动漫社交网络平台
Nakama社交网络动漫粉丝DockerCockroachDBGithub开源项目
Nakama是一个开源的动漫爱好者社交网络平台,采用Go语言开发,结合CockroachDB和NATS技术实现高性能和可扩展性。项目包含服务器端和前端应用,支持Docker快速部署。Nakama重视数据安全,提供数据库备份功能。作为开源项目,欢迎社区参与贡献,为动漫爱好者打造专属社交空间。
anitomy - 高效智能的动漫视频文件名解析库
Anitomy文件名解析动画视频C++库命令行工具Github开源项目
Anitomy是一个专门用于解析动漫视频文件名的开源C++库和命令行工具。它能精准识别文件名中的发布组、标题、年份、集数、分辨率等多个元素。该项目采用UTF-8编码,支持Unicode文件名,并提供简洁的API接口。虽主要针对动漫,Anitomy也适用于电影、电视剧等媒体文件的解析。目前项目正在重构,将支持C++23标准,并优化接口设计。
dph-framework - LinkedIn开源的软件开发效率与幸福感评估框架
开发者生产力LinkedIn度量框架开源软件开发Github开源项目
dph-framework是LinkedIn开源的软件开发效率评估框架。该框架提供一系列文档,涵盖目标设定、指标设计、开发者画像等概念,以及数据收集和分析方法。通过该框架,团队可以更好地理解开发者需求,优化工作流程,做出数据驱动的决策,从而提升开发效率和开发者体验。框架采用CC BY 4.0许可,可供其他组织参考使用。框架包含多个独立文档,介绍了目标信号指标体系、开发者画像、数据收集原则等内容,并提供了实际的指标示例及选择原因。dph-framework鼓励社区贡献,为软件开发团队提供了一套系统化的方法来衡量和改进开发效率。
HonkaiStarRailToonShader - Unity URP星穹铁道风格卡通渲染项目
Unity卡通渲染星穹铁道ShaderURPGithub开源项目
HonkaiStarRailToonShader是一个基于Unity URP的星穹铁道风格卡通渲染项目。提供详细的安装指南和纹理设置说明,实现了自定义描边颜色和曝光控制等功能。项目融合多位开发者贡献,适用于游戏开发和MMD制作,为Unity开发者提供高质量的卡通渲染解决方案。
bash-stack - 轻量级Bash Web开发框架 助力快速构建和学习
BASH Stack快速开始开发者文档安全问题教育目的Github开源项目
bash-stack是一个基于Bash的轻量级Web开发框架,提供一键创建应用功能。该项目主要用于教育和实验目的,为开发者提供了探索Web开发的新途径。尽管存在安全隐患,不适合用于生产环境,但其简洁设计为学习和快速原型开发提供了独特视角。开发者可通过官方文档了解其工作原理。
hypertrons-crx - GitHub数据分析与可视化浏览器扩展
HyperCRXGitHub开源分析数据可视化开发者协作Github开源项目
HyperCRX浏览器扩展为GitHub页面添加数据分析仪表板,展示项目相关性网络、开发者协作网络、活跃度和OpenRank趋势。它使用OpenDigger数据,并集成OSS-GPT支持项目文档问答。这一工具有助于开源社区数字化运营,让用户更好地了解项目和开发者。
vit_base_patch32_clip_448.laion2b_ft_in12k_in1k - LAION-2B预训练的ViT图像分类模型
ImageNetGithub开源项目图像分类LAION-2BtimmHuggingface视觉Transformer模型
这是一个基于Vision Transformer架构的图像分类模型,在LAION-2B数据集预训练后在ImageNet-12k和ImageNet-1k上微调。模型包含8830万参数,支持448x448输入图像,可用于图像分类和特征提取。该模型通过timm库实现,提供简单使用示例,采用Apache-2.0许可。
SAELens - 训练和分析稀疏自编码器的开源工具
SAE Lens稀疏自编码器机械可解释性神经网络人工智能安全Github开源项目
SAELens是一个开源工具库,专注于稀疏自编码器的训练和分析。它为研究人员提供预训练模型加载、自定义训练和可视化分析功能,支持深入探索神经网络内部机制。该项目由多位贡献者维护,旨在促进机械解释性研究和人工智能安全发展。
sd-image-variations-diffusers - 基于Stable Diffusion的开源图像变体生成模型
图像变体Stable Diffusion开源项目图像生成模型人工智能HuggingfaceCLIPGithub
sd-image-variations-diffusers是一个经过微调的Stable Diffusion模型,通过CLIP图像嵌入技术实现图像变体生成。该模型集成Diffusers库,可生成高质量的图像变体,主要应用于艺术创作、教育工具和AI研究等领域。模型目前已发布V2版本,相比V1版本具有更好的图像质量和相似度表现,但在生成人脸和文字方面仍存在局限性。
whisper-large-v3-turbo - 精简版Whisper语音识别系统的突破性进展
自动语音识别语音识别Github开源项目模型多语言模型蒸馏HuggingfaceWhisper
Whisper large-v3-turbo通过模型蒸馏技术对原版Whisper进行优化,将解码层从32减少到4层,在仅造成轻微性能损失的情况下显著提升了处理速度。该模型继承了Whisper优秀的多语言处理能力,支持超过100种语言的语音识别和翻译任务,能够适应不同场景的音频输入。基于高效的架构设计,此模型在降低计算资源需求的同时保持了稳定的识别准确率。
siege - 强大的开源网站压力测试和基准测试工具
压力测试网络性能基准测试开源工具HTTP协议Github开源项目
Siege是一款开源的网站压力测试和基准测试工具,可模拟多用户并发访问单个或多个URL。它支持HTTP/1.0和1.1协议、GET和POST方法、cookies和基本认证,并提供详细的性能报告。Siege帮助开发者和系统管理员评估网站在高负载下的表现,其特点包括高度可配置、易用性和全面的数据分析。这使Siege成为网站性能评估和优化的有力工具。
opensphere - 统一的高维球面人脸识别训练评估框架
OpenSphere人脸识别深度学习超球面PyTorchGithub开源项目
OpenSphere是基于PyTorch的高维球面人脸识别库,提供统一的训练和评估框架。该项目将损失函数与其他组件解耦,支持公平比较不同损失函数。OpenSphere实现了多种先进的损失函数和网络架构,包括SphereFace系列,并集成了丰富的数据集。这一开源平台旨在为相关研究提供可复现的基准环境。
github-contributions-ios - iOS 主屏幕上的 GitHub 贡献图小部件
GitHubiOS贡献图小部件开源Github开源项目
这款 iOS 应用允许在主屏幕上展示 GitHub 贡献图,让开发者轻松追踪自己的编码活动。支持多种小部件尺寸和颜色主题,用户只需输入 GitHub 用户名即可使用。适用于 iOS 15.0 及以上版本,为开发者提供了便捷直观的方式来查看和展示 GitHub 活动,帮助他们更好地管理和展示自己的编程贡献。
Scenimefy - 半监督图像翻译实现真实风景到动漫场景的转换
Scenimefy动漫场景生成图像翻译半监督学习人工智能Github开源项目
Scenimefy项目开发了一种半监督图像翻译方法,可将真实风景照片转换为动漫场景。该方法结合了StyleGAN生成的伪配对数据集和无监督学习技术,解决了动漫数据集稀缺的问题。项目同时发布了一个包含5,958张新海诚风格动漫场景的数据集,为相关研究提供了重要资源。
Emu3-VisionTokenizer - Emu3多模态模型通过单一预测方法实现突破性能
多模态模型Github开源项目Emu3模型Huggingface图像生成视频生成人工智能
Emu3是一套创新的多模态模型,采用单一的下一个令牌预测方法进行训练。该模型将图像、文本和视频统一处理,从头训练单个Transformer模型。在生成和理解任务中,Emu3的表现超越了SDXL、LLaVA-1.6和OpenSora-1.2等知名模型,无需复杂架构。Emu3能生成高质量图像、理解视觉语言,并通过简单预测生成连贯视频,展现了多模态AI的新可能。
相关文章
Mem0: 为个性化AI打造智能记忆层
2024年08月29日
Mem0: 革新AI交互的智能记忆层
2024年08月29日
AutoGPT:开创AI代理新纪元的开源项目
2024年08月29日
Mem0: 革新个性化AI的智能记忆层
2024年08月29日
AutoGPT:开创自主AI助手的新时代
2024年08月29日
funNLP: 中文自然语言处理工具和资源大全
2024年08月29日
Streamer-Sales: 革新电商直播的AI卖货主播大模型
2024年08月29日
CycleGAN: 无配对图像到图像转换的革命性技术
2024年08月29日
NucliaDB: 专为AI搜索和RAG设计的开源向量数据库
2024年08月29日