#开源项目
vaporetto - 基于点预测的高效日语分词工具
Vaporetto分词器Rust模型训练标签预测Github开源项目
Vaporetto是一款基于点预测的日语分词工具,具有高速和轻量级的特点。它提供Rust API和命令行界面,支持使用预训练模型、转换KyTea模型或自定义训练。Vaporetto的分词速度比KyTea快8.7倍,性能卓越。此外,它还具备词性和发音标注功能,并允许通过词典编辑优化分词结果。作为一个高效可靠的解决方案,Vaporetto适用于各种日语自然语言处理任务。
Anya_v2-MD - 多设备兼容的开源WhatsApp机器人框架
Anya_v2WhatsApp机器人多设备开源项目PikaBotzGithub
Anya_v2-MD是一个开源的多设备WhatsApp机器人框架。它支持QR码扫描和配对码配置,可部署于Railway、Replit和Koyeb等平台。该框架由PikaBotz开发,提供插件基础修改功能,适合开发者构建WhatsApp机器人。项目遵循严格的使用条款,仅供合法用途。
depth_anything_vits14 - 大规模无标签数据训练的开源深度估计工具
图像处理计算机视觉开源项目模型深度估计Depth Anything深度感知GithubHuggingface
Depth Anything是一个基于ViT-L/14架构的深度估计模型,通过大规模无标签数据训练。模型提供Python接口,支持518x518分辨率的图像深度估计,具备良好的泛化能力。采用模块化设计,支持自定义图像预处理和批量处理功能,可集成到现有项目中。研究人员和开发者可通过Hugging Face平台快速部署使用。
twitter-roberta-base-offensive - 基于roBERTa的推特攻击性语言识别模型
推特数据开源项目模型情感分析文本分类GithubroBERTa自然语言处理Huggingface
这是一个基于roBERTa-base的模型,通过5800万条推文训练并使用TweetEval基准进行微调,专门用于识别攻击性语言。该模型能对文本进行预处理和分类,区分攻击性和非攻击性内容。它采用了自然语言处理技术,可作为社交媒体平台的内容审核工具。模型支持Python环境下的使用,能够输出文本的攻击性概率评分。
deepsnap - 高效灵活的图神经网络库 支持异构图和标准化流程
DeepSNAP图深度学习NetworkXPyTorch Geometric异构图Github开源项目
DeepSNAP是一个专为图神经网络设计的Python库,连接NetworkX和PyTorch Geometric,提供灵活的图操作和标准化流程。它支持高效的图操作和转换、异构图处理,并提供数据集分割、负采样等功能。DeepSNAP的API易于使用,适用于节点分类、链接预测和图分类等多种图学习任务。
Polygonization-by-Frame-Field-Learning - 航拍图像建筑物轮廓提取新方法
建筑物分割框架场学习多边形化语义分割计算机视觉Github开源项目
Frame Field Learning项目提出新方法从航拍图像提取建筑物多边形轮廓。该方法在图像分割神经网络中加入框架场输出,提高分割质量并为多边形化提供结构信息。项目在CVPR 2021发表,开源代码、模型和数据集,在航拍图像建筑物分割任务中达到最先进水平。
wav2vec2-large-xlsr-53-french - 法语语音识别模型实现自动语音文本转录
开源项目模型Common VoiceGithubXLSR语音识别机器学习法语Huggingface
该开源模型通过针对法语的深度训练,实现了法语语音到文本的自动转录功能。模型支持处理16kHz采样率的语音输入,在标准测试集上展现出较低的错误率。模型提供完整的使用示例和评估工具,可用于法语语音识别相关应用开发。
mpv-upscale-2x_animejanai - 实时动漫视频超分辨率增强工具
Real-ESRGANmpv视频上采样AI增强ONNX模型Github开源项目
mpv-upscale-2x_animejanai是一个基于mpv播放器的动漫视频实时超分辨率工具。它采用2x_AnimeJaNai模型,可将1080p内容实时提升至4K分辨率。该工具兼容NVIDIA、AMD和Intel Arc显卡,提供多种预设配置以平衡性能和画质,同时支持自定义设置。除了提高视频清晰度,它还能修复缩放和模糊问题,使动漫画面呈现出近似原生4K的效果。该工具集成了多种2x_AnimeJaNai模型,包括针对HD和SD动漫源的特定优化版本。用户可根据硬件性能选择不同的处理模式,实现从性能到画质的灵活平衡。此外,该项目还提供了一个配置编辑器,方便用户进行个性化调整。
Qwen2.5-14B - 基于transformer架构的多语言预训练模型 具备超长文本理解能力
Qwen2.5Github长文本理解自然语言处理Huggingface多语言支持开源项目模型大语言模型
Qwen2.5-14B是一个基于transformer架构的预训练语言模型,具备147亿参数规模。该模型在编程、数学等专业领域表现突出,支持中英法德等29种语言处理,并可处理超长文本内容。模型整合了多项技术优化,在结构化数据理解和指令执行方面表现优异,可作为各类下游AI任务的基础模型使用。
high-quality-nix-content - Nix生态系统视觉资源库:梗图、表情和壁纸集合
NixNixOS开源项目视觉内容社区贡献Github
该项目汇集了Nix和NixOS相关的高质量视觉内容,包括梗图、表情符号和壁纸。内容展现了Nix生态系统的特色和社区文化,反映了技术特点和社区创意。项目鼓励用户探索和贡献,丰富这一开源视觉资源库。提供数百种精选视觉元素,涵盖Nix核心概念、常用命令和社区梗jokes,适合Nix爱好者日常使用和分享。
gemma-2-2b-jpn-it-gguf - 基于Gemma的日语大模型跨平台量化部署版
日语语言模型llama.cppGemma模型部署GithubHuggingface量子化开源项目模型
基于Google Gemma-2-2b-jpn-it模型的量子化优化项目,通过llama.cpp、LM Studio和LLMFarm实现在Windows、Mac及iOS平台的轻量级部署。该项目遵循Gemma开源协议,提供高效的日语大模型部署解决方案。
opus-mt-th-en - 开源泰英机器翻译模型实现48.1 BLEU评分
Thai模型Tatoeba机器翻译GithubOPUSHuggingfaceEnglish开源项目
基于transformer-align架构开发的泰语到英语机器翻译模型,通过SentencePiece技术预处理数据,模型在Tatoeba测试集上达到48.1 BLEU评分和0.644 chrF值。项目支持泰语到英语的单向翻译,采用Apache-2.0许可证发布。
Moopa - 开源动漫流媒体平台 集成AniList追踪功能
Moopa动漫流媒体开源项目Next.jsAniListGithub
Moopa是一个开源的动漫流媒体平台,基于Consumet API开发。该平台提供无广告观看体验,支持AniList整合以追踪动漫进度。Moopa采用Next.js和Tailwind构建,具有现代化设计和友好界面。平台特色包括配音动画、场景搜索和漫画阅读器。此外,Moopa支持PWA和移动端响应式设计,保证快速加载和流畅体验。
Perp-Neg-stablediffusion - Perp-Neg算法突破二维扩散模型限制实现三维生成
Perp-NegStable DiffusionAI绘图图像生成3D模型Github开源项目
Perp-Neg-stablediffusion项目开发了新型负面提示算法,将二维扩散模型扩展至三维领域,缓解了Janus问题。该技术改进了Stable Diffusion的图像生成能力,并实现了三维物体生成。项目开源代码允许研究者探索Perp-Neg在图像合成和三维建模等领域的应用。
openchat-3.5-0106 - 基于Mistral的7B开源语言模型在多项测试中超越大型模型
语言模型开源项目基准测试模型人工智能GithubOpenChat开源Huggingface
OpenChat-3.5-0106是基于Mistral-7B架构开发的开源语言模型,具备编程、数学推理和对话等功能。模型支持8192上下文长度,提供编程专用和通用两种模式。在HumanEval、GSM8K等基准测试中,该模型展现出超越部分大型商业模型的性能。此外,模型还集成了实验性的评估器功能
manga-tui - 在终端中阅读和下载漫画的开源工具
Manga-tui终端漫画阅读器Rust终端图像渲染开源项目Github
manga-tui是一个基于终端的开源漫画阅读和下载工具。它提供高级搜索功能,支持在兼容图形协议的终端中直接阅读漫画,并本地存储阅读历史。该工具支持多语言设置,可轻松下载漫画。manga-tui为漫画爱好者提供了独特的命令行体验,特别适合熟悉Linux环境的用户。
mit-b1 - SegFormer分层Transformer编码器用于语义分割
机器学习图像分割GithubSegFormerHuggingface语义分割开源项目模型Transformer
mit-b1是SegFormer模型的预训练编码器,采用分层Transformer结构,在ImageNet-1k数据集上完成预训练。该模型主要用于语义分割任务的微调,可通过添加轻量级全MLP解码头实现。mit-b1在ADE20K和Cityscapes等基准测试中表现优异,为语义分割提供了高效的特征提取能力,适用于多种下游任务。
stable-diffusion-3-medium-GGUF - 高性能GGUF格式量化模型集合,支持多种精度的文生图应用
stable-diffusion-3HuggingfaceAI绘图量化模型开源项目模型GGUF模型压缩Github
该项目提供了基于Stable Diffusion 3 Medium的GGUF格式量化模型集合。包含4位至32位不同精度的版本,模型大小从4.55GB到31.5GB不等。使用stable-diffusion.cpp进行量化,可通过sd-api-server快速部署。这些模型适用于需要在各种硬件条件下平衡性能和资源的文生图应用场景。
moirai-1.0-R-base - 基于Transformer的通用时间序列预测模型
时间序列预测开源项目数据分析Moirai模型预训练模型机器学习模型GithubHuggingface
Moirai-1.0-R-base是一个基于掩码编码器的通用时间序列预测Transformer模型,在LOTSA数据集上预训练。该模型包含9100万参数,使用补丁嵌入和变量ID编码方法,可处理多变量时间序列数据进行预测。模型支持自定义预测长度和上下文窗口设置,通过uni2ts库实现部署。作为Moirai系列的中型版本,该模型在性能和计算效率方面达到平衡。
AI-Competition-Collections - 全面的AI竞赛经验和技巧开源资源集
AI比赛经验数据竞赛计算机视觉自然语言处理机器学习Github开源项目
这是一个综合性AI竞赛资源库,囊括计算机视觉、自然语言处理、语音识别等领域的比赛经验和技巧。项目汇总了顶级赛事的解决方案,同时提供竞赛平台和相关公众号信息。对AI开发者和竞赛参与者而言,此资源库提供了丰富的学习和参考材料。
DeepSeek-V2-Lite-Chat - 单卡40G部署的轻量级混合专家语言模型
开源项目深度学习模型人工智能大规模语言模型机器学习GithubDeepSeek-V2Huggingface
DeepSeek-V2-Lite采用MLA注意力机制和DeepSeekMoE架构,是一款轻量级混合专家模型。模型总参数量16B,激活参数2.4B,仅需单张40G显卡即可部署。模型支持32k上下文长度,在MMLU、C-Eval等英中文基准测试中表现优异,提供基础和对话两个版本。
EasyVtuber - 基于AI的实时虚拟形象生成工具
EasyVtuberAI虚拟主播角色脸部生成实时动画视频会议Github开源项目
EasyVtuber是一个开源的虚拟形象生成工具,利用面部特征识别和GAN技术实现实时动画效果。该项目支持在Google Meet、Zoom等视频会议平台上使用自定义卡通或漫画角色。EasyVtuber提供了详细的安装指南和自定义角色创建教程,使虚拟形象互动变得简单易用。该工具要求Python 3.8以上版本,Pytorch 1.7以上版本,并依赖pyvirtualcam、mediapipe和opencv-python等库。然而,值得注意的是,EasyVtuber在RTX 2070以下的显卡上可能无法实现实时运行。
repokemon - 融合宝可梦名称的 GitHub 仓库展示平台
RepokémonGitHub宝可梦数据抓取开源项目Github
Repokemon 是一个创新的开源项目,通过 GitHub API 搜索与宝可梦同名的仓库,并展示星标数最多的匹配结果。该项目不仅提供了一个独特的 GitHub 仓库展示平台,还包含了数据抓取、图像处理和性能优化等多个实用开发脚本。Repokemon 为开发者和宝可梦爱好者同时创造了一个有趣的交集,展示了开源社区的创造力。
qinglong_controlnet-lllite - 轻量级动漫图像控制模型集成多种处理功能
ControlNet-LLLite深度学习模型Github模型训练开源项目HuggingfaceAI绘画图像处理
ControlNet-LLLite是一套基于ControlNet架构的轻量级图像控制模型,针对动漫图像处理进行了优化。它支持动漫人物面部分割、线条提取、深度图生成和色彩重构等功能。项目提供多个预训练模型,如AnimeFaceSegment、Normal和T2i-Color,可与ComfyUI和SD-WebUI集成。这套工具适用于需要精确控制动漫图像生成和编辑的场景。
Waifu2x-GUI - 多功能动漫风格媒体放大和优化工具
Waifu2x GUI图像放大动画风格视频处理AI增强Github开源项目
Waifu2x-GUI整合了多种先进算法,用于处理动漫风格的图像、GIF和视频。提供放大、降噪、特效应用等功能,支持批量处理和自定义设置。软件界面直观,适合各层次用户使用,并具备自动更新功能。
Noromaid-13B-v0.3-GGUF - 高效本地部署的大规模语言模型GGUF量化版本,支持多种精度选项
NoromaidGithubllama.cppHuggingfaceAI推理GGUF开源项目模型量化模型
Noromaid-13B模型的GGUF量化版本提供2-8位精度选项,支持CPU和GPU部署。模型采用Alpaca提示模板,与llama.cpp等框架兼容。文件大小范围为5.43GB至13.83GB,Q4_K_M版本可实现性能与质量的平衡。模型基于cc-by-nc-4.0和Meta Llama 2许可发布。
sdxl-instructpix2pix-768 - 基于SDXL的指令式图像编辑模型
深度学习Github开源项目图像编辑模型HuggingfaceSDXL图像生成人工智能
该项目将InstructPix2Pix方法应用于Stable Diffusion XL (SDXL)模型,开发了一个能够根据文本指令精确编辑图像的AI系统。它可以执行多种图像编辑任务,如改变天空景象、转换绘画风格和调整人物年龄等。项目通过diffusers库提供简便的使用接口。作为一个实验性模型,该项目仍有优化空间,开发者欢迎用户反馈和讨论。
nakama - 开源高性能可扩展动漫社交网络平台
Nakama社交网络动漫粉丝DockerCockroachDBGithub开源项目
Nakama是一个开源的动漫爱好者社交网络平台,采用Go语言开发,结合CockroachDB和NATS技术实现高性能和可扩展性。项目包含服务器端和前端应用,支持Docker快速部署。Nakama重视数据安全,提供数据库备份功能。作为开源项目,欢迎社区参与贡献,为动漫爱好者打造专属社交空间。
anitomy - 高效智能的动漫视频文件名解析库
Anitomy文件名解析动画视频C++库命令行工具Github开源项目
Anitomy是一个专门用于解析动漫视频文件名的开源C++库和命令行工具。它能精准识别文件名中的发布组、标题、年份、集数、分辨率等多个元素。该项目采用UTF-8编码,支持Unicode文件名,并提供简洁的API接口。虽主要针对动漫,Anitomy也适用于电影、电视剧等媒体文件的解析。目前项目正在重构,将支持C++23标准,并优化接口设计。
dph-framework - LinkedIn开源的软件开发效率与幸福感评估框架
开发者生产力LinkedIn度量框架开源软件开发Github开源项目
dph-framework是LinkedIn开源的软件开发效率评估框架。该框架提供一系列文档,涵盖目标设定、指标设计、开发者画像等概念,以及数据收集和分析方法。通过该框架,团队可以更好地理解开发者需求,优化工作流程,做出数据驱动的决策,从而提升开发效率和开发者体验。框架采用CC BY 4.0许可,可供其他组织参考使用。框架包含多个独立文档,介绍了目标信号指标体系、开发者画像、数据收集原则等内容,并提供了实际的指标示例及选择原因。dph-framework鼓励社区贡献,为软件开发团队提供了一套系统化的方法来衡量和改进开发效率。
HonkaiStarRailToonShader - Unity URP星穹铁道风格卡通渲染项目
Unity卡通渲染星穹铁道ShaderURPGithub开源项目
HonkaiStarRailToonShader是一个基于Unity URP的星穹铁道风格卡通渲染项目。提供详细的安装指南和纹理设置说明,实现了自定义描边颜色和曝光控制等功能。项目融合多位开发者贡献,适用于游戏开发和MMD制作,为Unity开发者提供高质量的卡通渲染解决方案。
bash-stack - 轻量级Bash Web开发框架 助力快速构建和学习
BASH Stack快速开始开发者文档安全问题教育目的Github开源项目
bash-stack是一个基于Bash的轻量级Web开发框架,提供一键创建应用功能。该项目主要用于教育和实验目的,为开发者提供了探索Web开发的新途径。尽管存在安全隐患,不适合用于生产环境,但其简洁设计为学习和快速原型开发提供了独特视角。开发者可通过官方文档了解其工作原理。
hypertrons-crx - GitHub数据分析与可视化浏览器扩展
HyperCRXGitHub开源分析数据可视化开发者协作Github开源项目
HyperCRX浏览器扩展为GitHub页面添加数据分析仪表板,展示项目相关性网络、开发者协作网络、活跃度和OpenRank趋势。它使用OpenDigger数据,并集成OSS-GPT支持项目文档问答。这一工具有助于开源社区数字化运营,让用户更好地了解项目和开发者。
vit_base_patch32_clip_448.laion2b_ft_in12k_in1k - LAION-2B预训练的ViT图像分类模型
ImageNetGithub开源项目图像分类LAION-2BtimmHuggingface视觉Transformer模型
这是一个基于Vision Transformer架构的图像分类模型,在LAION-2B数据集预训练后在ImageNet-12k和ImageNet-1k上微调。模型包含8830万参数,支持448x448输入图像,可用于图像分类和特征提取。该模型通过timm库实现,提供简单使用示例,采用Apache-2.0许可。
SAELens - 训练和分析稀疏自编码器的开源工具
SAE Lens稀疏自编码器机械可解释性神经网络人工智能安全Github开源项目
SAELens是一个开源工具库,专注于稀疏自编码器的训练和分析。它为研究人员提供预训练模型加载、自定义训练和可视化分析功能,支持深入探索神经网络内部机制。该项目由多位贡献者维护,旨在促进机械解释性研究和人工智能安全发展。
sd-image-variations-diffusers - 基于Stable Diffusion的开源图像变体生成模型
图像变体Stable Diffusion开源项目图像生成模型人工智能HuggingfaceCLIPGithub
sd-image-variations-diffusers是一个经过微调的Stable Diffusion模型,通过CLIP图像嵌入技术实现图像变体生成。该模型集成Diffusers库,可生成高质量的图像变体,主要应用于艺术创作、教育工具和AI研究等领域。模型目前已发布V2版本,相比V1版本具有更好的图像质量和相似度表现,但在生成人脸和文字方面仍存在局限性。
相关文章
Visual-Chinese-LLaMA-Alpaca 学习资料汇总 - 多模态中文大语言模型
2 个月前
LLM-groundedDiffusion学习资料汇总 - 用大语言模型增强文本到图像扩散模型的提示理解
2 个月前
awesome-llm-agents学习资料汇总 - 大语言模型智能体精选列表
2 个月前
ChatLLM学习资料汇总 - 轻松玩转LLM兼容OpenAI与LangChain
2 个月前
ollama-grid-search学习资料汇总-自动化评估和比较LLM模型的桌面应用
2 个月前
awesome-llm-role-playing-with-persona学习资料汇总 - 大语言模型角色扮演与人格赋予技术综述
2 个月前
NeMo-Curator学习资料汇总 - GPU加速的大语言模型数据处理工具包
2 个月前
pykoi-rlhf-finetuned-transformers学习资料汇总 - 开源RLHF统一接口
2 个月前
ChainFury入门指南 - 开源生产级LLM链式引擎
2 个月前