#开源项目

clangir - 融合Clang与优化IR的编译器基础设施
ClangIRCIR编程工具编译器基础设施软件开发Github开源项目
ClangIR是一个开源的C++编译器基础设施项目,结合了Clang前端和优化的中间表示(IR)设计。该项目致力于提高代码分析和转换效率,适用于编译器开发和性能优化领域。ClangIR的灵活架构支持高效的代码处理流程,为开发者提供了强大的工具。详细信息、构建指南和文档可在clangir.org获取。
EEVE-Korean-Instruct-10.8B-v1.0 - 韩语大语言模型EEVE-Korean-Instruct-10.8B采用DPO技术优化指令理解
Github开源项目模型语言模型多语言韩语HuggingfaceEEVE机器学习
EEVE-Korean-Instruct-10.8B-v1.0是一个针对韩语优化的大语言模型。该模型基于SOLAR-10.7B扩展韩语词汇表,并使用DPO技术进行指令微调。在多项基准测试中,模型平均得分达66.48分。训练数据包括韩语翻译版的SlimOrca-Dedup和ultrafeedback数据集。项目提供了API使用说明和模型评估结果,适用于需要高性能韩语语言处理的应用场景。
eigenfish - 矩阵特征值分布的可视化分析工具
Eigenfish计算发现Jupyter矩阵数学Github开源项目
Eigenfish是一个专注于矩阵特征值分布可视化和分析的开源项目。该项目结合了计算发现和交互式可视化技术,为研究人员和数学爱好者提供了一个探索复杂矩阵行为的平台。通过Eigenfish,用户可以直观地观察和分析不同类型矩阵的特征值模式,从而为数学研究和教育领域提供新的见解。
tracr - 开源编译器实现RASP程序到Transformer权重的转换
TracrRASPtransformer编译器解释性Github开源项目
tracr是一个开源编译工具,可将RASP程序转换为Transformer权重。它通过追踪程序、推断基向量和中间表示,最终生成Haiku模型。tracr支持类别和数值表示,使用BOS标记实现多种操作,并探索了残差流压缩嵌入。研究人员可以利用tracr编译RASP程序,查看中间激活值,深入分析模型行为,为Transformer可解释性研究提供实验平台。
GoBigger - 基于Agar规则的多智能体决策模拟环境
GoBigger多智能体游戏环境强化学习合作竞争Github开源项目
GoBigger是一个基于Agar游戏规则的多智能体决策模拟环境。该环境支持多队伍、多智能体的合作竞争策略研究,具有可扩展性、复杂的观察空间和丰富的动作空间。GoBigger模拟了团队合作和小范围内的激烈竞争,为游戏AI开发和多智能体系统研究提供了实验平台。
xcit_nano_12_p8_224.fb_in1k - 基于跨协方差转换器的轻量级图像分类模型
ImageNetGithub开源项目图像分类计算机视觉Huggingface神经网络深度学习模型
xcit_nano_12_p8_224.fb_in1k采用跨协方差图像转换器(XCiT)架构,是一个参数量为3.0M的轻量级图像分类模型。模型在ImageNet-1k数据集上完成预训练,支持224x224尺寸的图像输入,可应用于图像分类和特征提取。模型通过跨协方差注意力机制降低计算复杂度,适合实际部署应用。
Senpwai - 高效动漫批量下载与自动追踪更新桌面工具
Senpwai动漫下载桌面应用自动更新开源软件Github开源项目
Senpwai是一款专为动漫爱好者设计的桌面应用程序。该工具支持从Animepahe和Gogoanime批量下载动漫,并能自动追踪更新剧集。用户可选择下载整季或指定范围的剧集,提供多种视频质量和字幕选项。应用具备智能下载管理功能,避免重复下载,同时提供图形界面和命令行两种操作方式,满足不同需求。
noUiSlider - 轻量级JavaScript滑动条 支持触控和无障碍访问
noUiSliderJavaScript滑块跨浏览器兼容响应式设计开源项目Github
noUiSlider是一款轻量级JavaScript滑动条库,支持无障碍访问和多点触控。它具有GPU加速动画,适配现代浏览器,无依赖且响应式。该开源项目提供丰富文档,可免费用于个人和商业项目,持续更新以提供高性能、易用的滑动条解决方案。
maccarone - Python代码的AI辅助管理工具
MaccaroneAI编程Python代码生成VS Code扩展Github开源项目
Maccarone是一个Python工具,允许开发者将代码特定部分交由AI管理。它通过注释指定需AI填充的代码块,支持VS Code扩展和命令行使用。该工具利用GPT-4自动生成和更新代码,提高编程效率。Maccarone为Python项目开发提供了AI辅助编程方式,适用于多种开发场景。使用Maccarone需要OpenAI API密钥,每次预处理源文件时会产生API调用费用。费用与完成代码的大小成正比,小型源模块的处理成本约为0.01-0.10美元。
OpenUSD - 跨平台3D场景描述与交互系统
Universal Scene Description3D场景描述图形应用互操作跨平台支持开源项目Github
OpenUSD是一个开源的3D场景描述系统,用于创作、读取和传输时间采样场景数据。该系统支持Linux、Windows和macOS平台,并可嵌入iOS和visionOS应用。OpenUSD包含核心库、成像组件和Python绑定,通过build_usd.py脚本可快速构建。它为图形应用程序间的数据交换提供了高效可扩展的解决方案。
faster-whisper-medium - CTranslate2优化的Whisper medium模型支持多语言音频处理
Github模型转换CTranslate2开源项目模型HuggingfaceWhisper机器翻译语音识别
这是OpenAI Whisper medium模型的CTranslate2优化版本,支持100多种语言的音频转录和识别。模型采用float16量化,通过faster-whisper库易于集成。它具有高效的推理速度和较小的内存占用,适合快速、准确处理多语言音频的应用场景。用户可根据需求调整计算类型,平衡性能和资源消耗。该模型为开发者提供了灵活、高效的多语言音频处理解决方案。
Anikin - 多平台无广告流媒体应用 支持在线观看和下载
Anikin多平台应用流媒体下载软件开源项目Github
Anikin是一款跨平台流媒体应用,提供无广告的观看和下载体验。该应用支持搜索、浏览最新和热门内容、观看电影等功能,并可添加收藏。Anikin具备自动画质调节、在线同步功能,以及解析网站数据和过滤所需信息的独特特性。无需注册即可使用,目前支持Android和Windows平台。作为开源项目,欢迎开发者参与贡献,持续更新中。
metricgan-plus-voicebank - 基于MetricGAN+的开源语音增强模型实现PESQ 3.15分及STOI 93.0分
Github开源项目语音增强PyTorchMetricGANSpeechBrainHuggingfaceVoicebank模型
MetricGAN+是一个基于SpeechBrain框架开发的语音增强模型,在Voicebank-DEMAND数据集测试中达到PESQ 3.15分和STOI 93.0分。模型支持16kHz采样率音频处理,提供Python接口实现音频降噪和质量优化。项目开源,可用于语音处理和音频增强等应用场景。
srs - 开源实时流媒体服务器 支持多协议多平台
SRS流媒体服务器实时视频开源多协议支持Github开源项目
SRS是一款开源的实时流媒体服务器,支持RTMP、WebRTC、HLS、HTTP-FLV和SRT等多种协议。它可在Linux、Windows和macOS等平台上运行,具有易用、高效和功能丰富等特点。SRS提供集群部署、HTTP API、DVR和转码等高级功能,采用MIT许可证发布。该项目适用于构建各类流媒体和实时通信系统。
Rombos-LLM-V2.6-Qwen-14b-Q8_0-GGUF - GGUF格式量化版大语言模型支持本地化高性能部署
Github开源项目代码部署llama.cppRombos-LLM模型转换GGUFHuggingface模型
本项目是Rombos-LLM-V2.6-Qwen-14b模型的GGUF格式版本,专为llama.cpp框架优化。提供详细的本地部署指南,包括brew安装和源码编译方法,支持命令行和服务器运行模式。基于transformers库开发,采用Apache-2.0许可证,适合需要在本地环境高效运行大型语言模型的应用场景。
ipatool - 多平台命令行 iOS 应用下载工具
IPATooliOS应用App Store命令行工具ipa文件Github开源项目
ipatool 是一个开源的命令行工具,用于搜索和下载 App Store 上的 iOS 应用 ipa 文件。支持 Windows、Linux 和 macOS 系统,提供认证、搜索、购买和下载功能。该工具使用 Go 语言开发,操作简洁,适用于开发者和普通用户。ipatool 为 iOS 应用获取和管理提供了一个跨平台的解决方案。
any-parser - 将非结构化数据转换为结构化格式的精确API解析工具
AnyParserAPI数据提取PDF处理结构化数据Github开源项目
AnyParser作为一款专业的API工具,可将PDF、图像和图表等非结构化数据精确转换为结构化格式。该工具支持从PDF提取文本及布局,从图像中提取表格数据,并能将结果转换为Markdown格式。AnyParser具有简便的安装过程和API密钥配置,并提供了详尽的使用示例。这使得AI工程师和金融分析师能够高效处理各种复杂的数据提取任务。
MEEE - 模型集成探索与利用强化学习算法
MEEE强化学习模型集成MuJoCo代码复现Github开源项目
MEEE是一个开源项目,提出了基于模型集成的探索与利用方法,旨在提高强化学习的样本效率。该项目基于MBPO代码库开发,实现了相关论文中的实验。MEEE提供了详细的安装说明、使用指南和日志记录方法,支持在MuJoCo环境中进行实验。通过创新的模型集成策略,MEEE平衡了探索和利用,有效提升了强化学习算法的性能和效率。
bloomz-7b1 - 突破性的多语言开源预训练语言模型
开源项目bloomz语言生成自然语言处理模型人工智能多语言模型HuggingfaceGithub
bloomz-7b1是一个开源的多语言预训练模型,拥有70亿参数,集成了40余种自然语言和13种编程语言的处理能力。该模型基于text-generation技术,可用于自然语言推理、程序合成和句子完成等任务,在跨语言处理领域具有广泛应用价值。作为一个功能强大的多语言NLP工具,bloomz-7b1为研究人员和开发者提供了丰富的语言处理资源。
AgentGym - 多环境下的广泛能力AI智能体进化平台
AgentGym高质量轨迹集基准套件自我进化方法人工智能Github开源项目
AgentGym是一个框架,通过多种交互环境和统一任务格式,协助科研人员评估和开发具备广泛能力的语言模型智能体。平台支持实时反馈和并发操作,包含14种环境,如网页导航、文字游戏和家务任务。核心组成包括高质量的轨迹集AgentTraj和基准测试套件AgentEval,并提出了智能体自我进化方法AgentEvol。实验结果显示,进化后的智能体可与当前最先进的模型媲美。
b-parasite - 开源多功能环境传感器 支持蓝牙和Zigbee通信
b-parasite土壤湿度传感器开源硬件蓝牙低功耗物联网Github开源项目
b-parasite是一款开源环境监测设备,集成土壤湿度、空气温湿度和光线传感器。设备基于nRF52840或nRF52833模块,支持蓝牙低功耗和Zigbee通信协议,可与Home Assistant等智能家居系统无缝集成。项目提供多种固件示例,包括BLE广播和Zigbee通信。此外,还包含3D打印外壳设计和详细文档,便于用户自行组装和定制。
miyako - 开源多功能Discord机器人 增强社区互动
MiyakoDiscord机器人开源项目Node.jsJavaScriptGithub
Miyako是一个开源的Discord机器人项目,目前正在重写和开发中。该机器人提供多样化的命令和功能,旨在增强Discord社区互动。Miyako支持简单部署和自定义,可满足不同服务器的需求。项目欢迎贡献者参与改进和扩展功能。
Sequoia - 可扩展、稳定且硬件感知的推断系统环境
Sequoiaspeculative decodingLlamagrowmap接受率向量Github开源项目
Sequoia项目提供了可扩展、稳定且硬件感知的推断系统环境,支持Llama系列模型,灵活调整温度和Top-p参数,并提供详细的实验再现指南。通过pip命令简便地设置环境,使用bash脚本进行测试,调整示例数量和随机种子来重现结果。Sequoia还具备生成接收率向量和生成树结构图的工具,满足各类实验需求。未来计划包括支持更多开源模型、多轮对话、INT4/8量化以及多GPU功能。
NyarchLinux - 基于ArchLinux的动漫爱好者Linux发行版
NyarchLinuxLinux发行版Arch Linux动漫迷GNOME桌面Github开源项目
NyarchLinux是基于ArchLinux和EzArcher构建的Linux发行版,专为动漫爱好者设计。该系统预装漫画阅读器,提供触屏友好界面,保留了ArchLinux的可定制性和滚动更新特性。目前采用GNOME桌面环境,未来计划支持Hyprland和KDE Plasma。NyarchLinux是一个开源项目,欢迎社区贡献,特别是在开发其他桌面环境版本方面。值得注意的是,NyarchLinux主要用于娱乐目的,不建议作为日常主力系统使用。
cockroach - 分布式SQL数据库为现代数据应用提供高扩展性
CockroachDB分布式数据库SQL数据库云原生水平扩展Github开源项目
CockroachDB是一款分布式SQL数据库,专为构建和管理现代数据密集型应用设计。它支持水平扩展、高可用性和强一致性ACID事务。CockroachDB提供熟悉的SQL接口,结合了事务性和强一致性的键值存储,为数据管理提供可靠高效的解决方案。其特点包括最小化延迟中断和无需人工干预的自动化运维。
tf_efficientnet_l2.ns_jft_in1k - EfficientNet架构的大规模图像识别与特征提取模型
ImageNetGithub开源项目图像分类EfficientNetHuggingface神经网络深度学习模型
基于EfficientNet架构开发的图像分类模型,采用Noisy Student半监督学习方法,结合ImageNet-1k和JFT-300m数据集进行训练。模型支持800x800分辨率输入,包含4.8亿参数,可用于图像分类、特征提取和嵌入向量生成。借助timm库实现模型的快速部署,适用于各类图像识别任务。
Automail - 多功能浏览器扩展为Anilist.co增添新特性
Automailanilist.co浏览器扩展用户脚本开源软件Github开源项目
Automail是为Anilist.co开发的开源浏览器扩展。它提供通知管理、统计分析、界面美化、导航优化和多语言UI翻译等功能。该扩展可用于Firefox和支持用户脚本的浏览器,为动漫和漫画爱好者提供了额外的Anilist.co使用选项。Automail是一个基于GNU通用公共许可证的开源项目,欢迎社区贡献。
Gender-Classification - DistilBERT微调模型实现高精度性别分类
数据分类模型训练开源项目模型性别识别Huggingface深度学习GithubDistilBERT
Gender-Classification是一个基于distilbert-base-uncased模型微调的性别分类项目。模型经过5轮训练,在验证集上达到了接近100%的分类准确率。项目采用Adam优化器和线性学习率调度器,学习率为2e-05。模型基于Transformers 4.25.1和PyTorch 1.13.0框架开发,为性别识别任务提供了一个参考实现。
TextRecognitionDataGenerator - 多语言文本识别数据生成工具
TextRecognitionDataGeneratorOCR图像生成文本识别合成数据Github开源项目
TextRecognitionDataGenerator是一款开源的文本识别数据生成工具。支持多种语言如拉丁文、中文和日文等,可自定义字体、背景、文本扭曲和模糊效果。工具提供命令行界面和Python模块,便于集成到训练流程中。适用于OCR和文本识别模型的数据集制作,支持手写体文本生成功能。
ombre-v3-sdxl - 文本生成图像技术与动漫美学的全新融合应用
AI绘图Stable Diffusion开源项目模型Huggingface人物角色Github动漫艺术创作
ombre-v3-sdxl是基于Stable Diffusion XL的文本生成图像模型,专注于创造动漫和美学风格的图像。该模型融合多种艺术风格,适合生成独特的角色和艺术作品。通过文本描述,它能生成高质量、富有艺术感的图像,可应用于动漫创作、游戏设计等领域。模型由qelt开发,基于merges模型构建,遵循FAIPL-1.0-SD许可协议。
CrystalReality - 融合写实与艺术风格的开源图像生成模型
GithubCrystal Reality开源项目人物写实模型融合AI绘画HuggingfaceStable Diffusion模型
CrystalReality是基于CrystalClearRemix和RealisticVision 1.2合并开发的开源图像生成模型。通过特定的模型权重配比,结合了写实风格和艺术效果。该模型在人物肖像生成方面表现突出,能够输出细节丰富的面部特征,并支持多种场景创作,包括时尚人像和自然风光等。
blip2-itm-vit-g - 基于Transformers的图像文本匹配模型
模型训练环境影响Github开源项目模型卡片模型Huggingfacetransformers机器学习
BLIP2-ITM-ViT-G是一个基于Transformers架构的多模态模型,专门用于图像-文本匹配任务。该模型使用ViT-G作为视觉编码器,通过预训练实现图像与文本之间的语义关系理解和匹配。它可直接应用于图文相关性判断,也可作为下游任务的基础模型进行微调,适用于图像检索、跨模态搜索等应用场景。
pumpkin-book - 西瓜书公式详解与机器学习理论补充
机器学习西瓜书南瓜书周志华公式推导Github开源项目
南瓜书是一个开源项目,对周志华《机器学习》(西瓜书)中的复杂公式进行解析和补充。项目提供详细的公式推导过程,帮助读者理解机器学习核心概念。包含在线阅读、PDF下载和视频教程,适合深入学习机器学习理论的读者。由数学基础扎实的贡献者编写,旨在提升机器学习学习者的理论水平。
nheko - 原生桌面体验的Matrix聊天客户端
NhekoMatrix聊天应用桌面客户端端到端加密Github开源项目
nheko是一款基于Matrix协议的原生桌面客户端应用,旨在提供类似主流聊天软件的使用体验。它支持端到端加密、VoIP通话、用户注册和房间管理等核心功能。nheko采用简洁的界面设计,支持多种主题,并允许用户自定义表情和贴纸。此外,nheko还提供D-Bus API接口,支持与第三方插件集成,增强了应用的灵活性和功能性。
imgutils - 全面的动漫图像处理Python库 集成多种AI技术
imgutils图像处理动漫风格Python库深度学习Github开源项目
imgutils是一个功能丰富的Python库,专为动漫风格图像处理而设计。该库集成了多种先进AI模型,提供差分检测与聚类、角色图像预训练、物体检测、线稿生成等功能。此外,imgutils还支持单色图像检测、图像分级、标签生成和截断图像检查等实用工具。这些功能使其成为处理动漫图像数据集和进行图像分析的理想选择。
opus-mt-gem-gem - 多语言Transformer机器翻译模型 支持日耳曼语系互译
BLEU评分语言对开源项目模型Huggingface翻译模型测试集gem-gemGithub
OPUS-MT-GEM是一个基于Transformer架构的开源机器翻译模型,专注于28种日耳曼语系语言的互译需求。该模型通过SentencePiece技术进行文本预处理,采用32k规模词表,支持德语、英语、荷兰语等主流日耳曼语系语言。在WMT新闻翻译测试集上,英德互译的BLEU评分达到30分以上,展现出可靠的翻译能力。模型需要在输入句子开头添加目标语言标识符以指定翻译方向。