#开源项目

starcoder2 - 先进的多语言代码生成模型家族
StarCoder 2代码生成模型机器学习自然语言处理大规模语言模型Github开源项目
StarCoder2是一系列代码生成模型,包括3B、7B和15B参数规模。模型在600多种编程语言和自然语言文本上训练,使用分组查询注意力机制,具有16,384个token的上下文窗口。支持代码补全、多GPU部署和量化推理,提供使用说明和微调指南。StarCoder2在代码生成任务中表现优异,是开发者的有力工具。
HanLP - 面向多语种的生产环境自然语言处理工具,支持PyTorch与TensorFlow
HanLP自然语言处理多语种PyTorchTensorFlowGithub开源项目
HanLP是一款面向生产环境的多语种自然语言处理工具,基于PyTorch和TensorFlow双引擎。支持130种语言和多种NLP任务,包括分词、词性标注、命名实体识别和依存句法分析等。HanLP的预训练模型持续更新,并提供RESTful API和native API,适用于敏捷开发和移动应用。
rasa - 开源框架Rasa,便捷实现文本与语音对话自动化
Rasa开源对话机器人机器学习自动化Github开源项目
Rasa 是开源的机器学习框架,用于自动化处理文本和语音对话。支持在Facebook Messenger、Slack、Google Hangouts、Microsoft Bot Framework 等平台上构建上下文助手,以及创建Alexa Skills 和Google Home Actions等语音助手。Rasa 的助手能够进行层次化对话,利用上下文实现有意义的交流和可扩展的对话能力。
monitors4codegen - Monitor-Guided Decoding提升代码生成模型性能
Monitor-Guided Decoding静态分析代码生成Language Server Protocol多语言支持Github开源项目
Monitor-Guided Decoding (MGD)是一种创新的代码生成方法,利用静态分析指导语言模型解码。该方法无需额外训练即可提高350M至175B参数规模模型生成代码的编译成功率。项目提供多语言静态分析工具multilspy,支持Java、Rust、C#和Python代码分析,并包含数据集、评估脚本和推理结果,便于复现研究成果。
epic-awesome-gamer - 免费游戏自动领取工具,轻松获取Epic Store每周免费游戏
Epic Store免费游戏hcaptcha-challengerDocker游戏领取Github开源项目
Epic 免费人是一款专注于帮助玩家自动领取Epic Store每周免费游戏的工具。内置AI模块hcaptcha-challenger,可以处理人机验证挑战。支持多用户持久化和Docker开发,目前正在开发滚动升级和Epicgames DLC等功能。
Deep-Tab-Search - Chrome标签页内容深度搜索工具
Chrome扩展标签页搜索开源软件浏览器工具Deep Tab SearchGithub开源项目
Deep-Tab-Search是一个Chrome扩展,用于搜索所有打开标签页的内容。它具备网页搜索、跳转到搜索词、关闭标签页等功能,并根据访问时间和相关性排序结果。这个扩展简单易用,提高了标签页管理和内容检索效率。
intellij-sdk-code-samples - IntelliJ Platform SDK插件开发代码示例库
IntelliJ Platform插件开发代码示例JetBrainsSDKGithub开源项目
intellij-sdk-code-samples是一个综合的IntelliJ Platform SDK插件开发代码示例库。该项目包含多个实用示例,涉及动作实现、检查工具、意图操作、编辑器API等多个方面,展示了插件功能的工作原理。这些示例有助于开发者深入理解SDK核心功能,为创建自己的插件项目提供参考。项目采用Gradle构建系统,主要配置存储在plugin.xml文件中。每个示例都是独立的项目,可通过Gradle runIde任务运行。这种结构使开发者能够方便地学习和实践各种插件开发技术。
logdy-core - 轻量级终端日志实时监控工具 支持浏览器查看无需安装
Logdy日志查看终端工具Web界面命令行工具Github开源项目
Logdy是一款轻量级终端日志查看工具,支持通过Web浏览器实时监控和分析日志。它以单一二进制文件形式存在,无需安装即可使用,本地运行保证数据安全。Logdy具备日志解析、过滤和可视化功能,适合开发者和系统管理员使用。此外,Logdy可作为Go库集成到应用中,为日志管理提供灵活方案。
spring-cloud-openfeign - 声明式REST客户端优化微服务间通信
Spring CloudFeignMavenRESTJavaGithub开源项目
Spring Cloud OpenFeign 是一个声明式REST客户端,为微服务架构中的服务间通信提供简便解决方案。开发者可通过JAX-RS或Spring MVC注解创建接口的动态实现,简化服务调用。项目支持Java 17,使用Maven构建,提供文档和贡献指南,适合需要高效微服务通信的开发团队。
logback - 高性能Java日志框架
logback日志库JavaEE版本构建Github开源项目
Logback是一款开源的Java日志框架,以可靠性、通用性和高性能著称。它提供1.3.x版本支持Java EE,1.4.x版本支持Jakarta EE,满足不同环境需求。Logback特点包括灵活配置、快速日志处理和详尽文档,适用于各类Java应用。该项目重视社区贡献,欢迎开发者参与改进。
onnx-go - 面向Go语言的ONNX模型解析和运行接口
ONNXGorgonia深度学习Go语言神经网络Github开源项目
onnx-go项目提供了一个Go语言接口,用于解析和运行ONNX二进制模型,帮助开发者轻松集成机器学习功能。虽然其API仍然是实验性的,但它不需要数据科学方面的专业知识。该项目已停止维护,且随着深度学习领域的发展,预计会被新的解决方案取代。
spring-data-mongodb - 简化Spring应用中MongoDB数据访问的框架
Spring Data MongoDB数据库集成文档数据库数据访问层Spring框架Github开源项目
Spring Data MongoDB是一个为Spring应用提供MongoDB集成的框架。它采用熟悉的Spring编程模型,简化MongoDB文档数据库的操作。主要特点包括基于POJO的文档交互和便捷的repository式数据访问。该框架使开发者能够轻松构建MongoDB驱动的Spring应用,同时保留MongoDB的独特功能。
rocketmq-spring - Apache RocketMQ与Spring Boot的轻量级集成框架
RocketMQ-Spring消息中间件Spring Boot集成Apache项目分布式消息系统Github开源项目
RocketMQ-Spring是一个Apache RocketMQ与Spring Boot的集成框架。该项目支持多种消息发送模式,包括同步、异步、单向、有序、批量、事务和定时消息。它还提供并发和有序消息消费功能,以及消息追踪、认证授权和请求-响应模式等高级特性。RocketMQ-Spring为开发者提供了简单高效的RocketMQ与Spring Boot整合方案。
java-sec-code - Java安全漏洞学习与实践平台
Java安全漏洞代码安全测试代码审计Web安全Github开源项目
java-sec-code是一个开源的Java安全漏洞学习项目,涵盖了命令注入、CORS、反序列化等多种Web安全漏洞示例。项目不仅提供详细的漏洞描述和修复方案,还支持Docker、IDEA等多种运行环境。适合开发者深入学习Java安全编程,提高代码安全性。
MOFA-Video - 可控图像动画图像到视频扩散模型
MOFA-Video图像动画混合控制ECCV 2024生成模型Github开源项目
MOFA-Video项目采用稀疏到稠密运动生成和基于流的运动适配技术,能通过轨迹、关键点序列及其组合等多种控制信号将单张图像转化为动画。最新更新包括关键点面部图像动画的推理脚本和轨迹图像动画的训练代码。该项目即将亮相ECCV 2024,并提供多个演示和检查点,便于用户测试和使用。访问项目页面了解更多详情和效果展示。
aws-lambda-developer-guide - AWS Lambda开发指南资源库 策略、应用和模板
AWS Lambda开发者指南云计算无服务器架构代码示例Github开源项目
AWS Lambda开发者指南资源库提供了跨服务使用案例的示例权限策略、Lambda服务和托管运行时的示例应用程序,以及创建函数和VPC网络资源的CloudFormation模板。这些资源旨在帮助开发者理解和实施Lambda功能,支持无服务器应用开发。
x-file-storage - 跨平台一站式文件存储框架
X-File-Storage文件存储多平台支持开源项目dromaraGithub
x-file-storage是一个开源的文件存储框架,支持本地存储及多种云存储平台。框架提供统一的API接口,实现文件上传、下载、删除等基础功能。同时支持文件迁移、图片处理、大文件分片上传等高级特性。x-file-storage可以轻松集成到Spring Boot等Java项目中,为开发者提供灵活且可扩展的文件存储解决方案。
etherpad-lite - 开源实时协作网页编辑平台
实时协作编辑器开源项目插件系统多语言支持Docker部署Github
Etherpad是一个开源的实时协作网页编辑平台,支持数千用户同时在线编辑。该平台提供完整的数据导出功能,可在自有服务器上运行,确保用户对数据的完全控制。Etherpad支持丰富的插件扩展,适用于多种协作编辑场景。它还提供HTTP API和jQuery插件,便于与其他Web应用集成。
tessdoc - 多语言支持的开源文字识别引擎
TesseractOCR文字识别开源软件机器学习Github开源项目
Tesseract是一款功能强大的开源OCR引擎,支持100多种语言和35种以上的文字。它提供命令行和API接口,可从图像中精确提取文本。Tesseract采用LSTM神经网络技术,具有高度可定制性,并配备完善的训练测试工具。该引擎可跨平台使用,包括移动设备,为开发者提供了灵活的文字识别解决方案。
nokhwa - Rust跨平台网络摄像头库简单易用
Rust摄像头跨平台视频捕捉开源库Github开源项目
nokhwa是一个跨平台Rust网络摄像头库,支持Linux、Windows、Mac和Web浏览器。它提供多种后端如Video4Linux、MSMF和AVFoundation,实现帧捕获、设备查询和图像解码等功能。nokhwa通过高级API和低级访问,结合灵活的特性配置,使开发者能够便捷地创建摄像头应用。
crawlee-python - Python网络爬虫和浏览器自动化库
Crawlee网络爬虫自动化Python数据抓取Github开源项目
Crawlee是一个Python网络爬虫和浏览器自动化库,为HTTP和无头浏览器爬取提供统一接口。它支持自动并行爬取、错误重试和代理轮换等功能,具有简洁的API设计和完整的类型提示。基于Asyncio构建,Crawlee适用于各种网页爬取场景,从静态HTML到动态JavaScript网站均可高效处理。
DependencyCheck - 开源项目依赖漏洞检测工具
依赖检查安全分析漏洞检测开源软件OWASPGithub开源项目
DependencyCheck是一款开源的软件组成分析工具,专门用于检测项目依赖中的已知漏洞。通过识别依赖项的CPE标识符,它能生成包含相关CVE链接的报告。该工具支持Maven、Gradle和Ant等多种构建系统,提供命令行接口和Jenkins插件。DependencyCheck使用NVD API获取漏洞数据,建议使用API密钥来提升性能。
bug - 互联网资源收集工具 真实性需自行判断
互联网资源内容真实性可靠性收集自用信息声明Github开源项目
该项目为互联网资源收集工具,汇集网络流传的各类信息。平台不保证内容真实性和可靠性,仅供个人参考。用户需自行判断信息可信度,谨慎使用。项目不进行内容宣传,仅作为个人资源收集工具。
cook - 开源智能居家烹饪助手
菜谱开源项目Cook网页应用PWAGithub
Cook是一个开源的居家烹饪指导项目,专为特殊时期设计。提供网页版和PWA应用,支持材料有限情况下的智能菜谱搜索。用户可通过cook.yunyoujun.cn访问,获取多样化菜谱并参与投稿。项目注重实用性和易用性,致力于在有限条件下提升烹饪体验。支持中文环境,不提供英文翻译。
llm-compressor - 开源大型语言模型压缩优化库
LLM Compressor量化模型优化vllmHugging FaceGithub开源项目
llm-compressor是一个专注于大型语言模型优化和压缩的开源库。它提供全面的量化算法集,支持权重和激活量化,并与Hugging Face模型和仓库无缝集成。该项目采用safetensors文件格式,确保与vllm兼容,同时通过accelerate支持大规模模型处理。llm-compressor涵盖多种量化格式和算法,包括激活量化、混合精度和稀疏化技术,为模型优化提供灵活多样的选择。
anthropic-cookbook - Claude AI 应用开发实用指南与代码集
Anthropic CookbookClaudeAPI开发者资源AI助手Github开源项目
Anthropic-cookbook 项目是一个开源资源库,为开发者提供了丰富的代码示例和指南,用于构建基于Claude AI的应用。项目涵盖工具集成、检索增强生成、引用管理、子代理和嵌入等主题,并包含视觉处理、PDF解析和自动评估等功能。作为一个社区驱动的项目,它旨在为AI应用开发提供全面的参考资料。
MiniChain - MiniChain 简化大语言模型编程的轻量级库
MiniChain语言模型提示链PythonOpenAIGithub开源项目
MiniChain是一个轻量级的大语言模型编程库,通过简洁的API简化AI开发过程。它支持Python函数注释、链式调用、模板系统和可视化功能,便于实现复杂AI任务。MiniChain兼容OpenAI、Hugging Face和Google Search等多种后端,提供灵活选择。该库可用于实现检索增强QA、记忆型聊天和信息提取等多种AI应用,以简洁代码完成各种流行方法。
v2ray-agent - 多核心多协议代理脚本,实现高效安全的网络环境
Xray-coresing-box一键脚本VPS代理协议Github开源项目
v2ray-agent是一款多功能一键式脚本,集成Xray-core和sing-box核心。支持VLESS、VMess、Trojan等多协议,提供无域名搭建、多种分流解锁、自动证书申请、订阅管理等功能。脚本操作简便,可快速部署安全稳定的代理服务。定期更新维护,适用于构建个人网络环境。
lede - 多架构支持的OpenWrt定制固件
Lean LEDEOpenWrt软路由编译指南固件开发Github开源项目
LEDE是一个基于OpenWrt的开源项目,专注于为国产龙芯和飞腾架构开发路由器固件。项目提供完整的R23源代码和跨平台编译支持,包括Linux、WSL和macOS。LEDE拥有活跃的技术社区和软路由资源,适合固件开发爱好者和OpenWrt学习者。项目以安全性为重,不含任何后门,是值得信赖的开源固件方案。
proxy-list - 自动更新的高可用性代理服务器列表
代理列表代理检查VPSJSONGeoLite2Github开源项目
proxy-list 项目提供自动更新的代理服务器列表。该项目利用 monosans/proxy-scraper-checker 工具,每小时在 VPS 上验证代理可用性,并以 JSON 格式呈现详细信息。项目基于 MIT 许可证,集成了 MaxMind 的 GeoLite2 数据。这一资源为需要稳定代理服务的开发和研究工作提供了便利。
pluggy - 轻量级且高效的插件框架
pluggy插件系统Python钩子规范钩子实现Github开源项目
pluggy是一个简洁的插件系统框架,被pytest、tox和devpi等项目采用。它提供钩子规范和实现机制,支持插件开发和管理。开发者可通过pluggy构建可扩展的应用程序架构,实现模块化和可插拔的功能。该项目易用高效,文档完善,适合构建插件生态系统。
Feeder - Android开源RSS阅读器 无需账号保护隐私
FeederRSS阅读器Android应用开源软件离线阅读Github开源项目
Feeder是一款Android平台的开源RSS阅读器,支持RSS/Atom/JSONFeed格式。应用无需账号注册,完全本地运行,保障用户数据私密性。功能包括离线阅读、通知推送、OPML导入导出等,界面采用Material设计。
Images-to-PDF - 多功能图片转PDF工具 - 高效安卓应用
图片转PDFAndroid应用PDF处理文件转换开源项目Github
Images-to-PDF是一款多功能Android应用,专注于图片到PDF的转换和处理。该应用支持从相机或图库选择多张图片,快速合并为PDF文件。除基本转换功能外,它还提供PDF查看、编辑、加密、压缩、合并、拆分等实用工具。应用界面简洁,支持多种主题,操作直观。无论是日常使用还是工作需求,Images-to-PDF都能高效处理各类PDF相关任务。作为开源项目,它为Android用户提供了全面的PDF处理解决方案,适合各类用户使用的实用PDF工具。
pdfminer.six - Python开源PDF文本提取与分析库
pdfminer.sixPDF解析文本提取Python库文档分析Github开源项目
pdfminer.six是一个开源Python库,用于从PDF文档中提取和分析文本数据。该库能够提取文本内容及其位置、字体和颜色信息,支持PDF-1.7规范、CJK语言和垂直书写。pdfminer.six还可提取图像、目录和交互式表单,支持多种压缩和加密方式。其模块化设计便于扩展,适用于多种PDF分析场景。该项目是PDFMiner的社区维护分支,提供了全面的PDF文档分析功能。
whois - 直接查询和解析域名WHOIS信息的Python模块
PythonWHOIS域名TLD解析器Github开源项目
python-whois是一个Python模块,用于直接查询WHOIS服务器并解析域名信息。支持多种顶级域名,提供包括域名创建日期、过期日期在内的结构化WHOIS数据。该模块安装简便,适合开发者将WHOIS查询功能集成到项目中。
Qwen2 - 阿里巴巴推出多语言大规模语言模型 支持128K上下文
Qwen2大语言模型自然语言处理人工智能模型训练Github开源项目
Qwen2是阿里巴巴发布的大规模语言模型系列,规模从0.5B到72B不等。支持27种语言,在编码和数学等领域表现优异。Qwen2-7B-Instruct和Qwen2-72B-Instruct模型的上下文长度达128K,显著增强长文本处理能力。项目提供多种部署选项,包括本地运行和规模化推理,并支持模型量化和微调。