Project Icon

top_1m_domains

全球百万热门域名数据集,多源替代Alexa

top_1m_domains项目集合了多个权威来源的前100万域名数据,包括Cisco Umbrella、Majestic和BuiltWith等。作为Alexa.com服务的替代,该项目提供免费下载的域名列表,为网络分析、市场研究和SEO优化领域提供了全面的网站排名信息。通过整合多方数据,该项目使研究者能够更便捷地获取和分析全球顶级域名的最新趋势。

ChineseWebText - 大规模中文网络文本数据集及其评估工具链
ChineseWebTextGithub开源项目数据评估模型网页文本处理自然语言处理高质量中文数据集
ChineseWebText是一个大规模中文网络文本数据集,总容量达1.42TB,每条文本均附带质量评分。该项目还提供了一个600GB的高质量子集,文本质量均超过90%。项目包含EvalWeb工具链,用于从原始网络数据中提取优质中文文本。EvalWeb通过数据准备、预处理和BERT评估模型对文本质量进行筛选和评估。此外,项目还开发了基于FastText的快速分类器,在保持性能的同时提高了处理效率。
ai.robots.txt - 开源AI爬虫屏蔽列表助力保护网站内容
AI爬虫GithubLLM训练robots.txt开源列表开源项目网站屏蔽
ai.robots.txt是一个开源项目,提供AI公司和大语言模型训练相关的网络爬虫屏蔽列表。项目鼓励用户贡献并实施,包含爬虫详情、FAQ、更新订阅和滥用报告渠道。此外还提供Nginx和Apache等屏蔽教程,帮助网站管理员有效保护内容。
best-of-web-python - Python Web开发优质开源库大全
GitHubGithubPythonWeb开发开源库开源项目框架
这是一个汇集Python Web开发优秀开源库的列表,收录580个项目,总星数达300万,涵盖26个类别。项目根据质量评分排序,评分基于GitHub和包管理器的多项指标。内容包括Web框架、HTTP客户端、服务器、认证授权、HTML处理等多个领域,为开发者提供全面的资源参考。
www.mlcompendium.com - 机器学习与深度学习资源大全,免费公开,便于学习与作者互动
CompendiumDeep LearningGitBookGitHubGithubMachine Learning开源项目
项目为免费非营利教育工具,包含约500个机器学习及深度学习主题,如算法、特征选择、深度学习、NLP、音频处理等,帮助用户节省搜索时间,连接优秀作者。项目持续更新,支持社区贡献,致力于知识共享和教育普及。
awesome-materials-informatics - 材料信息学全面资源集锦 助力数据驱动材料研究
Github开源软件开源项目数据科学机器学习材料信息学计算材料学
本资源列表汇集了材料信息学领域的软件工具、云平台、数据集和标准化倡议。内容涵盖开源与商业解决方案,聚焦材料模拟、数据挖掘和机器学习等关键技术。研究人员可借此快速了解行业动态,为数据驱动的材料科学研究提供参考。
awesome-ublacklist - uBlacklist优质订阅列表 屏蔽低质搜索结果
GithubuBlacklist开源项目搜索结果屏蔽浏览器扩展网站过滤订阅列表
awesome-ublacklist项目收集了多个优质的uBlacklist订阅列表,涵盖社交媒体、开发者内容、购物等多个类别。这些列表可用于屏蔽Google、Bing和DuckDuckGo搜索结果中的低质量网站,提升搜索体验。用户通过订阅这些列表可快速构建个性化的搜索结果过滤规则。
awesome-intelligence - 综合性网络安全情报资源集合
Exploit ObserverGithub人工智能开源项目情报漏洞网络安全
Awesome Intelligence 汇集了多种网络安全情报资源,涵盖漏洞利用、恶意软件分析、网络攻击、地缘政治等领域。项目整合了 Exploit Observer 漏洞数据库和 AI 驱动的漏洞咨询系统等工具。这些资源为安全研究人员和专业人士提供了深入了解和应对网络威胁的重要信息,有助于更全面地把握网络安全态势。
awesome-security - 网络安全资源与开源工具精选
Github入侵检测安全监控开源项目漏洞扫描网络安全蜜罐系统
该项目汇集了丰富的网络安全资源,包括开源软件、库、文档和书籍等。内容涵盖网络、终端、威胁情报、社会工程等多个领域,并细分为扫描、监控、入侵检测、蜜罐等子类别。这一全面的资源库可为安全从业者提供有价值的参考,有助于提升网络防御能力。
open-speech-corpora - 开放语料库整理助力语音技术研究与发展
CC-0许可Common VoiceGithub多语言开放语音语料库开源项目语音技术
open-speech-corpora项目为语音技术研究和开发提供了一个丰富的开放语料库清单。这些语料库多为免费并在创意共享许可证或社区数据许可协议下发布,方便研究和商业使用。它覆盖多种语言和超过2万小时的验证语音数据,是学者和开发者理想的数据资源。项目鼓励社区成员提出资源增补,以进一步完善数据库。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号