#数据库
bert-base-turkish-128k-uncased
土耳其BERTurk模型由德国巴伐利亚州立图书馆的MDZ团队开发,并得到土耳其NLP社区的支持。此无标记BERT模型使用包含土耳其语OSCAR语料库、维基百科、OPUS语料库及Kemal Oflazer提供的语料进行训练,总语料量为35GB。模型在Google的TPU v3-8上通过TensorFlow Research Cloud训练了200万步,词汇量为128k,目前支持PyTorch-Transformers。
prem-1B-SQL
Prem-1B-SQL是由Prem AI研发的本地化Text-to-SQL模型。拥有10亿参数,适合低GPU和量化后的CPU设备,强调数据本地储存以防数据外泄。模型在BirdBench和Spider基准数据集上的准确率分别为51.54%和85%。通过PremSQL开源库,用户可定制数据集、强化执行和评估,支持错误处理和自动修正,实现数据分析流程一体化。Prem-1B-SQL具备出色的集成和微调能力,适用于多种数据分析场景,保障查询转换的安全、准确和高效。
Fabloq
Fabloq提供低代码解决方案,通过友好的流程图界面快速构建REST API,内置数据库和仪表盘,支持高效的数据管理与应用集成,专注于功能开发而无需编写复杂代码。
Softr for Notion
利用该平台,将Notion数据库转换为客户门户、会员网站和目录等,支持无代码构建,连接账号即可快速开始,非常适合需自定义功能的用户。
typesense
Typesense是一款高性能、容错的开源搜索引擎,专注于提供卓越的搜索体验。它具有简单易用的API、智能默认配置和丰富功能,包括拼写错误容忍、实时搜索、地理搜索和向量搜索等。Typesense部署简便、易于扩展,支持多种编程语言,适合各种规模的应用。作为Algolia和ElasticSearch的替代方案,Typesense为开发者提供了快速实现高质量搜索功能的选择。
buku
buku提供命令行界面管理书签,构建个人文本网络。主要功能包括浏览器书签导入、自动抓取网页信息、编辑器操作、多种搜索选项、失效链接快照等。采用可携带合并的数据库,保护用户隐私。此外还有图形界面和浏览器插件等扩展项目。
elasticsearch-dsl-py
elasticsearch-dsl-py是一个基于官方低级客户端构建的Python高级库,旨在简化Elasticsearch查询的编写和执行。该库提供了更便捷的方式来编写和操作查询,紧密贴合Elasticsearch JSON DSL的术语和结构。它还包含一个可选的文档处理包装器,支持将文档作为Python对象进行操作,包括定义映射、检索和保存等功能。elasticsearch-dsl-py兼容多个Elasticsearch版本,并提供了丰富的示例和详细文档供参考。
vector-search-class-notes
该项目深入探讨人工智能长期记忆技术中的向量搜索和数据库应用。课程内容涵盖向量搜索的理论基础和实际实现,包括文本和图像嵌入、低维向量搜索、降维技术、近似最近邻搜索、聚类和量化等关键主题。由Pinecone创始人Edo Liberty和FAISS主要开发者Matthijs Douze等行业专家主讲,为学习者提供全面而专业的向量搜索知识。
awesome-scala
这是一个社区维护的Scala生态系统资源列表,汇集了众多实用库、框架和软件。涵盖范围广泛,从数据库访问、Web开发、测试等常用工具,到人工智能、大数据处理等前沿技术的Scala实现。该项目旨在为Scala开发者提供一个便捷的资源参考,帮助他们快速找到适合项目需求的工具,提高开发效率。