SQLCoder-7B-2 项目介绍
SQLCoder-7B-2 是一个由 Defog, Inc. 开发的功能强大的大型语言模型,专门用于自然语言到 SQL 的生成。这个模型是在 CodeLlama-7B 的基础上进行微调而来,旨在帮助非技术用户理解 SQL 数据库中的数据,为用户提供一个便捷的分析工具。
模型特点
SQLCoder-7B-2 具有以下特点:
- 专注于文本到 SQL 的转换
- 采用 CC-by-SA-4.0 许可证
- 基于 Transformers 库构建
- 支持文本生成管道
模型用途
该模型主要用于以下场景:
- 帮助非技术用户理解 SQL 数据库中的数据
- 作为分析工具,而非数据库管理工具
- 仅适用于具有只读访问权限的用户
值得注意的是,该模型并未经过训练以拒绝来自具有写入权限用户的恶意请求,因此应仅限于只读访问权限的用户使用。
如何使用
要开始使用 SQLCoder-7B-2,用户可以参考 GitHub 上提供的代码。为了获得最佳结果,建议使用以下提示模板:
### Task
Generate a SQL query to answer [QUESTION]{user_question}[/QUESTION]
### Database Schema
The query will run on a database with the following schema:
{table_metadata_string_DDL_statements}
### Answer
Given the database schema, here is the SQL query that [QUESTION]{user_question}[/QUESTION]
[SQL]
同时,建议设置 do_sample=False
和 num_beams=4
以获得最佳效果。
模型评估
SQLCoder-7B-2 在 Defog 开发的基于 PostgreSQL 的评估框架 SQL-Eval 上进行了测试。评估结果显示,该模型在各类 SQL 查询任务中表现出色:
- 日期操作:96% 正确率
- 分组操作:91.4% 正确率
- 排序操作:94.3% 正确率
- 比率计算:91.4% 正确率
- 连接操作:94.3% 正确率
- 条件筛选:77.1% 正确率
这些结果表明,SQLCoder-7B-2 在处理各种 SQL 查询任务时具有较高的准确性和可靠性。
最新更新
值得一提的是,该模型的权重于 2024 年 2 月 7 日进行了更新。新的模型权重大大提高了性能,特别是在处理连接操作方面。如果用户在此日期之前下载了模型,建议重新下载权重以获得最佳性能。
获取途径
interested用户可以通过以下渠道获取和了解 SQLCoder-7B-2:
- HuggingFace 模型库
- GitHub 代码仓库
- Defog 官方演示网站
如果用户对模型有任何疑问或需要进一步的信息,可以通过 Twitter 或电子邮件联系 Defog 团队。