deepseek-math-7b-instruct - 深度数学推理的开源解决方案

deepseek-math-7b-instruct项目介绍

项目简介

deepseek-math-7b-instruct是一个高级数学推理模型项目，该项目由DeepSeek团队开发，旨在提升数学问题的解答能力。在复杂数学问题的求解上，它能够帮助用户一步步推导出结论，并最终生成准确的答案。用户可以通过网络平台与该模型进行交互，获取数学问题的解决方案。

如何使用

要使用deepseek-math-7b-instruct模型，人们可以通过编程的方式与其交互。以下是如何实现模型应用的一些简单示例：

对话生成

用户可以输入数学问题，并按照指定格式要求模型提供答案。在这个过程中，模型采用了一种称为“逐步推理”的方法，从而确保最后获得的结论是经过严密的数学推理得出的。对于英文问题，用户需在问题后面加上“Please reason step by step, and put your final answer within \boxed{}.”，而对于中文问题，则加上“请通过逐步推理来解答问题，并把最终答案放置于\boxed{}中。”

例如，要计算从0到2的x²的积分值，用户可以输入以下代码：

import torch
from transformers import AutoTokenizer, AutoModelForCausalLM, GenerationConfig

model_name = "deepseek-ai/deepseek-math-7b-instruct"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(model_name, torch_dtype=torch.bfloat16, device_map="auto")
model.generation_config = GenerationConfig.from_pretrained(model_name)
model.generation_config.pad_token_id = model.generation_config.eos_token_id

messages = [
    {"role": "user", "content": "what is the integral of x^2 from 0 to 2?\nPlease reason step by step, and put your final answer within \\boxed{}."}
]
input_tensor = tokenizer.apply_chat_template(messages, add_generation_prompt=True, return_tensors="pt")
outputs = model.generate(input_tensor.to(model.device), max_new_tokens=100)

result = tokenizer.decode(outputs[0][input_tensor.shape[1]:], skip_special_tokens=True)
print(result)

此外，可以不使用提供的apply_chat_template函数，通过简单替换messages内容，与模型进行交互。需要注意的是，输入文本的开头通常会自动添加bos_token，而当前模型版本不支持系统提示，建议勿在输入中包含这些系统提示。

许可证信息

deepseek-math-7b-instruct项目的代码库采用MIT许可证授权，而模型本身的使用需遵循其专有的模型许可证。DeepSeekMath模型支持商业用途，详见LICENSE-MODEL。

联系方式

如果对deepseek-math-7b-instruct项目有任何疑问或建议，用户可以通过 GitHub 提交问题，或发送邮件至service@deepseek.com进行联系。