maestrale-chat-v0.4-beta项目介绍
项目概述
maestrale-chat-v0.4-beta是一个专为意大利语优化的语言模型。该模型采用了Mistral-7b语言模型,并在大规模高质量语料库上进行了持续的预训练。此外,它还融合了occiglot模型。项目通过精调(SFT)在170万次对话/指令上进行过两次训练,使用多种数据集与DPO对齐。
主要功能特点
- 改善的真实性:增强了在对话中提供准确信息的能力。
- 提升数学和推理能力:支持更复杂的数学运算和逻辑推理。
- 地图思维导图:可以生成Mermaid格式的思维导图。
- 更多拉丁文翻译与诗歌创作:支持更多跨语言的翻译和文学创作功能。
使用指南
用户可以通过Python编程环境加载该模型,并采用下面的配置进行文本生成:
from transformers import (
AutoTokenizer,
AutoModelForCausalLM,
GenerationConfig,
TextStreamer
)
import torch
tokenizer = AutoTokenizer.from_pretrained("mii-llm/maestrale-chat-v0.4-beta")
model = AutoModelForCausalLM.from_pretrained("mii-llm/maestrale-chat-v0.4-beta", load_in_8bit=True, device_map="auto")
gen = GenerationConfig(
do_sample=True,
temperature=0.7,
repetition_penalty=1.2,
top_k=50,
top_p=0.95,
max_new_tokens=500,
pad_token_id=tokenizer.eos_token_id,
eos_token_id=tokenizer.convert_tokens_to_ids("