PlatVR-kto - 模型用于生成和优化虚拟现实背景图像

PlatVR-kto项目介绍

项目背景

PlatVR-kto是一个属于EVIDENT框架的模型，旨在增强虚拟现实场景中背景图片的创造过程。通过用户指令生成和修改文本提示，实现背景图像的生成。这个模型专为虚拟现实制作而设计，其KTO版本专注于理解用户偏好，并根据用户在平台上的使用情况进行训练。

模型细节

PlatVR-kto模型是继承和微调自Hermes 2 Pro模型，使用了合成偏好数据进行训练，以产生和改进用于创建虚拟现实背景的文本提示。

开发公司：ITG
模型类型：文本到文本的图像提示生成
自然语言处理语言：英语
许可证：Apache 2.0

模型主要功能是解读用户的修改指令，包括添加、缩减、修改、重排、删除、重述以及场景转换，帮助用户提升创造力和满意度。

使用方法

PlatVR-kto主要用于直接生成和精炼文本提示，以支持文本到图像的生成过程中，特别是专注于虚拟现实环境和场景的制作。

通过Docker加载模型：

docker run --gpus all --rm --shm-size 1g -p 8080:80 -v ~/huggingface/hub/:/data ghcr.io/huggingface/text-generation-inference:latest --model-id ITG/PlatVR-kto

通过Python进行调用：

from huggingface_hub import InferenceClient

client = InferenceClient(model="http://localhost:8080")
template = ...
instruction = "Add details to the original prompt in a single sentence."
original_prompt = "Una montaña"
input_prompt = template.format(original_prompt=original_prompt, instruction=instruction)
print(client.text_generation(prompt=input_prompt, max_new_tokens=512))