StarWhisper简介
StarWhisper是由国家天文台人工智能工作组开发的天文大模型系列,包括语言模型、时序模型和多模态模型(7B-72B)。该项目旨在为天文学研究提供强大的AI工具,助力天文学家探索宇宙奥秘。
项目资源
- 🌟 GitHub仓库: 项目的主要代码库,包含详细的README文档和使用说明。
- 🎨 星语绘卷权重: StarWhisper模型的权重文件。
- 📄 StarWhisper LC技术报告: 介绍了基于大模型的光变曲线数据处理方法。
主要特点
- 专业性: 针对天文领域进行了深度优化,具备丰富的天文知识。
- 多功能: 支持语言理解、代码生成、图像识别等多种任务。
- 可扩展: 提供了多模态多任务框架,可与望远镜控制系统对接。
快速上手
以下是使用StarWhisper模型进行对话的简单示例:
from modelscope import AutoModelForCausalLM, AutoTokenizer
tokenizer = AutoTokenizer.from_pretrained("AstroYuYang/StarWhisper3", trust_remote_code=True)
model = AutoModelForCausalLM.from_pretrained("AstroYuYang/StarWhisper3", device_map="auto", trust_remote_code=True).eval()
response, history = model.chat(tokenizer, "你好", history=None)
print(response)
response, history = model.chat(tokenizer, "什么是黑洞?", history=history)
print(response)
司天工程与StarWhisper
StarWhisper是"司天工程"的重要组成部分。司天工程是中国天文学家提出的面向时域天文学的重大基础设施项目。
StarWhisper作为司天"大脑"的备选方案,探索了利用大模型整合天文知识并解决具体天文问题的可能性。
未来发展方向
-
大语言模型优化:
- 扩充天文知识库
- 改进训练方法
- 增强模型性能
-
多模态能力提升:
- 开源多模态微调权重
- 探索天文图像生成与识别应用
-
观测Agent开发:
- 提升天文领域编程能力
- 与天文环境交互
- 链接专业天文工具
许可证信息
- 项目源码: Apache-2.0 license
- 模型权重: 遵循Qwen1.5-14B Chat的相关许可
引用与贡献
如果StarWhisper对您的研究有所帮助,请考虑引用:
@Misc{chatglm-for-variable-star,
title = {StarGLM},
author = {YuYang Li, CunShi Wang, MengWei Qu, Yu Bai, Roberto Soria, JiFeng Liu},
howpublished = {\url{https://github.com/Yu-Yang-Li/StarGLM}},
year = {2023}
}
StarWhisper项目欢迎社区贡献,您可以通过GitHub仓库提交issues或pull requests参与项目开发。
通过本文的介绍,相信读者已经对StarWhisper有了初步的了解。无论您是天文学研究者、AI开发者还是天文爱好者,StarWhisper都为您提供了探索宇宙奥秘的新工具。欢迎访问项目GitHub仓库,开启您的StarWhisper之旅!