WizMap
在浏览器中探索和解释大型嵌入!
什么是 WizMap?
WizMap 是一个可扩展的交互式可视化工具,帮助您轻松探索大型机器学习嵌入。通过创新的多分辨率嵌入摘要方法和熟悉的地图式交互设计,WizMap 使您能够轻松导航和解释嵌入空间。
✅ | 可扩展至数百万嵌入点 |
✅ | 多分辨率嵌入摘要 |
✅ | 快速嵌入搜索 |
✅ | 多模态数据(文本和图像) |
✅ | 动画嵌入演变 |
✅ | 支持计算笔记本(如 Jupyter、Colab、VS Code) |
✅ | 可共享的 URL |
WizMap 展示
DiffusionDB 提示词 + 图像 | ACL 论文摘要 | IMDB 评论 |
180万文本 + 180万图像 | 6.3万文本 | 2.5万文本 |
CLIP 嵌入 | all-MiniLM-L6-v2 嵌入 | all-MiniLM-L6-v2 嵌入 |
提交PR在此添加您的WizMap!您可以使用唯一URL分享您的WizMap。
网页演示
访问在线网页演示:https://poloclub.github.io/wizmap。
开始使用
克隆或下载此仓库:
git clone git@github.com:poloclub/wizmap.git
安装依赖:
npm install
然后运行WizMap:
npm run dev
导航至localhost:3000。您应该能在浏览器中看到WizMap运行 :)
使用我自己的嵌入
要使用自己的嵌入来运行WizMap,首先需要安装wizmap
Python库。
pip install wizmap
然后查看这个notebook获取详细指南。剧透:只需调用wizmap
库的两个函数即可开始使用。这两个JSON文件包含预计算的嵌入摘要、分布和原始嵌入数据。
生成JSON文件后,您有两种使用WizMap的选择。
- 浏览器:您可以点击WizMap演示右下角的文件夹图标,并在弹出窗口中输入JSON文件的URL。
- Notebook:如果您熟悉计算笔记本(如Jupyter Notebook、VSCode Notebook、Colab),可以直接在您喜欢的笔记本平台中使用
wizmap.visualize()
来使用WizMap。
分享我的WizMap
您可以通过复制浏览器中WizMap的唯一URL,轻松与合作者分享您的嵌入地图。例如,下面的URL指向WizMap中的IMDB嵌入。
https://poloclub.github.io/wizmap/?dataURL=https%3A%2F%2Fhuggingface.co%2Fdatasets%2Fxiaohk%2Fembeddings%2Fresolve%2Fmain%2Fimdb%2Fdata.ndjson&gridURL=https%3A%2F%2Fhuggingface.co%2Fdatasets%2Fxiaohk%2Fembeddings%2Fresolve%2Fmain%2Fimdb%2Fgrid.json
致谢
WizMap由Jay Wang、Fred Hohman和Polo Chau创建。
引用
要了解更多关于WizMap的信息,请阅读我们的研究论文(发表于ACL'23 系统演示)。
@article{wangWizMapScalableInteractive2023,
title = {{{WizMap}}: {{Scalable Interactive Visualization}} for {{Exploring Large Machine Learning Embeddings}}},
shorttitle = {{{WizMap}}},
author = {Wang, Zijie J. and Hohman, Fred and Chau, Duen Horng},
year = {2023},
url = {http://arxiv.org/abs/2306.09328},
urldate = {2023-06-16},
archiveprefix = {arxiv},
journal = {arXiv 2306.09328}
}
许可证
该软件采用 MIT 许可证。