Project Icon

byt5-geotagging

ByT5编码器驱动的开源地理标记模型框架

byt5-geotagging是一个开源的地理标记模型框架,基于ByT5编码器架构。该项目提供了自定义训练支持和多种地理位置检测场景的数据集。模型在最相关10%文本上实现30公里中位误差的精度。框架集成了置信度估计功能,用于评估预测坐标的可靠性。该项目代码易于探索和适配,方便开发者集成到各类应用中。

加入我们的社区

封面

Version

地理标记模型

该存储库旨在支持开发者构建和训练他们自己的地理标记模型。这里提供的地理标记模型架构允许进行定制和训练。此外,我们还发布了适用于不同地理位置检测场景训练的数据集。

当前模型在最相关的10%文本上达到30公里的哈弗辛距离中位数误差。存储库的问题部分开放了改进模型性能的挑战。

架构和训练

点击展开地理标记模型架构图。
%%{init:{'theme':'neutral'}}%%
flowchart TD
subgraph "ByT5分类器"
  a("输入文本") --> b("输入ID")
subgraph "byt5(T5编码器模型)"
  b("输入ID")  --> c("byt5.encoder.inp_input_ids")
subgraph "byt5.encoder(T5堆栈)"
  c("byt5.encoder.inp_input_ids")  --> d("byt5.encoder.embed_tokens") 
subgraph "byt5.encoder.embed_tokens (嵌入)"
  d("byt5.encoder.embed_tokens")  --> f("嵌入")
  e("byt5.encoder.embed_tokens.inp_weights") --> f("嵌入") --> g("byt5.encoder.embed_tokens.out_0")
end
  g("byt5.encoder.embed_tokens.out_0") --> h("byt5.encoder.dropout(丢弃)") --> i("byt5.encoder.block.0(T5块)") --> j("byt5.encoder.block.1(T5块)") & k("byt5.encoder.block.2-9(T5块)") & l("byt5.encoder.block.10(T5块)")
  j("byt5.encoder.block.1(T5块)") --> k("byt5.encoder.block.2(T5块)<br><br> ...<br><br>byt5.encoder.block.10(T5块) ") --> l("byt5.encoder.block.11(T5块)") --> m("byt5.encoder.final_layer_norm(T5层归一化)")
  m("byt5.encoder.final_layer_norm(T5层归一化)")-->n("byt5.encoder.dropout(丢弃)")--> o("byt5.encoder.out_0")
end
o("byt5.encoder.out_0") --> p("byt5.out_0")
end
p("byt5.out_0")-->q("(线性)")
end
q("(线性)") -->r("logits")
训练你的文本到位置模型在Colab中打开

依赖项

确保在你的环境中安装以下依赖项以构建和训练你的地理标记模型:

transformers==4.29.1
tqdm==4.63.2
pandas==1.4.4
pytorch==1.7.1

要使用基于ByT5编码器的方法训练你的地理标记模型,执行以下脚本:

python train_model.py --train_input_file <训练文件> --test_input_file <测试文件> --do_train true --do_test true --load_clustering .

查看train_model.py文件以获取可用参数的完整列表。

输出示例


{
   "text":"这些小猫需要家,位于奥马哈地区!它们已经接种疫苗并绝育/节育。它们需要在1月1日之前离开!请转发以帮助传播消息!",
   "geotagging":{
      "lat":41.257160,
      "lon":-95.995102,
      "confidence":0.9950085878372192
   }
}
{
  "type": "FeatureCollection",
  "features": [
    {
      "type": "Feature",
      "id": 1,
      "properties": {
        "ID": 0
      },
      "geometry": {
        "type": "Polygon",
        "coordinates": [
          [
            [-96.296363, 41.112793],
            [-96.296363, 41.345177],
            [-95.786877, 41.345177],
            [-95.786877, 41.112793],
            [-96.296363, 41.112793]
          ]
        ]
      }
    },
    {
      "type": "Feature",
      "id": 2,
      "properties": {
        "ID": 0
      },
      "geometry": {
        "type": "Point",
        "coordinates": [-95.995102, 41.257160]
      }
    }
  ]
}

数据集

我们的团队为两种不同的训练方法策划了两个全面的数据集。这些数据集旨在用于训练和验证模型。在存储库的问题部分分享你的训练结果

地区数据集谷歌云盘

地区方法的目标是研究世界上人口最多的地区的数据集。

  • 是一个包含50万条文本及其相应地理坐标的标注语料库
  • 覆盖123个地区
  • 每个地点包含5000条推文
季节数据集谷歌云盘

季节方法的目标是识别帖子的时间/日期、内容和位置之间的相关性。应分析并利用时区差异以及事件的季节性来预测位置。例如:雪更可能出现在北半球,尤其是在12月。摇滚音乐会更可能在晚上和大城市举行,因此应使用关于音乐会的帖子时间来确定作者的时区并缩小潜在位置的范围。

  • 是一个包含超过60万条文本的.json文件
  • 收集时间跨度为12个月
  • 覆盖15个不同时区
  • 聚焦于6个国家(古巴、伊朗、俄罗斯、朝鲜、叙利亚、委内瑞拉)

您的自定义数据。 地理标记模型支持在自定义数据集上进行训练和测试。请准备CSV格式的数据,包含以下列:textlatlon

置信度和预测

地理标记模型融入了置信度估计,以评估预测坐标的可靠性。输出中的相关性字段表示预测置信度,范围从0.01.0。数值越高表示置信度越高。 有关置信度估计和如何使用模型进行地理标记预测的详细信息,请参阅inference.py文件。该文件提供了一个示例脚本,演示了模型架构和置信度估计的集成。

欢迎!

Fork用户

Yachay-AI/byt5-geotagging的Fork用户名册

请随意探索代码,根据您的具体需求进行调整,并将其集成到您的项目中。如果您有任何问题或需要帮助,请随时联系我们。我们非常感谢您的反馈,并致力于不断改进地理标记模型。

项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号