热点
谷歌杀手锏Gemini,终于来了!
就在昨晚,谷歌CEO皮猜和哈萨比斯在谷歌官网联名发文,宣布推出这一万众瞩目的多模态大模型。
在Massive Multitask Language Understanding (MMLU) 测试中,Gemini成为首个超越人类专家表现的模型。MMLU是一种评估AI模型知识和问题解决能力的流行方法,这显示了Gemini在理解和处理复杂任务方面的先进性。
所有信息都在强调“最大”“最强”,矛头就是直接指向了GPT4,要进行一次PK。
下面是Gemini跟GPT-4V的对比:
在LLM中的表现,也正如我们刚才所述,32个基准测试中拿下30个SOTA。
其中,通用、推理、数学和编程等大方向的成绩如下表所示:
Gemini的多种型号
Gemini有三种不同的规模,以满足不同的需求:
- Ultra:最强大的模型,适用于高度复杂的任务。
- Pro:最佳的模型,适用于广泛的任务。
- Nano:最高效的模型,适用于设备上的任务。
Gemini的多模态本质
Gemini天生支持多模态输入,这意味着它能够将任何类型的输入转换成任何类型的输出。这种能力为AI的应用开辟了新的道路,从简单的文本处理到复杂的多媒体和编程任务。
Gemini的潜力
Gemini的多模态推理能力已经过了实际测试,这些测试突出了其在多种情景下的应用潜力。这些测试不仅展示了Gemini的技术能力,还展示了其在解决实际问题中的实用性。Gemini的创建者们分享了关于这个平台的潜力和它如何被构建来解决现实世界问题的见解。他们的目标是创建一个不仅强大而且负责任的AI系统,这意味着在设计和开发过程中就已经考虑到了安全和包容性的因素