• 重磅:谷歌发布最强大AI模型【Google Gemini】


    一、前言

    北京时间 2023年12 月 13 日Google 发布了最新的 Gemini Pro模型,并且提供了 API 访问。

    一个更好的消息是:Gemini Pro 可免费使用。赶紧体验起来吧~

    二、关于

    Google Gemini是一款由Google AI开发的大型语言模型聊天机器人。它能够进行多模态推理,支持文本、图像、视频、音频和代码之间的无缝交互。Gemini在语言理解、推理、数学、编程等多个领域都超越了之前的产品,成为迄今为止最强大的AI系统之一。Gemini可以广泛应用于创意设计、写作辅助、问题解答、代码生成等领域。Gemini对标的是GPT-4,并在试图证明优于OpenAI的GPT-4。

    Google Gemini 有三种版本,分别适用于不同场景:Ultra、Pro 和 Nano

    • Gemini Ultra 是最大的版本,具有最强大的性能。可用于大型数据中心等,属于处理高复杂度任务的模型。

    • Gemini Pro 是面向开发者的版本,用于各种扩展任务的最佳模型。且已搭载于谷歌的对话机器人Bard中。它可以通过 Google AI Studio 或 Google Cloud Vertex AI 获取。

    • Gemini Nano 是应用于智能手机等移动设备终端上最高效的模型。

    三、特点

    • 多模态能力:Gemini可以处理文本、图像、代码、音频和视频等多种类型的信息。

    • 强大的对话能力:Gemini能够进行复杂的对话,并理解用户的上下文。

    • 自然流畅的语言生成:Gemini生成的语言非常流畅和自然。

    四、Gemini总结

    • 它具备丰富的功能,包括函数调用、数据嵌入、语义检索、自定义知识嵌入以及聊天功能

    • 在专业的基准测试中,Gemini Pro 的表现超越了其他同类模型

    • 当前版本配备了 32K 文本上下文窗口,未来将推出拥有更广阔上下文窗口的版本

    • Gemini Pro 可处理文本输入并生成文本输出。还推出了一个专门的 Gemini Pro 视觉多模态终端,能够处理图像和文本输入,输出文本

    • 它支持 全球超过 180 个国家和地区 的 38 种语言

    • Gemini Pro 提供了多种 SDK,以便开发者在不同平台上构建应用,包括 Python、Android (Kotlin)、Node.js、Swift 和 JavaScript,助力开发者在任何平台上快速构建应用

    • 当前Gemini Pro 可免费使用(存在一定使用限制),并且其定价将十分 有竞争力

    • Google 还提供了一个免费的在线开发工具 Google AI Studio,你可以用它快速构建 Gemini 应用,Google AI Studio

    • 关于计费方式:跟OpenAI 计算单位不一样, Google 是按字符,OpenAI 是按 Token,如果是中文会便宜不少

    五、注册

    1. 注册Google Cloud Platform帐户

    有了Google Cloud Platform帐户,就可以通过 Google Cloud Vertex AI 或 Google AI Studio访问 Gemini Pro。

    Gemini API 地址:ai.google.dev

    2.Google Cloud Vertex AI

    Google Cloud Vertex AI 使用 Gemini Pro,操作步骤:

    1. 登录 Google Cloud Platform

    2. 单击左侧导航栏中的 人工智能

    3. 单击 Vertex AI

    4. 单击 模型库,选择 Gemini Pro模型

    5. 打开 Language Studio

    Vertex AI:

    image

    模型库:
    image

    3.Google AI Studio

    Google AI Studio  使用 Gemini Pro,操作步骤:

    1. 登录 Google Cloud Platform

    2. 单击左侧导航栏中的 AI Platform

    3. 单击 AI Hub,选择 Gemini Pro

    六、Gemini体验

    Bard 网页

    Gemini API 使用入门

    Gemini API 参考

    七、Gemini与GPT-4对比

    1. 按谷歌的说法Gemini在所有多模态任务中的表现都优于 GPT-4。GPT-4 只能处理图像和文本。(除了HellaSwag)

    2. Gemini 可以处理视频、音频、图像和文本。随着谷歌继续训练其工具包,它的性能可能会大大超过其他各种模型。

    3. 详情请参阅 Gemini 技术报告

    4. 进一步了解Gemini 的能力和运作方式

    image

    八、进一步了解

    1.blog.google

    2.一起交流~
    公众号:【米七独立技术】

  • 相关阅读:
    docker安装postgresql
    thinkphp6 入门(4)--数据库操作 增删改查
    英语作文写作步骤及模板例句(1)
    订阅号和服务号有什么区别
    java对象的内存布局
    第一百六十四回 如何实现NumberPicker
    【golang学习笔记】并发基础
    搭建公司内部论坛 只需简单三步 1 (安装Discuz)
    聊聊JAVA中的锁优化锁升级及其底层原理剖析
    视频监控/视频汇聚/安防视频监控平台EasyCVR配置集群后有一台显示离线是什么原因?
  • 原文地址:https://www.cnblogs.com/eryueren/p/17901497.html