• 新知同享 | AI 开发广泛应用,高效构建


    029ab946228fd95fa40aaafe1a8ca398.png

    谷歌致力于通过高效、可靠的方法

    构建 AI 驱动的产品

    如今已经走过了七年 "AI 为先" 的旅程

    一起来看 2023 Google 开发者大会上

    AI 开发如何被广泛应用,简化开发

    并将机器学习的强大能力

    引入到应用和工作流

    提高开发者工作效率

    精彩大会现场一览

    92ca05cf6cd5cff2dbaae390dfcfce0e.png

    过去 3 年,Web 机器学习技术的使用和开发都呈指数级增长,许多热门 Google 产品都已采用 Web 技术。谷歌的许多团队都在为 Web 机器学习的未来积极贡献力量。例如,Chrome 团队正致力于制定新的 Web 标准,使 TensorFlow.js 和 MediaPipe 等团队能够在这些堆栈的基础上构建各种产品和服务,并实现更出色的性能。

    e4ec62755a549ae7d3ea14b9e0afe2e5.png

    MediaPipe 是一个开源的跨平台框架,用于在移动设备、桌面设备和 Web 上构建机器学习解决方案。MediaPipe 提供可自定义的设备端解决方案,只需几行代码,即可将解决方案集成到 Web 应用中。此外,MediaPipe 也发布了新模型,例如人脸融合变形分类。开发者可以使用此模型来创建虚拟头像,使其实时匹配用户的面部表情。

    b88cb9959a761bffb5d18397850cf078.png

    MediaPipe Studio 是一款基于 Web 的应用程序,用于评估和自定义应用程序的设备上 ML 模型和管道。MediaPipe Studio 可让开发者使用自己的数据和自定义的 ML 模型在浏览器中快速测试 MediaPipe 解决方案,以及支持试验结果总数、报告结果的最小置信度阈值等模型设置。

    acf6170e19718020a7e530b878a08512.png

    MediaPipe Studio 可以提供手势识别等完全在浏览器中运行的解决方案

    368da28ea7af56d7f7b0cb562744850e.png

    TensorFlow.js 是谷歌新发布的模型可视化调试程序,帮助开发者比较模型在不同 TensorFlow.js 后端上执行时的输出,找出运算输出从何时开始出现差异,以及差异有多大,以便发现在不同后端环境和设备上使用模型时可能出现的 bug。

    3feb006635df451999c8a89e4aee3864.png

    TensorFlow.js 模型可视化调试程序

    55ecadb1a6097ff6fc856d07ba36ca55.png

    谷歌对 WebGL 后端进行了重大优化,Web 机器学习模型的运行速度将比以往更快。单项运算级别中常见运算的性能最高能够免费提升到原来的 5.8 倍,热门模型性能优化最高可至原来的 1.59 倍。

    21fbcb58f7a2858fcb832543b9ef92ee.png

    c17144b1098080ad40bfe1277c5ea81d.png

    左右滑动查看

    9c27743055a5f32fbf87cbd0078d661d.png

    谷歌在 Chrome 稳定版中添加了对 WebGPU 的支持,为 Web 注入了十亿个 GPU 的强悍性能,使编解码器、游戏和机器学习等计算密集型应用能够在浏览器中运行,并且能够实现前所未有的细节丰富度和帧率。

    fdae03c1b551b7a2094c499ce1cb74b9.png

    语言模型旨在预测和生成合理的语言。发展至今,现代大语言模型规模庞大,可以预测句子、段落甚至整个文档的概率。典型自然语言可以处理实体提取、分类、生成摘要、情感分析、翻译等任务。谷歌新推出的大语言模型 (LLM) 工具 PaLM API 和 MakerSuite 可以帮助开发者快速开发原型。

    7d60cd53998ff363b12690499b100388.png

    大语言模型 (LLM)

    fe73ac6b7fcc6e19feee018ebc17f0eb.png

    MakerSuite 可以帮助开发者直接在浏览器中快速创建提示并为其进行原型设计,无需机器学习专业知识或代码。借助 MakerSuite,开发者将能够迭代提示、使用合成数据增强数据集,并轻松调整自定义模型。

    590854c10f6e47ab760039b7f05245c4.png

    MakerSuite

    e39f43769a6976479be0b91f4e9a4c21.png

    PaLM API 使开发者可以轻松、安全地试验谷歌的大型语言模型,即通过 PaLM API 直接访问谷歌的先进大型语言模型,构建生成式 AI 应用。它将为开发人员提供针对多回合用例优化的模型(例如内容生成和聊天)以及针对摘要、分类等用例优化的通用模型。PaLM API 可以提供文本服务、聊天服务、嵌入服务。

    cf4a3856b70f71bedad04c5c0307e540.png

    开发者现在可以使用 Firebase 扩展访问 PaLM API,即在带有 PaLM API 扩展程序的全新聊天机器人中添加用于连续对话、文本摘要等功能的聊天界面。

    949fe42fa599f4cc32d35178e08efd31.png

    通过实例,一起来了解如何通过 AI 和机器学习构建应用。

    ecec1ba04f41cec658c1c9a476366392.png

    用 Flutter & AI 构建 I/O Flip

    I/O Flip 是一个使用 Flutter 和 AI 构建的虚拟纸牌游戏,它展示了多项 Google 技术的融合。具体来说,开发者用 Muse 上的 DreamBooth 生成角色图像,用 PaLM API 生成描述,用 Flutter 创建游戏 UI 和动画,用 Dart 编写后端,并使用一套 Firebase 和 Google Cloud 工具进行托管和共享。通过 2023 Google 开发者大会现场的互动展示区,参会者实际体验了这款纸牌游戏,在流畅的游戏体验中深切感受到使用 Flutter 和 AI 构建游戏的妙不可言。

    1f8565146d7376e2c3970d5d0cc92ead.jpeg

    参会者现场体验 I/O Flip 纸牌游戏

    6e012f9fbbc69c6b18e1e24ec0844a67.png

    使用 OCR 获取 PDF

    互联网上有接近 12% 的 PDF文件因为不精确的光学字符识别 (OCR),无法被有视力障碍的用户通过辅助技术访问到。通过在设备上运行 OCR,Chromebook 使用户可以使用这些 PDF 文件,高效转换,没有延迟。

    为实现让 AI 助力每一个人

    谷歌将坚持负责任地进行探索

    持续关注 2023 Google 开发者大会

    更多精彩内容更新

    347dcc57f965b30154d5cae18a56f06d.png

    专题演讲视频持续更新中

    扫码直达官网

    探索大会更多精彩

    a28c969ecb7a7a17911591223ddb7ff2.gif 点击屏末  | 即刻访问 2023 Google 开发者大会官方网站

    cd583bad76580b729961092fa79a2cde.png

    a55c9b546bb3cb96c860917554595726.png

    65ed49e5220ba133da226b1feea1476e.png

  • 相关阅读:
    南卡电容笔和欢能哪个更推荐呢?Ipad好用电容笔对比
    力扣(LeetCode)3. 无重复字符的最长子串(C++)
    不可不知 | 一份来自官方的量化参赛指南
    c/c++反汇编 | 逆向 | 初级小牛犊
    flink1.18.0 sql-client报错
    Android 13.0 无源码app修改它的icon图标
    Java开发者的Python快速进修指南:控制之if-else和循环技巧
    visual studio 如何建立 C 语言项目
    人机交互:从过去到现在
    【机器学习】基于多元时间序列对高考预测分析案例
  • 原文地址:https://blog.csdn.net/jILRvRTrc/article/details/132784081