码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 《语音优先》智能语音技术驱动的交互界面设计与语音机器人设计(译者序)...


    “言为心声,语为心境”,语言与对话是我们沟通与协作的重要方式。而智能语音技术是一种基于人工智能和自然语言处理技术的语音交互技术。它可以通过语音识别技术将用户的语音指令转换为文本,然后通过自然语言处理技术对文本进行分析和理解,最终生成相应的响应或执行相应的操作。

    虽然智能语音技术由来已久,但直到亚马逊Echo智能音箱的诞生才再一次引发了业界对智能语音技术的广泛关注,因为这样的智能音箱带给了人们一种叫作“语音优先”的用户体验,为用户提供了一种更加便捷、高效的交互方式。

    那么,什么是“语音优先”呢?

    语音优先是指在设计产品或服务时,将语音交互作为主要的用户界面,以便用户可以通过语音指令来完成操作。这种设计方法可以提高用户的使用体验,特别是双手正在忙碌的场景下,语音交互可以更加方便和快捷。语音优先交互方式的优势在于:

    其一是速度,每分钟可以说120-150个字。

    其二是释放双手,做饭时通过语音可以完成一些期望做的事。

    其三是直觉性,语言是人类的天赋,也是人类交际沟通的自然手段。

    其四是同理心,语音中包含了语气、音量、语调和语速,这些特征传达了大量的信息。

    智能语音交互离不开人工智能技术,在语音优先交互中所涉及的人工智能技术如下图所示。

    fdd3c472f09096e0e11ad38883503299.png 

    如今,在为我们服务的智能语音设备背后,有一整套技术和流程,从语音唤醒到自动语音识别,再到自然语言理解,最终通过自然语言生成以及语音合成技术形成反馈,整套流程背后又有很多细分的人工智能技术在支持,如对话管理、深度学习、DNN、CNN、NLP、TTS等。

    幸运的是,在2017年,我加入了宣称“All in AI”的百度,负责智能音箱的研发。伙伴们和我经受了88天的炼狱,终于诞生了百度第一款智能音箱Raven-H。而后,还参与了小度音箱、小度在家等产品的研发。后来,作为DuerOS首席布道师负责DuerOS的生态建设。DuerOS开放平台为开发者提供了开发智能语音应用的工具,使智能语音服务的开发更为便利。国外的谷歌与亚马逊,国内的小米、阿里等厂家,也都有着类似于DuerOS开放平台的开发者社区。

    开发者在各种语音开放平台上开发智能语音服务的时候,普遍面临着对智能语音交互设计的认知不足的情况,尤其是语音优先设计的适用场景和独特性。作为一名布道师,非常想写一本关于智能语音交互设计与实现方面的书,但由于种种原因,未能成行。

    4f8d397a7e5c501148b3e3d2a13b6836.png

    本书正是这样一本书,不仅深入浅出地讨论了对话技术,还手把手告诉了我们智能语音交互设计的各种细节,是一本名副其实的设计指南和实战手册。感谢机械工业出版社让我参与了这本书的翻译工作,弥补了自己曾经的遗憾。

    翻译团队的诞生源自几个有趣灵魂的碰撞,王同林和卢健作为高级产品经理,强烈的求知欲和十多年丰富的产品设计经验,是他们加入翻译团队的原动力。严谨行文,细心求证,贯穿着我们整个翻译过程。即便如此,仍然如履薄冰,文中不妥之处,欢迎大家斧正。

    【关联阅读】

    • 令人激动的语音UI背后

    • AI 语音交互开放平台的构建与演进

    • “他山之石”,语音技能开发的10个要点

    • 面向NLP的AI产品方法论——寻找语音交互的业务场景

    • 语音交互技术不是“你问我答”那么简单!

    • 智能语音应用开发之DPL2.0高级特性

    • 浅谈语音助手可以给企业带来什么?

    • 从认知负荷理论看语音交互设计

    • 语音交互设计的一点认知

    • 调试DuerOS的智能语音技能

    • 揭秘“语音交互”背后的AI硬核黑科技!

    • 《 持续架构实践 》译者序

    • 《基于混合方法的自然语言处理》译者序

    • 计算机网络的元认知、实践与未来

    • Web3.0,区块链后花园的姹紫嫣红

  • 相关阅读:
    小程序关键词排名:优化你的应用在搜索中的地位
    sonar扫描安装前端
    国内“谁”能实现chatgpt,短期穷出的类ChatGPT简评(算法侧角度为主),以及对MOSS、ChatYuan给出简评,一文带你深入了解宏观技术路线。
    分布式之计算高性能
    【Linux】Linux 之用户管理
    计算机毕业设计选题推荐-个人健康微信小程序/安卓APP-项目实战
    闲置APP小程序开发 你不喜欢的可能正是别人需要的
    【web课程设计】基于html鲜花商城项目的设计与实现
    使用 labelImg 制作YOLO系列目标检测数据集(.xml文件)
    Ajax、Fetch、Axios三者的区别
  • 原文地址:https://blog.csdn.net/wireless_com/article/details/133980536
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号