硅基(jī)麦克风的出现(xiàn)重塑了音频(pín)领域。市场研究公司Yole Development相信,在(zài)未来几年,人工智能将引领(lǐng)市场演变(biàn)和转型。
语音交互(hù)是自然的,这就是为什么它正在成为人机交(jiāo)互的(de)主要接(jiē)口。基于(yú)语(yǔ)音的个人助(zhù)理(VPA)在智(zhì)能手机、智能音箱、智能手表、无(wú)线耳机、汽车、智能电视及其遥控(kòng)器中(zhōng)越来越(yuè)受欢(huān)迎。现在(zài)甚至垃圾桶都集成了语音识别。而真正的价值在于高音频(pín)质量(liàng)和对麦克风(fēng)周围环境(jìng)的理解。
对(duì)于Yole development来说,音频是下一个被人(rén)工智能(AI)渗透的(de)领域。
人工(gōng)智能如何(hé)发(fā)声(shēng)
基于语音的(de)虚拟个人语(yǔ)音助理(lǐ)(VPA)是当(dāng)今音频行(háng)业的主(zhǔ)要驱动力。基于音频系统的传统组件,如音频编解码器、麦克风、扬声器和音频(pín)放大器,他们都在使用(yòng)人工智能来计算(suàn)和分析语音数(shù)据。例如计(jì)算支(zhī)持复杂(zá)的音频功能,如语音识(shí)别和源定位。它可(kě)以(yǐ)在云中执行,也可(kě)以在消费设备的边缘处执行。这些分析在云中执行需要很高的处理能力和访问大量数据,。
Yole光(guāng)电和传感部门的技(jì)术和市场分析师Dimitrioses Damianos表示:“人工智能的附加价值是用于自(zì)然语言处理,声音是与机器(qì)互(hù)动的一种更自(zì)然的方式。你不需要使用键盘(pán)和双手,你只需要发声即可。然而,为(wéi)了理解用户在(zài)说什(shí)么,他(tā)们的语言以及他们的意(yì)思需要进行大量的处理。“人工智能正在(zài)增(zēng)加解码的(de)价值,并帮(bāng)助(zhù)我们与设备(bèi)沟通。”
当(dāng)被问及VPA的快速渗透时,Damianos将其归因于其便捷性和效(xiào)率。当(dāng)然,“我们相信和看到的是,像谷歌、苹果(guǒ)、Facebook、亚马逊和微软(统称为GAFAM)这样的大(dà)型(xíng)科技公司试图推动这些VPA,因为它们提取的数据(jù)有真正的价值。”
Yole公司MEMS和传感器部(bù)门的技(jì)术和市场分析师Alexis Debray:对于用(yòng)户来说(shuō),音频比图(tú)像更容易被接受。他们认为音频“不那么具(jù)有侵入性(xìng),所以这是(shì)GAFAM从人们(men)那里收集数据的好方法,GAFAM的主要业务就是数据。一些(xiē)公司利(lì)用数据做(zuò)生意(yì),而另一些(xiē)公(gōng)司利用隐私和设置技术来确保用户的隐私。例如,苹果公司就(jiù)宣扬(yáng)隐私,并使(shǐ)之成为强(qiáng)大的(de)营(yíng)销资产。
Damianos说到:对大型科(kē)技公(gōng)司来(lái)说,它们(men)的实际价值是尽可能多地从环境中提取信息,这意味着(zhe)VPA不(bú)仅(jǐn)会倾听(tīng)用户的声音,还会倾听他们周围的(de)环境,并了解(jiě)他们的环(huán)境。例如,“如果你在厨房里(lǐ),麦(mài)克风可以听到刀架在(zài)柜台上的声音,立刻就(jiù)知道你在厨房里,并(bìng)给出一(yī)个菜(cài)谱(pǔ)。”这就是情景(jǐng)人工智能。
人工智能对(duì)话之后的下一个阶(jiē)段很可能是完全感知,虚拟助手,无(wú)论是智能(néng)扬声器还是智能手表,都可以像人类(lèi)一样与用户交流。Damianos介(jiè)绍(shào),完全的意识是(shì)概念性的,并带有问号。“我们还(hái)不知道时间(jiān)轴,但可能会在人工智能(néng)对话之后的5到(dào)6年。这将(jiāng)取决于人工智能(néng)的发(fā)展和该(gāi)领(lǐng)域公司的发展。
虽然这些一直监听(tīng)的(de)系统可以(yǐ)在汽车人机界面(miàn)中挽救(jiù)生命,但(dàn)它们也(yě)引起(qǐ)了人们对用户隐私保(bǎo)护的担忧。为了防止可(kě)能的误用,Debray强调,数据处理应(yīng)该尽可(kě)能(néng)快地进行,并(bìng)尽(jìn)可能靠近麦克风。“离(lí)麦克(kè)风(fēng)越近,隐(yǐn)私泄露的可能性就越小。”
隐私包(bāo)含多个维度,因为用户可(kě)能希望隐(yǐn)藏(cáng)自(zì)己的性别、年龄或情绪。展望(wàng)未来,Debray表示,他(tā)有信心麦(mài)克风、ASIC或(huò)应用(yòng)处理器领域的参与(yǔ)者(zhě)将开发出确保用户隐私的技术(shù)。麦克风可以消除声音中的情绪(xù),只呈现音频(pín)数据。
Yole分析师预(yù)计,GAFAM将继续占据主导地位,因(yīn)为目前它们对分析的(de)作(zuò)用至关重要(yào),但传感器制造(zào)商显然渴望在边缘加入人工智能,并将音频分析业务从云端分流出去(qù)。Damianos:“传感器制造商希望增(zēng)加他们的收(shōu)入,并从(cóng)音频市(shì)场中分一杯羹。这不是一场来自大公司一方的战斗。这是传感器公司(sī)的一场(chǎng)战斗。”
Alexis Debray:“传感(gǎn)器公司确实在追求多样化(huà)的战略,“试(shì)图(tú)向价(jià)值链移动,变得更加一体化。”
在最(zuì)近(jìn)的一次采(cǎi)访(fǎng)中,Vesper Technologies Inc.首(shǒu)席执行长Matt Crowley曾(céng)表(biǎo)示,Vesper正在寻求(qiú)提高其压电MEMS麦克风的智(zhì)能化程(chéng)度。“我们相信,在未来,我们将在传感器中嵌入一些与(yǔ)人工智能(néng)配对的传感器。它将能够学习人(rén)类和(hé)动物如何(hé)使用他们的感官——不仅仅(jǐn)是(shì)视(shì)觉(jiào)、听觉、味觉、嗅(xiù)觉和触觉(jiào),还有动作或(huò)温度——来了(le)解他们(men)的环(huán)境。我(wǒ)们的长期愿(yuàn)景是,这些物体将使用多种仿生传感(gǎn)器(qì)来了解(jiě)它们的环(huán)境,并尽可能做出(chū)最佳反应(yīng)。”
此外(wài),英(yīng)飞凌(Infineon AG)也(yě)改变了自己(jǐ)的(de)商业(yè)模式,从销售麦克风模类产品转向销售Goertek和AAC等(děng)公司的产品,再到销售成套的(de)MEMS麦(mài)克风。从一个MEMS麦克(kè)风制造商到一个做制造、封装、测试和(hé)销售的综合播放器。“这是战(zhàn)略(luè)上(shàng)的变化……这可能意(yì)味(wèi)着,他们看到了(le)VPA的动向,希望在这个市场上找到自(zì)己的(de)定(dìng)位。”
同样,美国楼氏电子Knowles,今天的领导者,拥有MEMS麦克风市场39%的份额,最近从Ams AG收(shōu)购了MEMS麦克风ASIC设计部门。这是引入混合信号电路设计知识产权的一种方式,同时也(yě)是应对来自中国公司如(rú)Goertek和(hé)AAC日(rì)益激(jī)烈的竞争的一种(zhǒng)方式。
MEMS麦克风(fēng)为音(yīn)质提供有力支持(chí)
全球音频市场(chǎng)继续其(qí)增长轨迹。基于语音的VPA需(xū)要更好的信噪比(SNR),以便在嘈杂的环境(jìng)中准确地捕捉人(rén)的声音,因(yīn)此(cǐ)MEMS麦克风面临着新的市(shì)场机遇(yù)。
据Yole称,全球(qiú)麦克(kè)风、麦克风和音频芯片消费市场的年化增长率将(jiāng)达到(dào)6.6%,从2018年的141亿美元(yuán)增长到2024年(nián)的208亿美元(yuán)。便宜,小巧,易于集(jí)成,麦克风被广(guǎng)泛采用,并达(dá)到很(hěn)高的音量。Damianos:“我们使用了大约60亿个麦克风,”目前麦克风(fēng)市场(chǎng)规(guī)模为17亿美元,预计到2024年,其复合年增长率将达到3%,达到20亿美(měi)元(yuán)。
MEMS麦(mài)克风市场目(mù)前约占总市场(chǎng)的70%,将从2018年的12亿美元增长到2024年的(de)16亿美元。主要的驱动(dòng)市场包括智(zhì)能手(shǒu)机、智能音箱以及可听设备(如无线耳(ěr)机)。Damianos 介绍:“在(zài)过去的几年里,智能音(yīn)箱和(hé)可听设备的(de)市场经历了(le)爆炸性的增长。到2024年,智(zhì)能音(yīn)箱中的(de)MEMS麦(mài)克风的复合年增长率将达到13%,达(dá)到(dào)12亿只。到(dào)2024年,无线耳机(jī)的复(fù)合年增长率将(jiāng)达到(dào)29%,达到13亿部。
2019年智能手机用户20%的人机互动将使用语音助(zhù)理(lǐ)
各(gè)大手机平台(tái)也在积极投入,让虚拟个人(rén)语音助理(VPA)的功能日益强大,甚至连苹果(guǒ)Siri都(dōu)会唱PPAP,研究机构Gartner表(biǎo)示,相关技术进展将促使用(yòng)户更常使用VPA,预计(jì)到2019年,智能(néng)型手机用户20%的人机(jī)互动,都将使用(yòng)VPA。
Gartner还公布(bù)了2016年第四季的行动应用(yòng)调查(chá),在中国、英国与美国调查了3021名手机用户,发现美国(guó)有42%、英国有32%用户在过去三个月内(nèi)使用过VPA功能,英美平均每天至少使用(yòng)一次的(de)用户达37%。
有54%受访的(de)英美用户过(guò)去三个月使用过苹(píng)果的Siri,Google Now的过去三(sān)个月使用率在美国则为(wéi)48%、英国(guó)41%。Gartner表(biǎo)示,随着(zhe)更多新功能的出现(xiàn)、更多语系支持,以(yǐ)及越(yuè)来越多机种支(zhī)持(chí)VPA,这类接口的使用率将会逐步成长。
Gartner表示,VPA的成长,会和同时间快速(sù)发展的「会话商(shāng)务(wù)(conversaTIonal commerce)」相互加持,且(qiě)不仅是语音识别为中心,通讯软件语对话功(gōng)能亦(yì)将扮(bàn)演重要角色,例(lì)如Facebook Messenger的新商(shāng)务(wù)功能便(biàn)可让(ràng)用(yòng)户透过对(duì)话订购商品、呼叫Uber等,此外,腾讯的微信发展出的支付功能也已经成为该(gāi)通讯服务的(de)重(chóng)要(yào)功能。
Gartner表示(shì),中国(guó)是(shì)目前全球(qiú)会(huì)话商务最成熟的市场,以通讯平台为核(hé)心的市场发展状况(kuàng)已(yǐ)经促使传统商业(yè)进行变革(gé)。微软(ruǎn)的Cortana也正整合入Skype,Cortana则负责扮演第三(sān)方服务提供商与(yǔ)消费者(zhě)之间、以对(duì)话呈现的互动(dòng)平台,协助用户进(jìn)行机票、饭店预(yù)订等商(shāng)务活动。
除了语(yǔ)音,Gartner亦预测(cè)现(xiàn)在是移动电话主流互动接口的触控(kòng)功能,将不(bú)再是消费者唯一仰赖的接(jiē)口,语音语动作(gesture)的(de)重要性将会在消费性装(zhuāng)置上(shàng)大增,预期到2020年将(jiāng)有70亿台个人设备、13亿(yì)个穿戴式装置与57亿个其他类消费性(xìng)物联(lián)网终端装置,将会仅有基本(běn),或完全没有触(chù)控设计(jì)(Zero-Touch UI),使用传感器针对周边环(huán)境(jìng)进行情境信息搜(sōu)集,如语音、环境(jìng)、生物特征(zhēng)、移动(dòng)与动作等信(xìn)息,将会成(chéng)为新型(xíng)态UI的重要设(shè)计依据。
与此同时(shí),目前价值91亿美元的微型(xíng)扬声器(qì)市场,预(yù)计在2024年将以3%的复合年增长率达到109亿美元。
但在2018年(nián)到2019年,智能手机市场放(fàng)缓(huǎn),可能是因为智(zhì)能手机越(yuè)来越(yuè)贵,手机硬(yìng)件越来越好(hǎo),使用寿命增加,用(yòng)户在升级之前等待的时间更长。以前你每1.5年(nián)换(huàn)一(yī)次手机(jī),现在(zài)是每2.5年(nián)换一次,而且还在增加, 我们预计麦(mài)克风和微(wēi)型扬声器市场将会下滑。事(shì)实上,可(kě)听设备和智能(néng)音箱的爆(bào)炸式增长抵消了这种差异。VPA正在推动所有这些设备中麦克风和扬声器的集成化。