由声智科技研发的“AI数字人垃圾分类(lèi)管家”融(róng)合(hé)了人脸识别(bié)、智能语(yǔ)音交互、行(háng)为(wéi)识别等技(jì)术,使垃(lā)圾分类管理更加方便(biàn)快速。
一台(tái)可以书写的(de)智能交互机械(xiè)臂(bì),用(yòng)毛笔写下“一起向(xiàng)未来”;一部多足(zú)行(háng)走(zǒu)机器(qì)人(rén)和(hé)一部跳舞机器(qì)人,共同跳起(qǐ)了一段(duàn)舞蹈(dǎo),随(suí)后(hòu),跳舞(wǔ)机器人还单独进行了(le)一段武(wǔ)术表(biǎo)演,抱拳开臂(bì),马步弓(gōng)步(bù),一招一式(shì)憨态可掬。这是(shì)记者在北京声(shēng)智科(kē)技(jì)有限公司(以(yǐ)下称“声(shēng)智科技”)展厅里看到的景象。
声智(zhì)科技成立于2016年(nián),专注于(yú)声学(xué)前沿技术和人(rén)工智能领域,主要(yào)面(miàn)向(xiàng)数智健康、数智城市(shì)等场景提供产品和(hé)解决方案(àn)。凭借持续创新研发,声智科技获得了吴文俊人(rén)工智能科学技术奖、北京(jīng)市科技进步二等奖等多个(gè)奖(jiǎng)项。
突破(pò)技术难点
“声(shēng)智科(kē)技是从研发远场语音交(jiāo)互技术起步的,你刚才看到的那几个智能机器人搭(dā)载了(le)声(shēng)智科技研发的智能语音交互技术。”声智科技创(chuàng)始人陈孝(xiào)良说,随着物联网技(jì)术的普及,语音成为人(rén)机交互的新入口,支持远场语音交互的产品市(shì)场潜力很大。
“远场语音识别技术面临诸多研发(fā)难点,比如环(huán)境噪声、人声(shēng)、房间混响的干扰等。若采用(yòng)常规语音(yīn)处理(lǐ)方法,会导致信号失真和资源消耗大,使得语音(yīn)识别技术(shù)准确率低,应用困难。”陈孝良说。
凭借深厚技术积累和持续研发,声智科技先(xiān)后攻克了多项远(yuǎn)场语音交(jiāo)互关键技术,包括(kuò)回声抵消技术、噪声消除技术、声源定(dìng)位(wèi)技术、语音识别技术(shù)等。如(rú)今,这些技术已应用于一些消费级电子产品(pǐn)中,声智(zhì)科技(jì)也成为国内(nèi)不少知名(míng)企业的合作伙(huǒ)伴。
“我们意识(shí)到,伴(bàn)随(suí)着人工智能的快(kuài)速发展,人机交互(hù)、协同过程中的多数问题,都不能靠单一技术解决,需要(yào)将语音、图像识别、大(dà)数据等技术(shù)结合起(qǐ)来。只有推进多模态、多技能的融合,才能实现更多场景的应(yīng)用。”声智科技副总裁李良斌说。
他介绍(shào),声智科(kē)技的(de)做法是,用“多模态”确保机器(qì)具(jù)有“声、光、电、热、力、磁”多种感(gǎn)知技术;用“远场(chǎng)”解决机器在远距离场域中(zhōng)对多模(mó)态信号的分析;用“多技能(néng)”赋(fù)予智能系统(tǒng)多(duō)种能力,通过多技能相(xiàng)互协同,完成复杂任务。
基于(yú)这种(zhǒng)技(jì)术理(lǐ)念,声智科技研发推出核心技术产品——壹元人工智能开发框架。基于这个框架,声智科技融合(hé)了远场声光、多模态识(shí)别(bié)等多(duō)项技术,围绕智(zhì)慧社区、智慧交通、智慧办公(gōng)、智慧医院等应用(yòng)场景,提供(gòng)AI产品及(jí)解决方案。
截(jié)至(zhì)目前,声智科技已经参与了50余项国家行(háng)业标准的制定,拥有国内专利(lì)2000余项。在(zài)2020年前,声智科技总融资金额(é)超过3亿元。陈孝良说(shuō),这些(xiē)融资全部(bù)投(tóu)入到核(hé)心技术的持续研发(fā)上(shàng)。
助力智(zhì)慧防疫
新冠肺炎疫(yì)情暴发以来,声(shēng)智科技自主研发的(de)技术产品,用于多地的防疫服务中。
记者刚走进中关村前(qián)沿(yán)技术创新中心的一(yī)楼大厅,就听(tīng)到清脆的声音:“您(nín)现在的体温是36.5摄氏度,没有发热症(zhèng)状”。声音来自一台测温机器人,在机(jī)器人显示屏(píng)上,除了(le)实(shí)时显示被检测者(zhě)的红外热成像信息和温度值,还能查看全国(guó)疫情数据,测温(wēn)精度在正负0.2摄氏度。
声智科技首席知识官常乐介绍,这(zhè)个测(cè)温机器(qì)人可在几秒(miǎo)钟内完成1米(mǐ)至6米(mǐ)范围内多个目标的高精度测温(wēn),支(zhī)持实时(shí)AI语(yǔ)音(yīn)合(hé)成播报,自动上传预警(jǐng)信息。目前,该机器人已在北京、广州、青岛、成(chéng)都等地落地使用。
“小易小易,上(shàng)楼”“小易小易,去10楼”,在北京海淀医院的电梯里,只(zhī)需要一句(jù)简单的指令(lìng),就能实(shí)现(xiàn)乘梯(tī)上下楼,全(quán)程免(miǎn)按键(jiàn),实现零接触。
“声智(zhì)科(kē)技(jì)研发的智慧(huì)语音电梯,融合语音(yīn)与图像等交互技术,不依赖手机(jī)、IC卡(kǎ)等设备(bèi),无(wú)论使用者(zhě)是(shì)在电梯外,还是在电梯(tī)轿厢内,都可以通(tōng)过可(kě)视化人机(jī)交互方式搭(dā)乘电(diàn)梯。”常(cháng)乐介绍,这方(fāng)便了老人、儿童等用户的(de)日常生活,在疫情防控(kòng)期间还有效降低了接触(chù)传播感染风险。
目前,声智科(kē)技已(yǐ)推出第二代AI智能电梯系(xì)统(tǒng),增加手势(shì)识别功能,残障人士也可以实现免(miǎn)接(jiē)触控制电梯。2021年,为(wéi)解决(jué)电(diàn)动自行车入(rù)户(hù)充电的监(jiān)管(guǎn)难(nán)题,减少电池(chí)充电爆炸起火等隐患,企业(yè)又(yòu)迭(dié)代推(tuī)出(chū)了第三代AI智能电梯。
“未来,我们希望AI技术能满足复杂场景的灵活、大范围(wéi)应用。”李良斌表示,声(shēng)智科技(jì)将继续加强核心(xīn)技(jì)术研(yán)发,让更多AI产品落地(dì),使万物互联更智能。