亚马逊Echo新品技术解读,如何选择合适的麦克风阵列?【预测德国欧洲杯阵容】

日期:2021-06-10 00:05:01 | 人气: 94158

本文摘要:(公共编号:)本文作者兼任声智科技创始人陈孝良、中国科学院声学所博士。

欧洲杯2021预测

(公共编号:)本文作者兼任声智科技创始人陈孝良、中国科学院声学所博士。美国时间9月27日,亚马逊再次引导了远程语音交流,一口气发布了5种Echo新产品,包括第二代Echo和EchoPlus、2.5英寸屏幕的EchoSpot、Echooconnect和Echobuttons。

其中,特别引人注目的是Echospot,这个被称为Echoshow闹钟版的新产品有2.5英寸的圆形屏幕,用户可以用它来表示图像、歌词、视频聊天等,售价只有129.99美元。EchoSpot不同于新版Echo和Echo.plus,它们不使用环6-1麦克风阵列,而是削减了麦克风阵列的配置,并与环4麦克风阵列技术相匹配。

为什么EchoSpot不能自由更换不同的麦克风阵列技术?最近亚马逊客厅产品家族:Echo和FireTV系列全球批量生产麦克风阵列的阵型技术盘点1、Amazon和Echo无论是第一代还是第二代,Echo都使用典型的61麦克风阵列结构,即环形的6个麦克风和中间的1个麦克风此外,Amazon仍然非常讨厌使用TI的AD芯片TLV320ADC。目前,该阵型在国外主要用于AmazonEcho,国内也只有误解和科技大学的通信多次模仿该阵型。其中,一代误解智能扬声器使用环形六个麦克风屏幕中间两个麦克风的结构。

如下图的右右图所示。在这里,科技大学的通信飞行,其咚咚扬声器系列的产品都是模仿的结构,通信飞行减少了一个麦克风,构成了环形7迈克风阵列的结构,如下图的右图所示。

丁咚一代和二代的区别主要是一代使用驻极麦克风,二代替模拟MEMS麦克风。与Amazon相比,科技大学的通信飞行更喜欢科技胜信的芯片,1、2代的丁咚产品都使用科技胜信的AD芯片CX20810,科技大学的通信飞行双麦算法也使用科技胜信CX20921芯片。2、EchoShowEchoShow使用椭圆形麦克风阵列,国内一般也称为滑道形,只线形,如下图所示。

该阵型因Echow厚度问题折中处理,也是典型的技术让步于产品设计的案例。目前国内仅声智科技供应类似阵型,即L型6麦阵列,如下图右右图所示。

3、EchoSpot进一步削减了麦克风阵列的配置,使用环形4麦技术,如下图左右图所示,该阵列虽然降低了成本,但也确保了一定的效果,这是典型的根据场景自由选择适合技术的案例。目前国内声智科技也供应了该阵型的话筒阵产品,即相容4麦和4麦1麦的话筒阵和开发板,如下图右右图。

与6麦阵型相比,增加了2个麦克风后,该阵型只损失了4米以外的远程语音交互性能。然而,根据国外产品公司对用户习惯的统计分析数据,1-3米的范围是用户最习惯的远程互动距离,因此4麦也适用于大多数用户的场景,尤其是酒店和其他行业。4、AppleHomePod使用环形6麦方案,环形6麦的优点是为产品ID设计提供更大的自由性,考虑到成本和远程语音交互性能。

国内美国AI扬声器使用声智技术的前端方案,其中阵形为环形6麦,同时降低成本,麦克风也使用数字麦克风,节省了模拟麦克风所需的AD芯片。在国内使用这种阵型的是天猫妖精、雅扬声器,但与美国AI扬声器不同,天猫妖精为了照顾算法要素,还是使用了模拟麦克风TI向ADC的方案。

5、谷歌Home谷歌Home独特,使用双麦克风方案,国内外问题的智能扬声器也延长了这个方案。国内双麦技术提供商主要是科技大学的通信和声智技术。

预测德国欧洲杯阵容

声智科学技术的双麦方案主要应用于汽车等行业,在消费电子领域的成熟期应用于方案的是单麦克风方案。6此之外,还有类似的阵型。

科技大学多次发表过双层麦克风阵列和4麦克风阵列。除了科学技术的通信,声智科学技术还发售了批量生产版的4麦线形阵列、3麦三角阵列和分布式阵列。但是,这些类似阵列的产品目前销售量小,市场影响小。

为什么不同产品的麦克风阵列差异这么大?从上面的盘点可以看出,Amazon完全是每个新产品系列都使用新的麦克风阵列技术,国内着名产品的麦克风阵列类型多种多样,即使完全相同的阵列类型,阵列间隔也不同,为什么不发生这种现象呢?1、麦克风阵列技术首先从麦克风阵列技术本身来看,麦克风阵列是指应用于语音处理的按一定规则排序的多个麦克风系统,也可以非常简单地解读为两个以上麦克风组成的录音系统。麦克风阵列一般有线形、环形和球形的区别,周密的应该说是一字、十字、双l、平面、螺旋、球形等。

至于麦克风阵列的阵列数量,也就是麦克风的数量,可以平均从2个到数千个。由于成本允许,消费级麦克风阵列的阵列数量一般不到8个,市场上最少见的是6麦和4麦的阵列。

2、麦克风的质量、数量和布局不仅要求算法,还要求麦克风的阵列性能主要是阵列麦克风的质量、数量和布局。这些基本上是硬件结构的要求,特别是麦克风的质量和数量,与各厂商的供应链密切相关,容易导致各产品的差异。例如,丁咚1交付确保性能,自由选择性能指标更高的指向型驻极体麦克风,Echo与性能指标低的MEMS麦克风相匹配,以确保批量生产的质量。

由于算法的不断提高,对话筒的拒绝仍然严格,MEMS话筒是目前主流的应用。3.远程语音交互场景从远程语音交互场景来看,如智能扬声器、智能中央控制和智能汽车场景不同,其市场需求自然也不同。智能扬声器一般配置桌面,需要360度的呼吁命令,所以环形阵佩比较合适,智能中央控制一般配置墙壁相同,只需照顾180度的范围,此时线形阵列就能满足。

当然这里也有类似的,比如手机或者平板,一般也是3麦或者4麦的矩形,这种阵型合理利用屏幕导向,只是重点符合某个扇形角度的性能。智能汽车分为两种情况。一种情况是只满足驾驶员的语音交互市场需求,单麦/双麦基本满足,另一种情况是满足所有乘员,重点照顾后排,必须使用分布式阵列。

4、产品设计的美观和制约再次从产品设计的美观和制约来看,刚才提到阵型,制约了产品的ID设计,但产品有差异必须有不同的ID,自然必须有不同形态的麦克风阵列。不同的阵元间隔和产生对麦克风阵列性能没有根本影响,因此在这个设计过程中是技术和艺术相互让步的过程。同时麦克风阵列对遮盖也有一定的拒绝,现在的麦克风阵列主要放在顶部,为了防止这个问题,当然这个约束也不会随着算法技术的大幅度提高而变弱。

5、产品成本和生产技术最后从产品成本和生产技术来看,例如麦克风的选择问题,驻极体麦克风的性能指标更好,但由于生产需要大量人工插手,成本更高,目前主要使用MEMS麦克风。MEMS麦克风分为模拟和数字,模拟麦克风和专业ADC的性能指标也很好,但成本也在上升。

数字麦克风的难题是收集的信号最好,算法处理必须超过其他方案的一定程度。为什么谷歌Home会自由选择双麦方案?有时听不到业内人士的转换,人类有两只耳朵,两只麦克风可以超过一定程度的性能。这实质上是一个误解,从目前的技术来看,即使使使用100个麦克风,也不一定能超越耳朵的效果。人耳是一种极其简单的结构,迄今为止实质上科学上所有的原理都不清楚,不能用非常简单的麦克风模拟。

现在的麦克风,实质上是标量麦克风,提供的意思是声压变化转换的电信号,而且没有耳廓,不能根据场景的变化自动调整。为什么谷歌Home使用双麦方案?这和话筒阵列有什么区别?事实上,这应该从不同的技术结构中探索。目前,市场上主要没有三种远程语音互动技术结构。

1、以谷歌为代表的纯云技术结构首先是以谷歌为代表的纯云技术结构,谷歌不想使用麦克风阵列。阵列比双麦方案具有波束构成的功能,自然具有更好的噪音和混响能力,距离近或环境简单时需要确保远程识别率。但是,由于麦克风阵列与前端硬件有关,谷歌并不擅长,谷歌希望通过云机器学习超过功能。

欧洲杯2021预测

但麦克风阵列阵元较多,产生的数据容量过大,而目前网络上传比特率严重不足,无法权衡自由选择较少的麦克风。实质上,如果使用前端方案,大多数场景下订购麦克风方案也能超过双麦方案的性能。

当然,更多的麦克风信号对云算法也是最重要的。2、以科学胜信为代表的纯前端技术结构,其次是以科学胜信为代表的纯前端技术结构,双麦减震本质上是一个非常成熟的时期方案,在智能手机和蓝牙耳机上已经广泛应用,但是在语音交流中需要大量的互换性工作前端方案的优点是更容易构筑在芯片上,缺点是难以升级和扩展,与人工智能大幅度传递的倾向不太相容,也是目前该方案不受欢迎的主要原因。3、以Amazon为代表的前端云计划最后是以Amazon为代表的前端云计划,该计划将算法分别配置在前端和云中,可以根据明确的场景进行优化,优化性能,扩大功能该方案考虑到麦克风阵列与觉醒和识别技术一体化的问题,觉醒和识别相当依赖麦克风阵列的算法处置效果,实质上这三种技术几乎分不开,特别是麦克风阵列和觉醒技术混然一体。

因此,国内制造商开发的AmazonAlexa产品与Sensory等获得的觉醒词组合起来,总是比Echo差得多。有趣的是,Alexa和Echo两个团队之间的对决,产品终端Alexa平台拒绝接受性能差的失望。如何正确自由选择话筒阵型和技巧?从上面的分析来看,远程语音交互产品显然很复杂,意味着搭配麦克风阵列有这么多问题。

那么,应该如何自由选择合适的话筒阵列和技术呢?1、从产品的实际角度到达,先决定前端方案后决定后端技术,先决定前端方案后决定后端技术,前端技术包括麦克风阵列、觉醒和识别技术,后端技术包括自然语言解读和内容服务。前端主要解决了产品是否能听到的问题,其中有远场声音觉醒率、简单环境5个核心指标。

这五个核心指标要求用户的第一体验。由于用户无法忍受前端技术经常出现任何问题,前端技术的稳定性也很重要,该指标必须大规模批量生产检查。后端技术主要解决了产品是否无法理解的问题,但只有自然语言解读过多,必须与内容服务联系在一起,才能超越用户失望的目的。

实际上,产品的智能主要反映在后端,与内容服务有关,目前只有BAT等大型企业完善。目前,全球批量生产检查的前端技术主要控制在Amazon、Apple、科技通信、声智科技等制造商手中,后端技术特别是内容和服务主要由谷歌、Microsoft、Apple、Amazon、百度、腾讯、蚂蚁等大型企业控制,思必驰和云知音等语音识别制造商也陆续变革发表了平台战略。2、根据场景选择合适的阵形,其次根据场景选择合适的阵形,例如产品定位的场景需要360度拾音吗?产品的用户群是什么年龄?产品的主要互动距离是多少?产品ID使用什么形状?产品是否考虑到低功耗问题?根据这些指标,专业技术人员可以得到明确的方案,比较复杂的场景可能需要定制开发,但从现在的技术进展来看,例如声智科学技术已经限制了阵型的尺寸和构造。

3、在符合效果的前提下考虑降低成本,最后必须在符合效果的前提下考虑降低成本。这与明确的场景密切相关。例如,儿童故事机由于儿童和机器之间的距离约束,成本实质上是第一考虑因素,实际上可以通过单麦克风方案解决问题。

技术实力雄厚的厂家可以考虑成本和性能,定制技术方案专用麦克风阵列和优化技术。对大多数产品制造商来说,产品开发速度和稳定性是首要考虑因素,优先选择阵列模块方案,容易构筑,成本也容易控制。这样,制造商可以更加专注于后端智能的研究开发,现在的后端技术稳定可靠后,确实反映产品差异的是后端技术。从Amazon来看,产品和平台制造商的游戏论亚马逊完成了Echo家庭的产品发表会,其电力。

商业网站可能只买Echo产品,而且价格完全不行,这很有趣。Amazon希望Alexa的生态,希望Alexa成为AI平台。但是,从现在的困境来看,Alexa的平台进展可能还不如龙凤。

Amazon可能只对推进自己的产品感兴趣。更何况,Alexa故意为产品开发厂商生产了很多困难。这也很容易解读,平台的对外开放和堵塞本来就是不相容的关系,平台的本能是对外开放,产品的本能容易堵塞,这是两种生态的竞争,还没有一家公司需要兼容包装。

例如,苹果依靠iPhone系列建立了堵塞的平台系统,谷歌依靠Android建立了对外开放的平台系统。从Amazon现在的表现来看,南北Apple的可能性更高,实际上对外开放的只有内容和服务,像AppleAppleStore一样。这也很容易解释,因为平台必须积累大量的客户,并同意偏向于需要给大量客户的生态合作伙伴。

预测德国欧洲杯阵容

如果这个生态合作伙伴仍然是自己的,没有理由不支持自己的产品。因此,Echo持续降价,销售量大幅上升,其他生态伙伴无法生存,但从Amazon来看也不是最重要的。因为无论用户从哪里来,其核心意见实质上都超过了。Amazon的用户积累到一定规模时,自然会构成平台的优势,反而不会给后端开发的用户带来利益空间,也会构成相反的逻辑。

从相反的逻辑到达,Amazon的野心是明确的。这意味着挑战其他大公司的意思。由于语音流构成,无论是搜索还是社交,Amazon意味着有兴趣,当然电器商品本来就是Amazon的优势。

因此,Amazon和谷歌最近在Youtube竞争也不奇怪。我相信这件事不会再发生了。这对我们国内远程语音交流生态有什么救赎?这可能会影响产品制造商、前端技术提供商和后端技术提供商,后端技术提供商实质上是平台。

其中,这对前端技术方案商没有太大影响,但麦克风阵列、觉醒和识别是管道型技术,同时服务于产品和平台两大厂商,其核心表现意见更好,没有太多其他要求的价值,也就是说,这一部分在网络思维中实现也没有什么落脚点。但是,产品制造商和平台制造商很纠纷,产品和平台制造商都需要用户,用户量充足时,产品和平台后端的追求价值不会突出。但是,构筑这个目标是实力的硬洞,是南北对外开放模式还是堵塞模式?对外开放模式一定意味着退出自己的产品,希望生态,和生态伙伴一起发展。

堵塞模式必须同时投入金的同时建立产品和平台,两败俱伤。这是一个难题,也是一个公司的战略决策。

很难说哪种模式需要在未来取胜,但摆在两种模式之间的制造商肯定没有发展空间。因此,战略识别和决策往往是公司的核心能力。

文章:反省模仿Echo的热潮:为什么海外巨头要配置AI交流?远程语音交互体验的思考:Alexa为什么不需要屏幕和多次对话?|深度AppleHomePod技术理解,为什么苹果变丑了?数麦克风技术和市场,远场语音交流如何选择麦克风?重生的兴奋,人工智能创业的困境和情绪特约原稿,允许禁止发表。下一篇文章发表了注意事项。


本文关键词:欧洲杯2021预测,预测德国欧洲杯阵容

本文来源:欧洲杯2021预测-www.3132balboa.com