企业培训资讯_企业培训干货

当前位置:首页 > 名师团队 > 导师语录

谷歌开发全新监督学习模型区分讲话者声音,准确率达92.4%【AGapp官网下载】

发布时间:2021-06-16    来源: ag网站入口77413

本文摘要:(公共编号:)新闻将多人声音的声音流分为与每个人相关的同类段落的过程,是声音识别系统的最重要部分。

(公共编号:)新闻将多人声音的声音流分为与每个人相关的同类段落的过程,是声音识别系统的最重要部分。通过解决问题谁在说话的问题,区分说话者的能力可以应用于医疗对话和视频字幕等最重要的场景。这个过程对人类来说非常简单,但对计算机来说几乎不同,为了选择每个人的声音,必须训练先进设备的机械学习算法,监督自学方法训练这些系统非常具有挑战性。

谷歌人工智能研究科学家ChongWang在博客文章中表示,他们最近开发了一种叫做只有监督演讲者区分的新模式,该模式试图以更有效的方式使用不受监督的演讲者标签。这里的唯一意味着说话者区分系统中的所有模块,包括统计数据说话者的数量,以免受监督的方式进行训练,从减少可用的标记数据量中获利。与标准监督区分任务不同,强有力的区分模式必须将新个体与不参加培训的不同语音段相关联。这大大允许了在线和在线区分系统的质量,在线系统一般不会受到更多影响。

因为必须动态服务公司的结果。在NISTSRE2000。

在CALLHOME标准测试中,该系统的DER(DiarizationError)低至7.6%,高于以前基于聚合方法的8.8%,基于DNN映射方法的9.9%。此外,该系统基于在线解码,特别是动态应用。为了加快这个方向的更好的研究,谷歌自由选择了开源核心算法。

聚类和交叠式RNN现代演讲者的区别系统一般基于聚类算法,如k平均值或序列聚类。这些聚类方法没有监督,不能充分利用数据中可用的监督演讲者标签。

在线分类算法一般用于具有流动音频输出的动态区分质量。(记录1:k平均分类是矢量分析方法,最初来自信号处理,是数据挖掘中分类分析的常用方法。

k平均分类的目的是将n个观测值分为k个分类,其中各观测值属于最近平均分类,作为分类的原型。(记录2:序列分类技术利用数据相似矩阵的序列(特征值)展开降低维度,以更小的维度分类,以相似矩阵为输出,数据集中在各对点的相似性定量评价中。谷歌的新模型和罕见的聚类算法的重要区别在于,所有演讲者的映射都是通过参数共享RNN建模的,不同的RNN状态在时域内重叠区分的演讲者。为了理解其工作原理,谷歌制作了以下例子。

其中有绿、朱、粉、蓝四种可能的演讲者,各演讲者以自己的RNN例子(在所有演讲者之间共享的公共初期状态)开始,在等价来自该演讲者的新映射的情况下维持改版RNN状态。在例子中,蓝色演讲者不断更新RNN状态,直到另一个演讲者变黄为止。蓝色几天后,RNN状态将完全恢复。(这只是右图中语音段y7的可能性之一,如果新的演讲者变绿,就以新的RNN例开始。

)将演讲者反应为RNN状态,使模型自学用于RNN参数与不同演讲者与演讲者共享的高级科学知识,确保了更好地标记数据的可用性。相比之下,罕见的聚类算法始终是独立国家处置每一个分离词,从大量标记数据中获益无穷。所有这些结果都可以通过等价时间标记的演讲者标签(也就是告诉谁什么时候说话),用标准的随机梯度提高算法训练模型,训练的模型可以区分没有听说过的演讲者的新话。另外,用于在线解码,更适合延迟脆弱的应用程序。

(记录3:随机梯度上升算法也称为增量梯度上升算法,是优化微目标函数的递归方法,是梯度上升优化的随机近似。之所以被称为随机,是因为样本是随机自由选择(或混洗)而不是单组(如标准梯度上升),或者根据训练集中在经常出现的顺序自由选择。

)未来工作的ConstellationRearch分析师HolgerMueller应对,人类的说话速度比打字速度慢,声音是更自然的输入方法。在喧闹的环境中很难进行语音识别,尤其是当许多人说话时。HolgerMueller说:这个领域的任何进展都会进一步推进语音交互的应用,谷歌这个系统的频繁出现可能会超越用户和智能设备的对话。

AGapp官网下载

尽管已经通过该系统获得了令人印象深刻的性能,但谷歌仍在继续改进该模型,希望综合上下信息,继续实施离线解码,进一步减少DER,使延迟不脆弱的应用更加简单。其次,谷歌需要模拟声学特征,而不是d向量,而是通过终端到终端训练整个演讲者的区别系统。

与此同时,ChongWang的团队还要求开源新算法,并获得GitHub,以便其他人参与做出贡献。原始文章允许禁止发布。下一篇文章发表了注意事项。


本文关键词:AG视讯安全网站,AGapp官网下载,ag网站

本文来源:AG视讯安全网站-www.rw303.net

分享到:
二三线城市商业地产空置严重 三大难题“冷冻”商改租_AGapp官网下载 AG视讯安全网站|中孚实业全面触底回升决战决胜“三大攻坚战”
热门文章
腾讯翻译君亮相“一带一路”论坛成“翻译国家队”战略合作伙伴【AG视讯安全网站】
专访光鉴科技CEO朱力:打破苹果垄断,自研芯片打造低成本3D视觉解决方案|AGapp官网下载
被微软“放养”的LinkedIn|AG视讯安全网站
【AGapp官网下载】数据中心新品发布:数据驱动世界,英特尔驱动数据
【ag网站】共享汽车遭遇“倒春寒”?友友用车宣布倒闭
雷锋网2019「AI最佳掘金案例年度榜单」正式揭晓_AG视讯安全网站
2017米粉健康报告发布:高血压占比21%
【AGapp官网下载】开放职位512个,基本工资最高26万美元——美国人工智能就业市场全景一览|雷报050期
阿里巴巴、欧尚零售、润泰集团达成新零售战略合作【AGapp官网下载】
使徒行者2黑帮大反派“欢喜哥”表情包图片
来了!5G和AI的未来这10位行业领袖这么说:AG视讯安全网站
AG视讯安全网站-京东快递新增一批寄件城市 服务已扩至31城
ag网站-Uber推出UberFreight服务,货车司机版的打车服务
中国联通和英特尔打造智慧冬奥5G仍是英特尔战略重点-AGapp官网下载
HomeKit降低产品开发门槛,睡狮终于要觉醒了?|ag网站
客户案例
×