您当前的位置:中国科技头条网要闻正文

AI录音笔一战成名搜狗以言语AI为中心要点打破多点开花

时间:2020-04-08 04:20:29  阅读:1693+ 作者:责任编辑NO。卢泓钢0469

新智元原创

修改:白峰、鹏飞

老罗4月1号的直播首秀,种草了一款十分火爆的AI产品,搜狗的AI录音笔S1。

老罗和帮手边开吹风机边录音,搜狗S1完美降噪并复原出明晰的语音冷艳全场,S1背面躲藏了哪些AI黑科技?从输入法到查找,再到今日火遍全国的AI录音笔,搜狗正悄然推进整个AI职业的技能革新。

老罗种草的搜狗S1录音笔背面究竟躲藏了哪些黑科技,今日咱们就来一睹为快。

连苹果产品都不放在眼里的老罗,为何被一款录音笔冷艳到?

老罗对产品的了解以及极致的寻求,导致他是一个不会容易夸奖产品的人,尤其是电子科技类产品。他做锤子的起点,也是由于市面上的产品没有到达他的“抱负态”。可是在 4 月 1 号的直播首秀,老罗却被一款录音笔的 AI 黑科技震慑到,绝口称誉,这款录音笔便是搜狗刚刚推出的 S1。

光说不练假把式,在两百多万网友的亲眼见证下,老罗的帮手现场敞开吹风机,一起老罗揉起一张噪音十分大的糖纸对 S1 的录音进程进行搅扰,录音完毕现场回放,S1 的 AI 降噪作用震动全场,在如此巨大的噪音搅扰下,搜狗 S1 经过一个简略的点按操作完美复原了当事人的明晰语音,让老罗直呼“了不得”。

众所周知,老罗的粉丝是对科技、对极致产品、对匠心有寻求的一群人,可以说搜狗的 AI 录音笔满意和逾越了粉丝们的等待,直播仅仅展现了 S1 强壮的 AI 降噪功用,实际上 S1 能做的远远不止这些,接下来咱们就来看看 S1 都集成了哪些黑科技,才干到达如此冷艳的作用。

8麦克风阵列和AI加持,吹风机对着狂吹也不怕

直播进行到一个小时,搜狗CEO王小川出现在直播间,川总开端介绍自家的产品,向咱们透露了录音笔完美降噪的隐秘。

本来S1用了“8麦克风阵列”,直观上来看,麦克风多了天然会收集到更多更广的声响,但强壮的硬件仅仅完结了更准的拾音,要想完结降噪,还需求一系列的AI音频处理技能。

直播完毕,小编赶忙去搜了搜,一款被吹爆的录音笔就这点本领?一搜没关系,直播中展现的仅仅是S1许多黑科技的冰上一角,S1还有一个很重要的功用是支撑“语音转文字”,现在支撑中英日韩等10种言语、川粤津陕等10种方言的录音和转写,官方称实时转写精确率达98%。除了实时转写,S1还支撑整个录音文件的转写,看官方数据1小时的录音只需求5分钟即可完结,高效!

假如我录了许多音频,怎样才干找到我需求的文件?带着这个疑问咱们去检查了S1的查找功用阐明,居然支撑各种标签组合查找录音内容,比方按时刻、按文件巨细或许两者组合等等。录音转好了,我想在 PC 端检查,还要经过 USB 导出到电脑?这样就out了,搜狗 S1 支撑一键云端同享,只需一次存储,手机APP、网页端、PC 客户端都有了!

以言语为中心布局AI,搜狗许多黑科技相继落地

沉寂多年的录音笔商场因S1再次成为热门,让搜狗在智能录音笔职业再下一城,与搜狗“以语音AI为中心”的战略布局是分不开的。

其实,搜狗早就开端了AI范畴的布局,并具有许多的AI软硬件落地产品,软件技能包含搜狗同传、AI录音笔的自在对话翻译、输入法变声、AI组成主播、一站究竟汪仔的智能问答技能等。

输入法+变声:用马云的声响和好友谈天

AI 变脸变声早就有了。可是将 AI 变声功用整合到输入法中,肯定堪称是搜狗的一次绝佳构思。

以往的变声方法十分繁琐,不只额定下载 app,两个 app 之间还得来回切换。搜狗将变声融入到输入法中,用户不需求跳出其时的对话就可以即时变声。

一般的变声软件仅仅简略的更改了音频,比方将用户的声响变细来仿照萝莉,变粗来仿照大叔。

而搜狗知音的语音技能团队则是从语音表征学习、语音组成等范畴切入。用表征学习来学习源端说话人的音色、内容、韵律这三大特征,再利用语音组成技能,将源端说话人的特征和要转化的人物特征组成为终究变声响频,到达各个方位的相似和天然。

如此一来就打破了音色转化的限制,用户都可以变声成特定的人物声响,比方王者荣耀里的妲己、海绵宝宝,乃至马云,而且复原度极高、自在空间大。

多模态语境同传:机器同传初次完结会看、能了解、会推理,正确率进步 40%

同一个词,放在不同的语境下意思或许截然相反。例如 LOL,在谈天的时分它即或许表明 laugh out loud,也可以表明 Lords of Legends,需求结合其时的语境来判别。

相似的了解错位,在同传的时分十分影响与会者对演讲者内容的了解和参会体会。搜狗推出的首个具有多模态认知才能的同传体系,创始了“语境引擎”,在搜狗同传“听”的基础上,增加了“看”和“能了解会推理”两项新技能,PPT 内容翻译正确率进步 40%!

经过“看”来自主学习演讲者的演示内容,再经过“了解”和“考虑”讲演讲者的内容,愈加精确的辨认并翻译出来。再一次引领了职业的技能进步!

不但有声还有影:AI 组成主播,不只能报新闻还能当法官

2019 年 3 月 3 日,全球首位 AI 组成女主播在央视正式上岗,引发全球热议。

该主播使用了“搜狗兼顾”技能,经过模拟人说话时分的声响、动作、表情、肢体言语等,让 AI 组成主播看起来更像一个真人,可以来回走动,肢体还会合作说话的内容做出相应的动作。

搜狗乃至还推出了 AI 虚拟法官,经过北京互联网法院的在线才智诉讼服务中心为民众供给更为快捷、高效的线上诉讼服务。

春节前夕,搜狗将兼顾技能应用到输入法,用户都可以直接打字进程中,直接让虚拟气候主播“雅妮”实时播报气候。

更重要的是,搜狗兼顾技能在国内外尚属首例,总算有一个国人独有的技能了!

搜狗汪仔:研制 9 个月耗资 4000 多万,江苏卫视《一站究竟》一战成名

2 年前,搜狗汪仔就在江苏卫视的智力应战节目《一站究竟》大放异彩,以 0:3 局面,终究却以 8:6 取胜,让现场的所有人包含电视机前的观众都震慑不已。

早在几年前,IBM 超级核算机体系“沃森”(Watson)也曾在美国智力游戏 Jeopardy!(风险边际)上,打败了其时最强人类选手。不过 Watson 是特别接口文本输入,输入内容精确无误,且答案限定在特定范围内。

但汪仔面对的难度提升了好几个台阶。首要主持人不需求彻底念完标题,在念题进程中选手可以随时抢答。汪仔正是经过语音辨认和图像辨认两种技能的结合,精确辨认标题并敏捷给出答案。

其次《一站究竟》的标题是不给定类别的,需求汪仔经过算法来辨认问题的类别。

除了会答题外,这个汪仔谈天的才能也很强,撩起妹来也是一把能手。

别看表面有点萌,其实汪仔背面是语音辨认、OCR、天然言语了解、数据发掘、信息检索、常识图谱和文本核算等多项 AI 技能的结合。

AI进化论:技能让严寒的东西,变成有温度的智能助理

技能,终究要服务于人类。

为什么咱们要寻求无人驾驶、语音助理、会话机器人等等新技能,意图不是为了替代人类,而是为了可以让机器人像人类相同与咱们交流。让东西习惯咱们,而不是咱们去姑息东西。

冷冰冰的东西,终究要变成一个有温度的,会替咱们考虑、为咱们服务的助理。就好像搜狗输入法让打字东西变成写作助理、查找让检索东西变成问答助理、录音笔让声响记载东西变成信息助理。

搜狗的开展,正在耳濡目染地推进整个AI职业的技能革新,为职业和用户发明更大的价值。

“如果发现本网站发布的资讯影响到您的版权,可以联系本站!同时欢迎来本站投稿!