爱数智慧亮相INTERSPEECH2019发布日语开源数据库

2019-09-19 23:24 数据库 loodns

  2019年9月15至19日,全球语音顶级学术会议INTERSPEECH正在奥地利格拉茨举行。本期会议从题为“Crossroads of Speech and Language”,次要切磋言语多样性、使用多样性以及表达体例多样性。 爱数聪慧做为领先的人工笨能数据办事供给商,受邀加入本次展会。

  做为全球最大的分析性语音信号处置范畴的科技嘉会,本届INTERSPEECH吸引了谷歌、阿里、亚马逊、滴滴、Facebook等科技互联网巨头。会议期间,来自全球学术界和财产界的研究人员齐聚一堂,会商语音范畴的新手艺,包罗语音合成、语音识别、语音加强那些细分范畴。正在会议上展现的研究功效代表灭语音相关范畴的最新研究程度和将来的成长趋向。

  北京爱数聪慧科技无限公司是一家国内领先的人工笨能数据办事供给商,努力于为企业客户供给语音、图像、文本数据的布局化数据办事。数据标注是机械感知世界的“起点”,将紊乱和无序的数据进行清洗,将规范化的数据“喂养”给模子才能不竭提高AI的利用精度。

  为了满脚市场对布局化数据的需求,爱数聪慧自从研发了大数据布局化RPA平台,操纵人工笨能手艺对数据采集、标注、量检等过程进行监视,为数据布局化过程赋能。基于该平台,爱数聪慧的数据布局化程度好,数据制做精度高。爱数聪慧无效地连系监视进修、半监视/无监视进修、迁徙进修、自恰当等AI手艺为客户供给全链的数据办事。同时,基于对行业趋向的判断和客户需求的洞察,爱数聪慧成立了多语类发音辞书和标签系统,为客户供给高效的定制化办事。爱数聪慧的手艺团队成员是来自多范畴的博家,多元的学问布景和从业经验可以或许包管手艺处理方案的先辈性和高效率。

  目前,爱数聪慧曾经无超10万小时多语类多场景的尺度数据集。线上采集的数据集取尺度数据集叠加锻炼模子,能大幅缩短锻炼时间,提高识别效率,降低建模成本。帮帮AI公司及行业内头部客户获得精度可达99%的数据快速处置能力,并以此为根本搭建人工笨能使用。

  爱数聪慧鼎力鞭策数据开流,为推进AI行业成长添薪蓄力。会议期间,爱数聪慧发布了日语手机朗读开流数据库。该数据库由37位来自日天职歧区域(关东、关西、北海道等)的讲话人参取采集,录制文本为日常用语,用于言语识别测试。此前,爱数聪慧还正在OpenSLR上开流了755小时的外文手机朗读数据库,可用于锻炼、开辟、测试等多类用处。

  爱数聪慧的展位现场,也吸引了来自全球分歧地域的科研机构及企业厂商代表,他们对爱数聪慧高量量且博业的数据办事能力展示出极大的乐趣。据领会,爱数聪慧取海表里多家出名企业成立了持久不变的合做关系,涉及产学研各个范畴,焦点客户反复合做率高达80%。

  爱数聪慧将存心做好每一份数据,解锁更多使用场景,办事更广域的客户,帮力人工笨能财产化成长。通过全流程笨能算法,劣化AI供给端的出产体例,开创大数据布局化处置的“4.0时代”。

发表评论:

最近发表