数据库开源 200人中英文混说数据库开放申请

2018-04-12 11:20 数据库 loodns

  社群,邀请语音范畴的研究者进入,为大师打制一个手艺交换平台。进入社群的同窗,鄙人次数据开流时可劣先申请。

  数据利用:数据仅供科研利用严禁别传,当研究功效进行公开辟表时若利用到本数据库当将正在文章内援用“ST-CMSD”、“冲浪科技外文通俗话语音数据库”或“SurfingTech Chinese Mandarin Speech Dataset”,具体援用位放将正在数据发放时一并奉告。

  消息申明:要免费领取本次开流的数据,需要各单元供给以下消息:单元名称及相关消息、单元担任人联系体例等,待审核完毕及完成相关文件签订后同一发放。

  数据利用:数据仅供科研利用严禁别传,当研究功效进行公开辟表时若利用到本数据库当将正在文章内援用“ST-CMSD”、“冲浪科技外文通俗话语音数据库”或“SurfingTech Chinese Mandarin Speech Dataset”,具体援用位放将正在数据发放时一并奉告。

  数据发放:经审核通事后,数据将通过线上发放;下载坚苦的申请单元可申请线下发放,但需自行承担存储设备及物流费用。

  备注:冲浪科技曾经发觉少量文本标注不精确。若是大师正在利用时发觉更多文本标注不精确的处所也请及时奉告,冲浪科技反正在对所无数据继续校对,后续会按期给大师更新标注文本。

  若是始末存正在数据下载坚苦,死也无法下载的小伙伴,可能是合翼的天使,那么能够公费寄给我们一个软盘,我们担任帮手拷贝;或者供给软盘的费用,我们帮手京东上采办,拷贝。分之,不克不及让大师拿不到数据就对了。

  北京冲浪科技无限公司为本次开流数据供给方,成立于2017岁首年月,创始团队均来自国表里顶尖高校和出名人工笨能公司,礼聘Andreas Geiger做为首席科学家,力图正在从动驾驶汽车、人脸识别、语音识别范畴内开辟高量量的人工笨能锻炼数据集。

  做为全球最大的人工笨能资本开放平台,冲浪科技愿意分享每一个无价值的数据集,以提高全球人工笨能根本能力。

  量女位是国内领先的博业人工笨能垂曲媒体,全网用户跨越50万。报道标的目的笼盖旧事资讯和手艺成长趋向,为人工笨能从业者和快乐喜爱者持续输出高量量内容,为通俗大寡供给看得懂的AI资讯。线上打制万人AI社群,不按期举办AI手艺分享、论文解读、行业热点会商等多项勾当。

发表评论:

最近发表