用科大讯飞的比赛数据集 17种语言
主要基于lstm和lstm的一些变式
语音先截取 然后对齐 分帧计算mfcc及一二阶差分 得到 帧数*39 的输入
输入到lstm中进行训练 adam优化器
目前来看 三层的lstm效果比较好
训练集大概95% 开发集60% 但是最终的测试集只有35%左右
主要训练集选取有点不太恰当 然后数据的处理也做的比较粗糙 看看有没有时间再改一下
吐槽一下 拿我的破笔记本的7200u和940mx跑tensorflow真的难受

Last modification:July 30th, 2020 at 10:52 am
如果觉得我的文章对你有用,请随意赞赏