“说话人识别和分割”

寻找将媒体文件处理为“谁说什么以及何时”的代码,换言之,“扬声器分段扬声器”以及每个时序的时间。 失败的答案:做任何手动工作来处理媒体文件..谢谢!

您可以使用Kaldi的扬声器分类,设置起来不容易,但效果很好。

还有很多其他的图书馆 – LIUM,bob等。