描述
使用AudioLabeler应用程序,您可以在区域级别和文件级别上标记真实数据。
使用该应用程序,您可以:
创建标签定义以实现一致且快速的标签。
在播放期间可视化时域波形。
在文件级别和区域级别交互式指定标签。您可以通过直接在时域波形上绘制来指定区域。
录制新音频以添加到您的数据集中。
对检测到的语音区域应用自动标记。
使用第三方语音转文本转录服务应用自动词标签。有关更多信息,请参见语音转文本转录。
该应用程序将数据导出为labeledSignalSet对象。您可以labeledSignalSet用来训练网络,分类器,或者分析数据和报告统计信息。
打开音频标签器应用程序
1、MATLAB®工具条:在应用程序选项卡,在信号处理和通信,点击应用程序图标。
2、MATLAB命令提示符:输入audioLabeler。
2使用音频标记器创建关键字发现蒙版
在此示例中,您为音频信号创建逻辑掩码,其中一个对应于发声“是”,零对应于不存在该发声“是”。要创建遮罩,您可以通过Audio Labeler应用程序使用IBM™语音文本API。
本示例要求您安装语音转文字转录功能。
收听您要标记的音频文件,然后在时域中对其进行可视化。
[audioIn, fs] = audioread (" KeywordSpeech - 16-16 - mono - 34 secs. Flac ");
Sound (audioIn, fs)
T = (0: numel (audioIn) - 1)/fs.
The plot (t, audioIn)
Xlabel (' time (s) ')
Ylabel (' amplitude')
打开Audio Labeler应用程序,然后将KeywordSpeech-16-16-mono-34secs.flac文件加载到数据浏览器中。
在“自动化”下,单击“语音转换为文本”。在“语音转文字”选项卡上,选择首选的语音转文字API。本示例使用IBM语音到文本API。选择“分段词”,以便将文本标签分为单个词而不是句子。单击运行以与语音转文本API交互并创建一个新的关注区域(ROI)标签。ROI标签包含由IBM的语音文本API检测并标记的单词。
关闭语音转换为文本选项卡,然后将标记的信号集导出到工作区。
标签将作为labeledSignalSet带有时间戳的对象导出到工作区。将变量设置为labeledSet带时间戳的labeledSignalSet对象。
labeledSet = myLabeledSet;
7检查SpeechContent标签。
Marked speechContent = Set. Labels. SpeechContent {1}
语音转文字API以秒为单位返回ROI标签的限制。使用该SpeechContent表创建逻辑向量。
KeywordLabels = speechContent (speechContent Value = = "yes", :);
KeywordROILimitsInSamples = round (keywordLabels ROILimits * fs);
Mask = zero (size (audioIn), "logic");
For I = 1: size (keywordROILimitsInSamples)
Mask (keywordROILimitsInSamples (I, 1) : keywordROILimitsInSamples (I, 2)) = true;
The end of the
9绘制语音信号和关键字识别蒙版。
The plot (t, audioIn,...
T, mask)
Xlabel (' time (s) ')
Ylabel (' amplitude)
Legend (" audio ", "the key word ornament mask", "location", "southeast")
https://www.izhinan.cn/article-10378-1.html以上内容就是关于【定义和可视化真实标签 】的指南经验分享;您也可以通过下方的评论互动,发表您的意见和观点,让更多人通过生活指南经验分享因之受益,让生活变得更简单。