自然对话语音标注规范

来源:网络收集 时间:2025-04-29 下载这篇文档 手机版
说明:文章内容仅供预览,部分内容可能不全,需要完整文档或者需要复制内容,请下载word后使用。下载word有问题请添加微信号:xuecool-com或QQ:370150219 处理(尽可能给您提供完整文档),感谢您的支持与谅解。点击这里给我发消息

标注内容

两个人的自然对话。每组对话45分钟左右,每组对话可能有一个或分成多个wav文件保存(文件名以ZXXXX开头,例如Z0001**.wav表示属于第1组对话)。

质量要求

? 文字错误率:3%以内

? 注:文字错误率指语音内容标注错误,只要有一个字错,该条语音就算错。 ? 其他错误率:5%以内

? 注:综合错误率指:除了语音内容以外的其他标注项错误,只要有一项错,该条语音

就算错。

标注工具

praat.exe,输出textgrid格式的标注结果(TextGrid文件)

标注要求

根据不同说话人加时间戳(每个片段不超过10秒,如果说话人连续说了10秒以上,可按句子截成多个10秒以内的片段)

并标出说话人的文字内容

? 无效语音段写为W:听不清的、抢话的、噪音大、静音的语音片段均被认为无效

? 语音内容必须和听到的语音完全一致,不能多字、少字、错字。

? 阿拉伯数字要写成汉字形式,如“一二三”,而不是“123”。注意区分“一”和“幺”。

“二”和“两”

? 标注中只能含有中文、英文以及常用标点符号(空格、逗号、句号、问号) ? 语气词: 音频中说话人清楚地讲出的语气词,如 “呃 啊 嗯 哦 唉 呐”等,要按照正

确发音进行转写。语气词除了“了 不 ”没有口字旁,其他基本上都有口字旁。 ? 转写内容的完整性要与实际发音一致,不得删减;

? 如发音为:我是北 北京人;“北”字有重复现象,那转写的时候要写成:我是北,

北京人。

? 英文比较复杂,转写的原则是:按字母读的情况(如缩写词,网址等)一律大写,按

词读的则小写,例如“APPLE”表示用户是逐个字母念的,“apple”表示用户按单词念的。

? 明显的儿化音必须标注出来

? 句子间要用标点符号隔开。例如“就把这事跟我妈说了我妈也挺生气的就找来我舅其

中有个哥是我舅家的孩子”应写为“就把这事跟我妈说了,我妈也挺生气的,就找来我舅。其中有个哥是我舅家的孩子”

上述文字内容中的特殊标记

? *:表示人发音但无法标注语音(有一两个字听不懂或听不清) ? 如果有噪音,则需在噪音开始的位置插入噪音符号。

第 1 页 共 6 页

a) [f]: 表示说话人说话过程中的暂停停顿,例如发音:“uh”, \”, \” 和 “mm”。 b) [s]: 表示说话人的各种非文本内容的噪声信息,包括唇咂嘴,咳嗽,清嗓子声,

啧啧声,重呼吸,笑声。

c) [n]: 非人发出的声音,主要是一些偶然出现的噪声,例如:鼠标操作声音,敲击键

盘的声音等。

d) [t]: 稳定的噪声,主要是录音环境的一些非偶然噪声,例如周围音乐,风声,空

调声等。

e) [p]: 非说话人的周围人发出的声音,包括,唇咂嘴,咳嗽,清嗓子声,啧啧声,

重呼吸,笑声。

附:标注工具用法

1. 对一个没标过的录音文件进行标注

1) 双击标注软件praat.exe,弹出三个界面,只保留Praat objects即可,其他关闭。 2) 点击菜单栏中“Open”下的“read from file...”按钮,载入某个录音文件(如a.wav) 3)选中该录音文件a.wav,在右侧菜单中选择Annotate下的To TextGrid,如图1所示:

图1 生成TextGrid

a) 在弹出的对话框中,将第二项Which of these are point tiers设为空(删去原来的Bell)。

第一项All tiers name设为两个说话人的代号

第 2 页 共 6 页

? 如果是一男一女对话,则填写“男 女” ? 如果是两个男的对话,则填写“男1 男2” ? 如果是两个女的对话,则填写“女1 女2”

图2 两个女的对话

图3 两个男的对话

图4 一男一女对话

b) 点击OK,会自动生成和语音文件名同名的标注文件,如a.TextGrid。按住Ctrl键同时

选中语音文件a.wav和标注文件a.TextGrid,点击右侧的view&Edit按钮,出现标注界面。

第 3 页 共 6 页

图6 标注界面

图中最上面显示语音波形,下面依次显示定义的两个说话人层。单击标注界面左下角的“in”(或键盘按ctrl+i)、“out”(或键盘按ctrl+o)按钮可以在时间轴上放大或缩小语音波形显示。用标注界面最下的滑动条可以在时间轴拖动语音波形。

播放技巧:

? 按键盘上的”Tab”键可以播放或暂停语音(鼠标点在某个位置,会从该位置往后播放)。 ? 鼠标框选一个区域后,可以点Tab键或最上面或最下面的时间值,都可播放该区域语

请点击标注界面右上角的最大化按钮,这样可以显示全(否则最下方的滚动条可能显示不出来)。

点击播放选中语音 c) 生成语句分隔符:根据文本和发音来确定一段语音的分隔点,具体操作方法是在语音

波形上用鼠标点击两段语音之间的静音段,即出现一条红色虚线,同时该红色虚线与下面的说话人层相交两个空心圆圈。用鼠标点击两个空心圆圈内部,会出来两根相连

第 4 页 共 6 页

的蓝线,从而隔出一段语音(如图7所示)。

点击生成分隔线

图7 如何生成分隔线

(注:分割线可以移动位置。要去除分隔线,需选中该分隔线,然后点击菜单栏中

“Boundary”下的“Remove”按钮或按快捷键Alt+BackSpace,即可去除该分隔线)。

点击说话人层后,可以看到该语音段被选中(变成粉色),按Tab键或点击最上面或最下面的时间值,都可播放该段语音。

d) 根据说话人层(“女1 女2”或“男1 男2”或“男 女”),将某段语音对应的文字内

容填到该说话人层中,表示是该说话人说的话。因为需要区分两个说话人,所以不能把A的说话内容放到B的层里。

e) 标注文件的保存:标注完成后,点击菜单栏中的“File”下的“Save TextGrid as text file...”

(建议用快捷键ctrl+s)按钮,弹出一个保存对话框,然后点“确定”,即完成一份录音文件的标注。

注:工具不会自动保存你的结果。所以为了避免数据丢失或工具异常,标注中间要勤保存,多按ctrl+s,若系统提示文件已存在,则点击替换。

f)每屏只会显示30秒的时长,所以记得点最下面的滚动条来显示并标注后面的。

第 5 页 共 6 页

2. 对一个标过的录音文件(可能没标完、可能已标完)进行修改或查看

1)双击标注软件praat.exe,弹出三个界面,只保留Praat objects即可,其他关闭。 2)从Praat objects菜单中选中“Open”下的“read from file...”,分别载入录音wav文件和TextGrid标注文件,按住Ctrl键同时选中这两个文件,点击右侧的View & Edit按钮即可在弹出的标注界面里修改。

第 6 页 共 6 页

百度搜索“70edu”或“70教育网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,70教育网,提供经典综合文库自然对话语音标注规范在线全文阅读。

自然对话语音标注规范.doc 将本文的Word文档下载到电脑,方便复制、编辑、收藏和打印 下载失败或者文档不完整,请联系客服人员解决!
本文链接:https://www.70edu.com/wenku/170997.html(转载请注明文章来源)
Copyright © 2020-2025 70教育网 版权所有
声明 :本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果我们转载的作品侵犯了您的权利,请在一个月内通知我们,我们会及时删除。
客服QQ:370150219 邮箱:370150219@qq.com
苏ICP备16052595号-17
Top
× 游客快捷下载通道(下载后可以自由复制和排版)
单篇付费下载
限时特价:7 元/份 原价:20元
VIP包月下载
特价:29 元/月 原价:99元
低至 0.3 元/份 每月下载150
全站内容免费自由复制
VIP包月下载
特价:29 元/月 原价:99元
低至 0.3 元/份 每月下载150
全站内容免费自由复制
注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信:xuecool-com QQ:370150219