因为汉字博大精深的文化底蕴,和当前技术发展的限制,语音合成还不能做到百分之百的准确。为满足客户在各种复杂环境的个性化需求,特推出以下文本控制标记,用于灵活控制汉字发音的变化。
系统会将文本控制标记当做文本进行合成。文本控制标记可以连同其它文本一起发送合成,也可以单独发送合成。
文本控制标记都会当做全局有效,恢复默认除外。
所有的文本控制标记均为半角字符。
不符合以上可识别的“文本控制标记”的或者格式不对的,一律按普通的字符和数字处理。
文本控制标记中的数字超过范围的,均按默认值处理。
[r001]是有效的文本控制标记,等价于[r1];其他的类似。
特别说明:对于有些带显示屏的用户,一段文字既要用于合成播报也要用于屏幕显示的情况下,为防止控制标记被显示在屏幕上,可以进行以下两种方法处理:
1. 用于播报的文字段和用于显示的文字段,分开存储和管理。
2. 用于播报的文字段删除控制标记后再显示到显示屏。
发送相应的“文本控制标记”还可以设置语音合成的参数等(例如设置:音量,语速,发音人)
若用户要恢复默认参数,有以下几种方式:
发送“[d]”:会恢复“用户参数控制标记”的所有参数为默认
发送“[m3]”:会恢复“发音人控制标记”参数为默认
发送“[g0]”:会恢复“语种控制标记”参数为默认
发送“[d][m3][g0]”:会恢复“用户参数控制标记”、“发音人控制标记”、“语种控制标记”参数为默认
作用 | 控制标识 | 默认设置 | 详细说明 |
发音人选择 | [m*] | [m3] |
3 - 晓玲 (女声) |
作用 | 控制标识 | 默认设置 | 详细说明 |
数字处理策略 | [n*] | [n0] |
(*=0/1/2) 0 - 自动判断 1 - 数字作号码处理 2 - 数字作数值处理 |
语速调节 | [s*] | [s5] |
(*=0~10) * - 语速值(0 至 10) 说明:语速值越小,语速越慢 |
语调调节 | [t*] | [t5] |
(*=0~10) * - 语调值(0至10) 说明: 语调值越小,基频值越低 |
音量调节 | [v*] | [v5] |
(*=0~10) * - 音量值(0至10) 说明: 音量的调节范围为静音到音频设备支持的最大值 |
提示音策略 | [x*] | [x1] |
(*=0/1) 0 - 不使用提示音 1 - 自动使用提示音 |
中文拼音识别 | [i*] | [i0] |
(*=0/1) 0 - 不识别汉语拼音 1 - 识别汉语拼音 说明: 拼音模式为:1至6位字母 + 1位数字 声调用1位数字表示(1:阴平 2:阳平 3:上声 4:去声 5:轻声) |
中文姓名读音策略 | [r*] | [r0] |
(*=0/1/2) 0 - 自动判断姓名读音 1 - 强制以后的每句开头字均按姓氏读音 2 - 强制紧跟句的开头字按姓氏读音 |
中文号码“1”读法 | [y*] | [y0] |
(*=0/1) 0 - 合成号码时"1"读成"幺" 1 - 合成号码时"1"读成"一" |
中文韵律标注策略 | [z*] | [z0] |
(*=0/1) 0 - 不处理韵律标注 1 - 处理韵律标注 说明:韵律标注中 使用“#”标出韵律短语划分位置。 使用“*”标出韵律词划分位置。 |
中文发音风格 | [f*] | [f1] |
(*=0/1) 0 - 一字一顿 1 - 平铺直叙 |
中文读标点策略 | [b*] | [b0] |
(*=0/1) 0 – 不读标点符号 1 – 读标点符号 |
作用 | 控制标识 | 详细说明 |
静音一段时间 | [p*] |
(*=无符号整数) * - 插入静音的时间长度,单位:毫秒(ms) |
中文汉字改变读音 | [=*] |
(*=拼音) * - 将前一个中文汉字改变读音 说明: 拼音模式为:1至6位字母 + 1位数字 声调用1位数字表示(1:阴平 2:阳平 3:上声 4:去声 5:轻声) 连续出现时以第一个为准。 |
恢复默认合成参数 | [d] | 所有设置(除发音人设置和语种外)恢复为默认值 |
作用 | 控制标识 | 默认设置 | 支持语种 | 详细说明 |
英文语种设置 | [g*] | [g0] | 中文、英文 |
(*=0/1/2) 0 - 自动判断 1 - 设置成中文(数字、度量单位、符号等合成中文) 2 - 设置成英文(数字、度量单位、符号等合成英文) |
英文0的读法 | [o*] | [o0] | 英文 |
(*=0/1) 0 - 默认读“zero” 1 - 强制读英文字母“o”音 |
英文韵律停顿加长 | [k*] | [k0] | 英文 |
(*=0/无符号整数) 0 - 默认,英文句中韵律处停顿时间:不变(不加长) 1 - 英文句中韵律处停顿时间:加长 50毫秒 (ms) 2 - 英文句中韵律处停顿时间:加长100毫秒 (ms) 3 - 英文句中韵律处停顿时间:加长150毫秒 (ms) 以此类推... |
英文单词发音方式 | [h*] | [h0] | 中文、英文 |
(*=0/1) 0 - 默认自动判断 1 - 按字母读 |
有个别英文句子在播放时可能出现卡顿(听感上像大的爆音),这种情况主要出现在用最快语速播放时或者英文句子很长时,用户参考以下举例和策略,自行测试解决卡顿。
文本:[s10]The subscriber you dialed can not be connected for the moment.[d]
问题:在“for”处出现大爆音卡顿
解决办法一:用[k?]标记加长韵律处的停顿
[k6][s10]The subscriber you dialed can not be connected for the moment.[d]
解决办法二:解决2:用[p?]标记加长韵律处的停顿
[s10]The subscriber[p300]you dialed can not be connected[p300]for the moment.[d]
解决办法三:降低语速
[s8]The subscriber you dialed can not be connected for the moment.[d]
文本:[s10]Here's a pie made by Uncle Jim. [d]
问题:在“pie”处出现小爆音卡顿
解决办法:用[p?]标记加长韵律处的停顿
[s10]Here's a pie [p50]made by Uncle Jim. [d]
文本:[s10]请插入RTK定位模块[d]
问题:在“RTK”处出现小爆音卡顿
解决办法:用[p?]标记加长韵律处的停顿
[s10]请插入[p50]RTK定位模块[d]
示例文本 | 合成解释 |
---|---|
[m3]我是晓玲[m3] | 用发音人“晓玲”的声音合成: “我是晓玲” |
注:标记[d]不会将发音人恢复成默认,要恢复默认发音人,必须用[m3]恢复。
示例文本 | 合成解释 |
---|---|
[n0]拨打62986600。有123公斤重。[d] | 自动判断。 读作:拨打六二九八六六零零。有一百二十三公斤重 |
[n1]拨打62986600。有123公斤重。[d] | 强制按照号码的方式合成数字串。 读作:拨打六二九八六六零零。有一二三公斤重 |
[n2]拨打62986600。有123公斤重。[d] | 强制按照数值的方式合成数字串。 读作:拨打六千二百九十八万六千六百。有一百二十三公斤重 |
示例文本 | 合成解释 |
---|---|
[s5]欢迎使用[s8]宇音天下研发的[s2]嵌入式语音合成系统[d] | 按5级语速播放“欢迎使用” 按8级语速播放“宇音天下研发的” 按2级语速播放“嵌入式语音合成系统” |
示例文本 | 合成解释 |
---|---|
[t5]欢迎使用[t8]宇音天下研发的[t2]嵌入式语音合成系统[d] | 按5级语调播放“欢迎使用” 按8级语调播放“宇音天下研发的” 按2级语调播放“嵌入式语音合成系统” |
示例文本 | 合成解释 |
---|---|
[v5]欢迎使用[v8]宇音天下研发的[v2]嵌入式语音合成系统[d] | 按5级音量播放“欢迎使用” 按8级音量播放“宇音天下研发的” 按2级音量播放“嵌入式语音合成系统” |
示例文本 | 合成解释 |
---|---|
[x0]sounda msga sound101[d] | 不按提示音处理。 直接读成英文字母:s-o-u-n-d-a m-s-g-a s-o-u-n-d-1-0-1 |
[x1] sounda msga sound101[d] | 按提示音处理。 播放信息提示音sounda,再播放和弦提示音msga,播放信息提示音sound101. |
示例文本 | 合成解释 |
---|---|
[i0]欢迎shi3yong4我gong1si1de5系统[d] | 不识别汉语拼音,按汉字和字母和数字逐个发音 读作:欢迎shi三yong四我gong一si一de五系统 |
[i1]欢迎shi3yong4我gong1si1de5系统[d] | 识别汉语拼音 读作:欢迎使用我公司的系统 |
示例文本 | 合成解释 |
---|---|
[r0]解放涛的妹妹来了,单位的单小虎也来了[d] | 自动判断姓名读音 读作:解(jie3)放涛的妹妹来了,单(dan1)位的单(shan4)小虎也来了 |
[r1]解放涛的妹妹来了,单位的单小虎也来了[d] | 强制每句开头字按姓氏读音 读作:解(xie4)放涛的妹妹来了,单(shan4)位的单(shan4)小虎也来了 |
[r2]解放涛的妹妹来了,单位的单小虎也来了[d] | 仅紧跟的汉字强制姓氏读音 读作:解(xie4)放涛的妹妹来了,单(dan1)位的单(shan4)小虎也来了 |
示例文本 | 合成解释 |
---|---|
[y0]010-62986600[d] | 按照“幺”的读法合成号码文本中的“1”。 读作:零幺零,六二九八六六零零 |
[y1]010-62986600[d] | 按照“一”的读法合成号码文本中的“1”。 读作:零一零,六二九八六六零零 |
注:此标记必须是在合成号码类型文本的时候才有效。
示例文本 | 合成解释 |
---|---|
[z0]美国会参议院以59票对39票的结果通过金融监管改革法案[d] | 不处理韵律标注: 韵律划分和读法为:美国会参议院 以59票对39票的结果 通过金融监管改革法案。 |
[z1]美国会参议院以59票#对39票的结果通过#金融监管改革法案[d] | 处理韵律标注: 韵律划分和读法为:美国会参议院以59票 对39票的结果通过 金融监管改革法案。 |
示例文本 | 合成解释 |
---|---|
[f0]欢迎观看语音合成系统的演示[d] | 按“一字一顿”的发音风格朗读 |
[f1]欢迎观看语音合成系统的演示[d] | 按“平铺直叙”的发音风格朗读 |
示例文本 | 合成解释 |
---|---|
[b0] 欢迎光临,请进![d] | 标点符号不读出,读成:“欢迎光临 请进” |
[b1] 欢迎光临,请进![d] | 读出标点符号, 读成:“欢迎光临 逗号 请进 感叹号” |
静音时间范围为:0-32000,单位ms
示例文本 | 合成解释 |
---|---|
欢迎使用宇音天下[p1000]研发的嵌入式[p2000]语音合成系统 | 播放“欢迎使用宇音天下”,静音1秒,再播放“研发的嵌入式”,静音2秒,再播放“语音合成系统” |
示例文本 | 合成解释 |
---|---|
欢迎他们,欢迎他[=ni3]们,欢迎他[=wo3]们 | 读作:欢迎他们,欢迎你们,欢迎我们 |
示例文本 | 合成解释 |
---|---|
[n1]123,[y1]010-62986600[d]123, 010-62986600。 | 读成:一二三,零一零,六二九八六六零零,一百二十三,零幺零,六二九八六六零零 |
示例文本 | 合成解释 |
[g0]http://www.tts168.com.cn[g0] | 自动判断语种。 读作:h t t p w w w dot t t s one six eight dot com dot c n |
[g1]http://www.tts168.com.cn[g0] | 按中文语种读。 读作:h t t p 三 w 点 t t s 幺六八点 com 点 c n |
[g2]http://www.tts168.com.cn[g0] | 按英文语种读。 读作:h t t p w w w dot t t s one six eight dot com dot c n |
芯片默认的语种为自动判断,用户的产品上电时,必须初始化语种。用户产品为英文产品时,请初始化合成“[g2]”将语种设置为英文。
标记[d]不会将语种恢复成默认自动判断,要恢复语种为默认,必须用[g0]恢复。
设置为中文语种时(应用“[g1]”): 请不要合成英文句子,否则会不读或者读错甚至死机
示例文本 | 说明 |
[g1]你好。 I'll go now. Do what you enjoy. | 错误。会不读或者读错甚至死机 |
[g1]你好。 [g2]I'll go now | 正确。请使用这种方式,在语种切换时,手动设置语种。 |
[g1]你好。 [g0]I'll go now | 正确。不建议使用 |
[g0]你好。 I'll go now | 正确。不建议使用 |
设置为英文语种时(应用“[g2]”): 请不要合成中文句子,否则会不读或者读错甚至死机。
示例文本 | 说明 |
[g2]hello. 这是emTTS系统。 | 错误。会不读或者读错甚至死机 |
[g2]hello. [g1]这是emTTS系统。 | 正确。请使用这种方式,在语种切换时,手动设置语种。 |
[g2]hello. [g0]这是emTTS系统。 | 正确。不建议使用 |
[g0]hello. 这是emTTS系统。 | 正确。不建议使用 |
示例文本 | 合成解释 |
[o0]call 13811002200[d] |
按照“zero”的读法合成号码文本中的“0”。 读:call one three eight one one zero zero two two zero zero |
[o1]call 13811002200[d] |
按照字母“o”读法合成号码文本中的“o”。 读:call one three eight one one o o two two o o |
示例文本 | 合成解释 |
[k0]The subscriber you dialed can not be connected for the moment.[d] |
句中韵律处停顿时间:默认不变(不加长) 读作:“The subscriber” ,韵律处自然停顿后,接着读“you dialed can not be connected”, 韵律处自然停顿后,接着读“for the moment”, |
[k12]The subscriber you dialed can not be connected for the moment.[d] |
句中韵律处停顿时间:加长600毫秒(=12*50ms) 读作:“The subscriber” ,韵律处多停顿600毫秒,接着读“you dialed can not be connected” 韵律处多停顿600毫秒,接着读“for the moment” |
The subscriber[p600]you dialed can not be connected[p600]for the moment. | 读作:“The subscriber” ,静音600毫秒,接着读“you dialed can not be connected”静音600毫秒,接着读“for the moment” |
[p?]静音标记也能起到句中韵律处停顿时间加长的功能,但韵律停顿处的语调会略有区别,用户可以对比两个控制标记自行测试选择使用
[k?]标记用户需在句首设置,芯片会自动在韵律处加长停顿
[p?]标记用户可以自行加在句中的任意位置
示例文本 | 合成解释 |
this is [h0]Windows[d] system. 这是[h0]Windows[d]系统。 |
自动判断单词的读法 读作:this is Windows system. 这是Windows系统。 |
this is [h1]Windows[d] system. 这是[h1]Windows[d]系统。 |
强制单词读成字母 读作:this is w i n d o w s system. 这是 w i n d o w s 系统。 |
例1:AB点相距太近。 AC点相距太近。
问题:读字母和读汉字的不是同一发音人
解决办法:用[h1]标记强制读字母
[h1] AB点相距太近。 AC点相距太近。[d]
例2:EC点相距太近。
问题:“EC”应读成字母
解决办法:用[h1]标记强制读字母
[h1] EC点相距太近。[h0]