live transcribe app是一款由Google针对耳聋及听力障碍人群开发免费的Android 无障碍服务应用,在安卓手机上安装live transcribe apk,你也可以通过在屏幕上输入你的回答来保持对话的进行。Live Transcribe 将自动生成字幕的功能引入了手机设备,只需一部手机,便可实现实时的语音转文字功能。
·live transcribe app支持70多种语言和方言的转录
·双语支持,live transcribe app可在两种语言之间快速切换
·我们的文字记录与我们从麦克风接收到的音频一样好。这就是为什么实时转录支持有线耳机、蓝牙耳机和USB麦克风中的外部麦克风
·响度和噪音指示器显示扬声器声音相对于环境噪音的音量
·live transcribe app通过在应用程序中键入您的回复,无需说话即可回复
·可选的触觉反馈在有人开始或继续说话时向您发出信号
·在Android 5.0和更高版本上提供
·私人-通话记录在您的设备上保持安全
- live transcribe支持 70 多种语言并覆盖全球 80% 以上的人群;
- 安装live transcribe app后只需轻点一下系统任务栏上的 “无障碍功能” 图标,即可在任意应用中启用此服务;
- 显示转录的置信水平。黄色代表高置信度,绿色代表中等置信度,而蓝色代表低置信度。白色单词为新文本,在最终确定置信度前等待语境处理;
- 响度与噪声指示器由两个同心圆构成。较亮的内部同心圆代表噪声层,它会让耳聋用户了解当前环境所处的噪声级别。外部同心圆表示麦克风对说话人声音的接收状况。将二者相结合后,相对差异便会一目了然。
过去,基于 ASR 的转录系统一般都需要计算密集型模型、详尽的用户研究以及昂贵的连接服务费用。
为了降低用户使用自动连续转录服务的成本,Sagar 团队将 Live Transcribe 背后的神经网络模型分别部署在设备端和云端(Google Cloud)。
设备端的是卷积神经网络模型,主要做声音分类的工作,能辨别 570 个声音类别,比如婴儿哭声或玻璃破碎声。
云端的神经网络模型规模大得多,主要做语音转录成文字的工作,由两个部分组成。
第一部分是声学模型,能够从音节的角度辨析说话者所说的是“Hi”还是“Hello”。
第二部分是发音模型,可以根据识别出来的音节做拼接或组合,组成实际的单词。第三部分是语言模型,根据识别出来的单词添加适当的标点符号和停顿,以符合人类语言使用习惯。