Parakeet TDT(语音识别转文字在线工具)简介
Parakeet TDT 是一个语音识别转文字在线工具,基于NVIDIA 推出自动语音识别(ASR)模型构建,能够帮助我们快速精准地识别语音并将其转换为文字内容,处理速度非常快,仅需 1 秒即可处理 60 分钟的音频,是现有主流开源 ASR 模型的 50 倍,如此高速处理的情况下还是极低的词错率(WER),仅为 6.05%,在准确性方面也表现出色。
除了速度和准确性还具备多种实用功能:支持自动断句、首字母大写和精确的时间戳预测,尤其擅长口语数字和歌词的听写。该模型还支持多种音频格式,如 .wav 和 .flac 文件。
Parakeet TDT(语音识别转文字在线工具)官网
1、点击上面的官网链接打开该在线工具;

2、打开该在线工具后如上图所示,点击「Start Transcribing」按钮即可开始;

3、接下来如上图所示,我们上传需要识别的语音文件,等待语音文件上传完成后,点击「Transcribe Uploaded File」按钮,等待处理完成,即可获得识别后的文字内容。也支持直接通过麦克风拾音,直接识别语音并转录为文字内容。