语言识别服务
预算 双方协商
基本信息
地区: 湖北省 武汉市 洪山区
需求方: 武汉***公司
行业领域
文化、体育和娱乐业
需求描述
提供将音频流实时识别为文字,并返回每句话的开始和结束时间,适用于长句语音输入、音视频字幕、会议等场景,首包响应时间毫秒级,并实时展示中间文字结果,实现语音自动转细微文字,显示提升音频信息的处理效率
处理进度