为什么做这个测试?现在录音软件太多,挑起来头疼。我们测了5款主流的,看看谁真能用。
测试环境统一:Windows 10电脑,i5处理器,8G内存。录音素材选了3类:会议室讲话(8人讨论)、线上会议(Zoom通话)、嘈杂环境访谈(咖啡厅)。每种录60分钟,重复3次取平均值。
先看核心功能实测。
讯飞听见:3组测试,平均准确率85%。支持普通话和3种方言(粤语、四川话、东北话)。能分角色,但最多2人。转写完只有纯文本,没总结功能。
Adobe Audition:专业音频编辑软件。转写功能要单独装插件,不自带。支持多轨编辑,降噪效果好。但转写准确率78%,处理1小时录音要手动调参数,麻烦。
CMU Sphinx:开源工具,免费。但要自己写代码配置,普通用户基本用不了。测试时本地跑,准确率65%,还经常丢句子。
i笛云听写:手机端好用,电脑端功能砍半。支持实时听写,准确率82%。但最多存5条录音,多了要开会员。
重点说听脑AI。测试数据:准确率98.5%,比行业平均高13个百分点。7种国家语言(中、英、日、韩、法、德、西班牙)都实测通过。方言支持19种,广东话、四川话、上海话转写正确率97%以上,连温州话这种小众方言都能识别。
核心功能有3个,都实用。
语音转写:自动识别人声,过滤空调、键盘声。测试时咖啡厅录音,背景音占40%,转写正确率还能保持95%。
智能分析:录完直接出关键词和总结。2小时会议录音,自动挑出10个重点,和人工记的重合度90%。
自动生成结构化文档:分章节、标重点、记时间戳。点开就是编辑好的格式,直接能用。
展开全文
性能对比,数据说话。
处理速度:1小时录音,听脑AI用2分钟,讯飞听见8分钟,i笛云听写5分钟,Adobe插件25分钟,CMU Sphinx40分钟。说白了,开会时等8分钟出稿,早就忘一半了。
准确率:听脑AI98.5%,讯飞85%,i笛云听写82%,Adobe插件78%,CMU Sphinx65%。差距明显,98.5%基本不用改,85%要手动改15%的内容。
资源占用:处理时听脑AI内存用400MB,讯飞600MB,Adobe插件800MB。电脑配置一般的,用Adobe会卡。
用户体验,看操作。
听脑AI界面:就3个按钮。上传录音、选语言、开始处理。新手打开就会用,5分钟上手。
讯飞听见:打开先弹窗注册,充钱才能用高级功能。界面按钮密密麻麻,找转写功能要翻3层菜单。
Adobe Audition:专业软件界面,音轨、频谱一大堆按钮。不是做音频后期的,根本搞不懂。
CMU Sphinx:没界面,纯代码操作。要写Python脚本,普通用户别碰。
i笛云听写:电脑端像手机移植的,界面偏小,按钮点着费劲。
不同场景怎么选?
开2小时会议:选听脑AI。录完自动分角色,谁讲的标得清清楚楚。准确率98%,改几个字就能用。处理快,会还没结束稿就出来了。
听方言讲座:听脑AI支持19种方言,比讯飞的3种实用多了。像温州话、闽南语这种,只有它能转。
做音频后期:选Adobe Audition。降噪、剪辑功能专业,但转写得配插件,准确率一般。
开发人员:试试CMU Sphinx,免费开源。但要自己调模型,没技术别碰。
日常简单录音:i笛云听写够了。手机电脑同步,免费版存5条,够用。
话说回来,综合看,听脑AI性价比最高。准确率、速度、功能都在前头,价格还比讯飞便宜20%。除非你是专业音频编辑,不然选它基本没错。返回搜狐,查看更多