AI转录难题:Mr. Transcription不擅长哪些音频?
2025年6月7日

“Mr. Transcription”(Mojiokoshi-san)是一款利用人工智能(AI)进行语音转写的AI转写工具。它采用了谷歌和AmiVoice(日本语音识别系统提供商)的AI技术。
AI语音转写对于不同类型的音频文件有其擅长和不擅长之处。
本文将介绍AI语音转写不擅长或难以处理的音频文件类型,并提供实际案例和原因。
了解这些案例和原因,可以帮助您制作出“更适合AI语音转写的音频文件”,请务必参考。

AI语音转写不擅长的音频文件类型
- 音量过小、麦克风距离过远导致难以听清的音频
- 噪音过大,语音被掩盖的音频
- 室内混响严重,语音模糊的音频
- 包含歌曲歌词等音乐内容的音频
- 没有语音内容的音频
- 方言口音过重的音频
- 多种语言混杂的音频
- 人耳听起来也难以听清的语音
对于这类音频文件,由于无法进行准确的语音转写,我们不建议使用“Mr. Transcription”。
相关文章>提高语音转写准确性的6个录音技巧
如果提交AI语音转写不擅长的音频文件作为错误报告,将不会被批准,并且无法退还已消耗的时间。
特别是,许多错误报告都涉及文件内容本身的问题。让我们来看一个实际的例子。
文件中未录入声音(持续有噪音或完全静音)
如果在未检查音频文件内容的情况下上传,可能会出现以下情况:
录音失败,导致“录音失败且静音”或“录音过程中麦克风断开,导致中间只有噪音,没有语音”。
上图是上传了一个只有噪音的文件并进行语音转写的结果。
“Mr. Transcription”使用AI进行语音转写。即使是噪音部分,AI也会尽力尝试进行转写。
特别是,如果使用PerfectVoice,并且文件开头有超过1分钟的杂音或静音时间,则很容易出现此问题。
如果语音转写结果出现“啊啊啊啊啊啊”、“嗯嗯嗯嗯嗯嗯”等,或者重复转写相同的短语,导致结果难以理解,请检查文件内容。
通过剪切开头的杂音或静音部分,可以避免此问题的发生。
即使对上述类型的文件进行语音转写并消耗了时间,也无法退还时间。
1. 音量过小、麦克风距离过远导致难以听清的音频

在检查出现错误的音频时,最常见的问题是
就是这个例子。
即使能够转录,准确率也会很低。因此,对于说话者音量小、麦克风输入距离远导致声音拾取不清晰的音频,不建议使用AI语音转录。
例:在教室后排用手机录制讲座
二、噪音严重导致声音被掩盖的音频
噪音是AI语音转录的强敌!

带有噪音的音频通常会掩盖说话者的声音,导致“即使是人听起来也很困难”。
录音时容易忽略的风声也是一个强敌。
如果“即使是人听起来也很困难”的音频,AI又怎能准确地进行转录呢?
例:在人多的环境(如外出咖啡馆)、有餐具声或音乐(BGM)的情况下录音
嘴巴和麦克风距离很近,有呼吸风声
三、室内回声导致声音模糊的音频
平时用耳朵听的时候,室内回声是意外地难以察觉的。
录制下来的音频,回声听起来会变得闷闷的,或者声音听起来像是从远处传来。
特别是方形房间、物品较少的房间等,容易产生回声。
例:在会议室用一个IC录音笔录制多人在不同位置的对话
在会议室进行演示,但录制的音频因室内回声而模糊不清
四、包含歌曲歌词等音乐的音频

AI语音转录无法转录歌曲。
有些人会想,从YouTube等下载没有歌词的歌曲,然后进行转录!
但是,AI语音转录终究是用于转录对话的。
无法转录歌曲。
例:下载YouTube歌曲进行转录
五、没有声音的音频
无声的音频文件无法转录。

没有声音的内容当然无法转录。
也许是您在不知情的情况下尝试转录,而麦克风输入为零。
在尝试转录之前,请先检查您的音频文件,确认“声音是否已正确输入”,然后再尝试AI转录。
示例:没有注意到麦克风没有输入
6. 方言浓重的内容

AI转录不擅长处理方言。
AI转录顾名思义,是由“AI”进行转录。AI是基于标准语进行学习的,因此不擅长转录方言。
虽然并非完全无法通过AI进行转录,但即使录音环境再好,说话者语速缓慢、发音清晰,也可能出现
转录内容缺失或仅转录部分内容的情况。
示例:为地方会议记录录制音频→说话者方言较重
示例:日语方言的情况
即使是发音标准的主播在电视这种录音环境良好的地方录制的音频,方言也难以被准确转录。
7. 人耳听起来也难以辨认的声音
对人来说难以听清的声音,对AI来说会更难听清。

一提到“AI”,人们往往觉得它无所不能,能比人类更出色地完成工作。
然而,AI目前仍无法与人类相提并论。
当需要灵活应变时,AI的工作精度会急剧下降。
对于AI转录而言,如果人类听起来都觉得“难以听清”的声音,AI转录的准确率会大大降低。
当人类进行转录时,即使有些地方听不清,也可以根据对话的上下文和前后语境来“猜测”内容。
但是,AI转录只能“照原样”转录所听到的内容。它无法像人类一样进行补充或预测。
如何通过AI转录获得高精度的转录结果?


为了实现高精度的AI语音转录,在录音时采取一些技巧至关重要。
本文将介绍使用AI进行语音转录时最佳录音的要点。
使用AI进行语音转录时最佳录音的6个要点
- 高质量麦克风
- 麦克风位置得当
- 营造安静的录音环境
- 说话者发音清晰
- 逐个说话
- 进行录音测试
详情请见>>实现高精度转录的6个录音要点
充分利用AI语音转录和人工语音转录
与人工语音转录相比,AI语音转录的成本要低得多。
特别是,在AI语音转录服务中,“Mr. Transcription”(Mojiokoshi-san)价格实惠,可能是业界最低价。
然而,对于AI语音转录效果不佳的音频文件,委托人工转录仍然是更可靠的选择。
但是,委托人工转录会不会很贵呢?
如果您有此疑问,请参阅这篇文章。
相关文章>>语音转录外包的市场价格是多少?【附省钱技巧】
如本文所述,AI语音转录也有其擅长和不擅长的方面。
对于AI语音转录擅长的音频文件,请使用“AI语音转录”。
对于不擅长的音频文件:
- 尝试使用AI进行转录
→如果效果不佳,则使用“人工转录”
是推荐的做法。
由于AI语音转录成本较低,即使是AI语音转录可能不擅长的音频文件,也可以抱着“即使失败也无妨,成功了就赚到”的心态尝试一下,有时也能成功转录。
“Mr. Transcription”(Mojiokoshi-san)AI语音转录服务提供前1分钟免费转录。您可以借此确认转录精度。请务必尝试一下。
■ 人工智能转录服务“转录先生”
“Mr. Transcription”是一种在线转录工具,可以从零初始成本和每月 1,000 日元(*提供免费版本)开始使用。
- 支持音频、视频、图片等20多种文件格式
- 可从 PC 和智能手机使用
- 支持医疗、IT、长期护理等技术术语
- 支持创建字幕文件和扬声器分离
- 支持英语、汉语、日语、韩语、德语、法语、意大利语等约100种语言转录。
要使用它,只需从站点上传音频文件。转录文本在几秒钟到几十分钟内可用。
如果您转录最多 10 分钟,您就可以免费使用它,所以请尝试一次。
Email: mojiokoshi3.com@gmail.com