AI转录难题:Mr. Transcription不擅长哪些音频?

2025年6月7日

AI转录难题:Mr. Transcription不擅长哪些音频? | 人工智能转录服务——转录先生

“Mr. Transcription”(Mojiokoshi-san)是一款利用人工智能(AI)进行语音转写的AI转写工具。它采用了谷歌和AmiVoice(日本语音识别系统提供商)的AI技术。

AI语音转写对于不同类型的音频文件有其擅长和不擅长之处

本文将介绍AI语音转写不擅长或难以处理的音频文件类型,并提供实际案例和原因

了解这些案例和原因,可以帮助您制作出“更适合AI语音转写的音频文件”,请务必参考。

cat

AI语音转写不擅长的音频文件类型

  1. 音量过小、麦克风距离过远导致难以听清的音频
  2. 噪音过大,语音被掩盖的音频
  3. 室内混响严重,语音模糊的音频
  4. 包含歌曲歌词等音乐内容的音频
  5. 没有语音内容的音频 
  6. 方言口音过重的音频 
  7. 多种语言混杂的音频
  8. 人耳听起来也难以听清的语音 

对于这类音频文件,由于无法进行准确的语音转写,我们不建议使用“Mr. Transcription”。   

相关文章>提高语音转写准确性的6个录音技巧

如果提交AI语音转写不擅长的音频文件作为错误报告,将不会被批准,并且无法退还已消耗的时间。

特别是,许多错误报告都涉及文件内容本身的问题。让我们来看一个实际的例子。

文件中未录入声音(持续有噪音或完全静音)

如果在未检查音频文件内容的情况下上传,可能会出现以下情况:

录音失败,导致“录音失败且静音”“录音过程中麦克风断开,导致中间只有噪音,没有语音”

上图是上传了一个只有噪音的文件并进行语音转写的结果。 

“Mr. Transcription”使用AI进行语音转写。即使是噪音部分,AI也会尽力尝试进行转写。

特别是,如果使用PerfectVoice,并且文件开头有超过1分钟的杂音或静音时间,则很容易出现此问题

如果语音转写结果出现“啊啊啊啊啊啊”、“嗯嗯嗯嗯嗯嗯”等,或者重复转写相同的短语,导致结果难以理解,请检查文件内容

通过剪切开头的杂音或静音部分,可以避免此问题的发生。

即使对上述类型的文件进行语音转写并消耗了时间,也无法退还时间。

1. 音量过小、麦克风距离过远导致难以听清的音频

dog

在检查出现错误的音频时,最常见的问题是

就是这个例子。

即使能够转录,准确率也会很低。因此,对于说话者音量小、麦克风输入距离远导致声音拾取不清晰的音频,不建议使用AI语音转录。

例:在教室后排用手机录制讲座

二、噪音严重导致声音被掩盖的音频

噪音是AI语音转录的强敌!

cat

带有噪音的音频通常会掩盖说话者的声音,导致“即使是人听起来也很困难”。

录音时容易忽略的风声也是一个强敌。

如果“即使是人听起来也很困难”的音频,AI又怎能准确地进行转录呢?

例:在人多的环境(如外出咖啡馆)、有餐具声或音乐(BGM)的情况下录音

  嘴巴和麦克风距离很近,有呼吸风声

 

三、室内回声导致声音模糊的音频

平时用耳朵听的时候,室内回声是意外地难以察觉的。

录制下来的音频,回声听起来会变得闷闷的,或者声音听起来像是从远处传来。

特别是方形房间、物品较少的房间等,容易产生回声。

例:在会议室用一个IC录音笔录制多人在不同位置的对话

  在会议室进行演示,但录制的音频因室内回声而模糊不清

 

四、包含歌曲歌词等音乐的音频

dog

AI语音转录无法转录歌曲。

有些人会想,从YouTube等下载没有歌词的歌曲,然后进行转录!

但是,AI语音转录终究是用于转录对话的。

无法转录歌曲。

例:下载YouTube歌曲进行转录

 

五、没有声音的音频

无声的音频文件无法转录。

cat

没有声音的内容当然无法转录。

也许是您在不知情的情况下尝试转录,而麦克风输入为零。

在尝试转录之前,请先检查您的音频文件,确认“声音是否已正确输入”,然后再尝试AI转录。

示例:没有注意到麦克风没有输入

6. 方言浓重的内容

dog

AI转录不擅长处理方言。

AI转录顾名思义,是由“AI”进行转录。AI是基于标准语进行学习的,因此不擅长转录方言。

虽然并非完全无法通过AI进行转录,但即使录音环境再好,说话者语速缓慢、发音清晰,也可能出现

转录内容缺失或仅转录部分内容的情况。

示例:为地方会议记录录制音频→说话者方言较重

示例:日语方言的情况

即使是发音标准的主播在电视这种录音环境良好的地方录制的音频,方言也难以被准确转录。

 

7. 人耳听起来也难以辨认的声音

对人来说难以听清的声音,对AI来说会更难听清。

cat

一提到“AI”,人们往往觉得它无所不能,能比人类更出色地完成工作。

然而,AI目前仍无法与人类相提并论。

当需要灵活应变时,AI的工作精度会急剧下降。

对于AI转录而言,如果人类听起来都觉得“难以听清”的声音,AI转录的准确率会大大降低。

当人类进行转录时,即使有些地方听不清,也可以根据对话的上下文和前后语境来“猜测”内容。

但是,AI转录只能“照原样”转录所听到的内容。它无法像人类一样进行补充或预测。

如何通过AI转录获得高精度的转录结果?

dog
但是,我用AI转录了,结果却很糟糕。无法转录
要使用AI进行高精度转录,有一些关键点哦!
cat

为了实现高精度的AI语音转录,在录音时采取一些技巧至关重要。

本文将介绍使用AI进行语音转录时最佳录音的要点。

使用AI进行语音转录时最佳录音的6个要点

  1. 高质量麦克风
  2. 麦克风位置得当
  3. 营造安静的录音环境
  4. 说话者发音清晰
  5. 逐个说话
  6. 进行录音测试

详情请见>>实现高精度转录的6个录音要点

充分利用AI语音转录和人工语音转录

与人工语音转录相比,AI语音转录的成本要低得多。

特别是,在AI语音转录服务中,“Mr. Transcription”(Mojiokoshi-san)价格实惠,可能是业界最低价。

AI文字起こしのMr. Transcriptionは業界最安値

然而,对于AI语音转录效果不佳的音频文件,委托人工转录仍然是更可靠的选择。

但是,委托人工转录会不会很贵呢?

如果您有此疑问,请参阅这篇文章。

相关文章>>语音转录外包的市场价格是多少?【附省钱技巧】

 

如本文所述,AI语音转录也有其擅长和不擅长的方面。

对于AI语音转录擅长的音频文件,请使用“AI语音转录”。

对于不擅长的音频文件:

  • 尝试使用AI进行转录
    →如果效果不佳,则使用“人工转录”

是推荐的做法。

由于AI语音转录成本较低,即使是AI语音转录可能不擅长的音频文件,也可以抱着“即使失败也无妨,成功了就赚到”的心态尝试一下,有时也能成功转录。

“Mr. Transcription”(Mojiokoshi-san)AI语音转录服务提供前1分钟免费转录。您可以借此确认转录精度。请务必尝试一下。

■ 人工智能转录服务“转录先生”

“Mr. Transcription”是一种在线转录工具,可以从零初始成本和每月 1,000 日元(*提供免费版本)开始使用。

  • 支持音频、视频、图片等20多种文件格式
  • 可从 PC 和智能手机使用
  • 支持医疗、IT、长期护理等技术术语
  • 支持创建字幕文件和扬声器分离
  • 支持英语、汉语、日语、韩语、德语、法语、意大利语等约100种语言转录。

要使用它,只需从站点上传音频文件。转录文本在几秒钟到几十分钟内可用。
如果您转录最多 10 分钟,您就可以免费使用它,所以请尝试一次。

可以轻松转录音频、视频和图像的“转录先生”。 转录允许您免费转录长达 10 分钟。 您可以对转录的文本进行复制、下载、搜索、删除等操作。 您还可以创建字幕文件,这是采访视频转录的理想选择。
HP: mojiokoshi3.com
Email: mojiokoshi3.com@gmail.com
|
相关文章