Amazon Transcribe (自動語音辨識) 支援簡體中文 – 使用教學與心得

今天看到一個消息是 Amazon Transcribe 支援簡體中文,所以就來試用看看,首先版主先找了一個音樂的 Youtube 不過結果其實不太好,後來就找了一個談話比較多的 Youtube 感覺效果就比較好了。

就來介紹怎麼使用這個新服務吧 ~

下載 Youtube

版主首先找了一首歌 “G.E.M.鄧紫棋【差不多姑娘 MISS SIMILAR 】Real Talk版 Official Music Video” 後來找了 “Who’s your daddy?! 五種「爸爸」的用法!【2分鐘英語教室】” 下載方法如下:

{
"jobName": "raydu",
"accountId": "869989823608",
"results": {
"transcripts": [
{
"transcript": "帕罗萨利只是两分钟与教师今天教大家跟爸爸这个英文单词相关的,今天呢,是父亲截住全天下的话,我们父亲节快乐,堤坝那么应当负一点快乐。我们都知道爸爸的英文就是发展,要不就是家里不过呢,这两个单词也很常用在一些其他的单子偏远当中,所以今天我就一起来看看有哪一些常用的吧,一发都是,这个非常有很多意思,它可以是数字,它可以是人行,不过在这份发生非个人意思呢,是像是爸爸一样的人通常呢,这就不是指爸爸本身不是亲生父亲,而是这个人虽然跟你没有血缘关系,但是他对你的影响就像是一位父亲一样,教你做人的方式,避免在需要的时候给你协助。那社跟家里多大,我听过十个家里呢,在中国比较接近的发言应该就是包养的干爹,这个时当风可能是在电影当中听到,不过大家一定要记者就现实当中不要乱叫。三家里也是好这个我觉得是一个非常非常有趣的片与,也许的话就是一个问题,所以家里一些修饰,你有一个爸爸的问题,实际上是这样子,通常这个是用来形容女生过度的一列依赖自己的父亲,我们就会称之为家里,也许他的是在成长过程当中没有很完善,跟父亲的亲子关系,或者是呢,太过亲密的亲子关系,导致于说呢,他要不就是很渴望像父亲一样这样子的爱情,要不就是他会很依赖自己的现在的父亲,所以我觉得最接近的中文可能就是这个形容词就是生理上的,那我今天调整男子,其实不是要找这个男子本身,而是他衍生出来还有各式各样,你看在发展前面加上的虚荣差,所以说她还有捞取扣发的就是血缘上的父亲,那如果是在发展,这是继父而发斯特发德尔这是领养你的爸爸,所以他就把一老师合法的都说最后的五个山洪频发的范围,当然如果是放映的,过去是是找到了,但是呢,如果范围本身当做是一个现在是的动词的话他是成立的意思就像是陪审他就是从非常而来的那非常金发的是什么意思呢?就是一个在做成立的一个父亲,也就是我们的国父了那今天如果不是要讲国父你单纯是要讲一个创办人的话呢你一样这个动词后面加上变成是一个人好的以上就是今天的两会终于教师教他才发德尔在哪一些电影我的单子当中有出现然后也顺便听听大家今天是父亲节如果有时间的话也可以抽空回家给可以自己的爸爸了不同于肇事将会不定期跟新记者要订阅频道开启小铃铛才不会漏掉任何一起啊我们现在做超过四十集了所以如果想要很看前面的话呢也可以点这一边的播放清单我相信这是两步走的就是我们下次见C啊"
}
],
"items": [
{
"start_time": "0.04",
"end_time": "0.19",
"alternatives": [
{
"confidence": "0.5659",
"content": "帕"
}
],
"type": "pronunciation"
},
{
"start_time": "0.19",
"end_time": "0.34",
"alternatives": [
{
"confidence": "0.5602",
"content": "罗"
}
],
"type": "pronunciation"
}
]
},
"status": "COMPLETED"
}
view raw asrOutput.json hosted with ❤ by GitHub
brew install youtube-dl
youtube-dl --sub-format srt -f mp4 https://www.youtube.com/watch\?v\=qZm0sjcphWU
view raw gistfile1.txt hosted with ❤ by GitHub

上傳影片到 S3

首先要創一個 bucket,然後把檔案上傳上去,因為 Amazon Transcribe 需要從 S3 抓檔案。

Amazon Transcribe Create job

首先先建立一個 Job,建立的方法如下:

之後就會開始跑了,跑的介面如下:

那時候我因為選錯 Language,所以建立了兩個。

Amazon Transcribe 執行時間

一開始沒有注意到時間好像有點長,所以第二次開始才注意,以下是影片時間與轉檔時間的紀錄。

  • 2019/8/25 上午12:45:36 -> 2019/8/25 上午12:59:59
    影片時間:3:47
    轉檔時間:13 min
  • 2019/8/25 上午1:12:05 -> 2019/8/25 上午1:16:59
    影片時間 3:17
    轉檔時間:4 min

其實感覺影片長度跟轉檔時間好像沒有絕對的關係,目前不太清楚轉檔時間跟什麼有關係,可能之後會發現,如果有發現再更新給大家知道。

轉檔結果

如下是 “G.E.M.鄧紫棋【差不多姑娘 MISS SIMILAR 】Real Talk版 Official Music Video” 轉檔選英文的結果:

如下是 “G.E.M.鄧紫棋【差不多姑娘 MISS SIMILAR 】Real Talk版 Official Music Video” 轉檔選簡體語言的結果:

如下是 “Who’s your daddy?! 五種「爸爸」的用法!【2分鐘英語教室】” 轉檔選簡體語言的結果:

其實在上圖可以看到對於轉檔還有一個評分,有的詞其實評分滿低的。

轉完的檔案其實是一個 json 檔案,結果如下,只有擷取一段不然整個超長的:

{
"jobName": "raydu",
"accountId": "869989823608",
"results": {
"transcripts": [
{
"transcript": "帕罗萨利只是两分钟与教师今天教大家跟爸爸这个英文单词相关的,今天呢,是父亲截住全天下的话,我们父亲节快乐,堤坝那么应当负一点快乐。我们都知道爸爸的英文就是发展,要不就是家里不过呢,这两个单词也很常用在一些其他的单子偏远当中,所以今天我就一起来看看有哪一些常用的吧,一发都是,这个非常有很多意思,它可以是数字,它可以是人行,不过在这份发生非个人意思呢,是像是爸爸一样的人通常呢,这就不是指爸爸本身不是亲生父亲,而是这个人虽然跟你没有血缘关系,但是他对你的影响就像是一位父亲一样,教你做人的方式,避免在需要的时候给你协助。那社跟家里多大,我听过十个家里呢,在中国比较接近的发言应该就是包养的干爹,这个时当风可能是在电影当中听到,不过大家一定要记者就现实当中不要乱叫。三家里也是好这个我觉得是一个非常非常有趣的片与,也许的话就是一个问题,所以家里一些修饰,你有一个爸爸的问题,实际上是这样子,通常这个是用来形容女生过度的一列依赖自己的父亲,我们就会称之为家里,也许他的是在成长过程当中没有很完善,跟父亲的亲子关系,或者是呢,太过亲密的亲子关系,导致于说呢,他要不就是很渴望像父亲一样这样子的爱情,要不就是他会很依赖自己的现在的父亲,所以我觉得最接近的中文可能就是这个形容词就是生理上的,那我今天调整男子,其实不是要找这个男子本身,而是他衍生出来还有各式各样,你看在发展前面加上的虚荣差,所以说她还有捞取扣发的就是血缘上的父亲,那如果是在发展,这是继父而发斯特发德尔这是领养你的爸爸,所以他就把一老师合法的都说最后的五个山洪频发的范围,当然如果是放映的,过去是是找到了,但是呢,如果范围本身当做是一个现在是的动词的话他是成立的意思就像是陪审他就是从非常而来的那非常金发的是什么意思呢?就是一个在做成立的一个父亲,也就是我们的国父了那今天如果不是要讲国父你单纯是要讲一个创办人的话呢你一样这个动词后面加上变成是一个人好的以上就是今天的两会终于教师教他才发德尔在哪一些电影我的单子当中有出现然后也顺便听听大家今天是父亲节如果有时间的话也可以抽空回家给可以自己的爸爸了不同于肇事将会不定期跟新记者要订阅频道开启小铃铛才不会漏掉任何一起啊我们现在做超过四十集了所以如果想要很看前面的话呢也可以点这一边的播放清单我相信这是两步走的就是我们下次见C啊"
}
],
"items": [
{
"start_time": "0.04",
"end_time": "0.19",
"alternatives": [
{
"confidence": "0.5659",
"content": "帕"
}
],
"type": "pronunciation"
},
{
"start_time": "0.19",
"end_time": "0.34",
"alternatives": [
{
"confidence": "0.5602",
"content": "罗"
}
],
"type": "pronunciation"
}
]
},
"status": "COMPLETED"
}
view raw asrOutput.json hosted with ❤ by GitHub

價錢

Amazon Transcribe API (包含串流轉寫) 每月按每秒 0.0004 USD 的費率計費。使用量以 1 秒遞增方式進行計費,每個請求最低計費標準為 15 秒。

範例音訊長度費用
社交媒體影片~ 10 秒0.006 USD
電台廣告~ 15 秒
0.006 USD
預告片~ 2 分鐘 30 秒0.06 USD
錄製的網路研討會~ 30 分鐘0.72 USD
「The Marvelous Mrs. Maisel」劇集~ 60 分鐘1.44 USD
董事會會議記錄的平均長度~ 120 分鐘2.88 USD
客服中心 (每位代表):
–    平均每通通話處理時間為 4 分鐘
–    每個專員每天處理約 50 通電話
~ 200 分鐘4.80 USD

總結

其實我覺得辨識率還好,不過如果是要減低人工的部分覺得還是可以使用的,這樣就不用人工打整篇,至於價錢的部分就看個人的感覺了 ~

參考資料: