一区二区三区日韩精品-日韩经典一区二区三区-五月激情综合丁香婷婷-欧美精品中文字幕专区

分享

微軟Edge的獨(dú)門絕技又進(jìn)化了,效果驚人!

 網(wǎng)羅燈下黑 2021-08-18

今年一月份的時(shí)候,Chromium 內(nèi)核的 Edge 瀏覽器是毫無疑問的當(dāng)紅炸子雞,每次提到 Edge 瀏覽器,留言里滿滿都是「真香」的聲音。

不過說實(shí)話,雖然早在 2019 年新版 Edge 內(nèi)測(cè)的時(shí)候咱就搞來了漢化版測(cè)試了一番,可新鮮歸新鮮,我還真沒準(zhǔn)備從 Chrome 遷移到 Edge。

真正讓我意識(shí)到 Edge 強(qiáng)大的,還是今年一月份寫的那篇關(guān)于 Edge 「大聲朗讀」功能的文章,這才讓我感受到 Edge 是真的香。

給不了解的小伙伴重新解釋一下,相比谷歌的 Chrome,微軟 Edge 上獨(dú)占的「大聲朗讀」功能可以把瀏覽器內(nèi)的文字生成 TTS 語(yǔ)音朗讀,說白了就是提供了內(nèi)置的文字轉(zhuǎn)語(yǔ)音功能。

香的地方在于,一般的文字轉(zhuǎn)語(yǔ)音調(diào)用的都是通用引擎,那發(fā)聲一聽就是程序合成的,根本讓人聽不下去。

而 Edge 背靠微軟這顆大樹,有著微軟這些年在人工智能語(yǔ)音合成領(lǐng)域的技術(shù)沉淀背書,吐字清晰、字正腔圓,堪比真人,不信的小伙伴可以看看當(dāng)時(shí)寫的這篇文章:《微軟Edge,你這是人干的事嗎?》。

但是,要說但是了啊,那篇文章的最后有不少小伙伴留言說「想導(dǎo)出朗讀的內(nèi)容」,當(dāng)時(shí)我的回復(fù)都是只能額外錄音。

可這個(gè)問題我拿小本本記住了,就是有什么辦法利用 Edge 的「大聲朗讀」把文字轉(zhuǎn)過來的語(yǔ)音導(dǎo)出成獨(dú)立的文件呢?

今天我找到了解決方案,Read Aloud,一個(gè)把「大聲朗讀」功能獨(dú)立出來的文本轉(zhuǎn)語(yǔ)音軟件。

Read Aloud

滿打滿算也就 3M 大小出頭的 Read Aloud,界面簡(jiǎn)約啥的咱就不說了,可麻雀雖小五臟俱全。

如果你就聽聽作罷,直接輸入文本,選擇合適的「語(yǔ)音」,然后點(diǎn)擊「朗讀」即可。

別擔(dān)心它提供的接口不夠,語(yǔ)音那欄里我數(shù)了數(shù),和 Edge 上「大聲朗讀」里的支持的語(yǔ)音數(shù)量一致,都是 38 個(gè)(順序有所差別),普通話、粵語(yǔ)、臺(tái)灣方言都有,主流的外語(yǔ)也都不在話下。

但如果你想把語(yǔ)音導(dǎo)出到本地,就得在下方設(shè)置那安排好你的導(dǎo)出目錄。

給大家錄了個(gè)屏來展示一下操作,語(yǔ)音方面當(dāng)然還是選擇公認(rèn)的擬人度效果最好的「xiaoxiao」了。

點(diǎn)擊「錄制」,Read Aloud 會(huì)自動(dòng)開始播放文本,而在播放的同時(shí),它會(huì)把語(yǔ)音保存到了你設(shè)置好的目錄,唯一支持的文件格式為 .wav。

給大家聽聽「xiaoxiao」的效果:

啊,我又被治愈了。

當(dāng)然,你可以在右下角設(shè)置最大錄制時(shí)間,還能調(diào)整語(yǔ)速和音調(diào),不過對(duì)于部分語(yǔ)音的音調(diào)是不可調(diào)的,比如「xiaoxiao」。

但作為一個(gè) 3M 的小工具,達(dá)成這樣的效果已經(jīng)很不容易了,回到一開始的問題,這不就是利用 Edge 的「大聲朗讀」把文字轉(zhuǎn)過來的語(yǔ)音導(dǎo)出成獨(dú)立的文件嘛。

什么,還有人嫌 Read Aloud 不夠給力?

想想也對(duì),之前的那篇文章里不是還介紹了如何利用微軟提供的 SSML 語(yǔ)音合成標(biāo)記語(yǔ)言,來手把手調(diào)教語(yǔ)音,現(xiàn)在一個(gè)把「大聲朗讀」獨(dú)立出來的小工具可喂不飽大家。

我想了想,既然「大聲朗讀」的出處是 Edge,那老家自然是微軟,我何不去探一探源頭處微軟「語(yǔ)音合成」的究竟。

高階操作

既然是微軟的 AI 服務(wù),那應(yīng)該就出自它們家的 Azure 了,陌生的小伙伴可以類比一下國(guó)內(nèi)的阿里云和騰訊云。

去微軟他們家的官網(wǎng),找到 Azure 的頁(yè)面,然后在「產(chǎn)品-AI + 機(jī)器學(xué)習(xí)-Azure 認(rèn)知服務(wù)」的頁(yè)面里找到我們的目標(biāo)。

語(yǔ)音-文本轉(zhuǎn)語(yǔ)音:

點(diǎn)進(jìn)去,選擇「免費(fèi)開始使用」,登錄你的微軟賬號(hào),再注冊(cè) Azure 賬號(hào),填寫個(gè)人資料,基本搞定。

其實(shí)上面都沒啥好說的,有手就行,但最后一步有個(gè)門檻,需要綁定你的信用卡,主要用來驗(yàn)證真實(shí)用戶,不扣費(fèi),在綁好信用卡注冊(cè)成功后,你就可以享受原汁原味的微軟服務(wù)了。

登錄后添加項(xiàng)目,選擇「語(yǔ)音-文本轉(zhuǎn)語(yǔ)音」中的「語(yǔ)音庫(kù)」。

你就能看到包括曉曉(xiaoxiao)在內(nèi)的 174 種語(yǔ)音了,然后點(diǎn)擊「創(chuàng)建音頻」。

當(dāng)你看到下面這個(gè)界面的時(shí)候,證明所有的準(zhǔn)備工作就緒,非這么老鼻子勁,我倒要看看微軟的文本轉(zhuǎn)語(yǔ)音服務(wù)有多強(qiáng)。

還是選了《許三觀賣血記》第一章的前兩段話作為例子:

許三觀是城里絲廠的送繭工,這一天他回到村里來看望他的爺爺。他爺爺年老以后眼睛昏花,看不見許二觀在門口的臉,就把他叫到面前,看了一會(huì)兒后問他:

“我兒,你的臉在哪里?”

許三觀說:“爺爺,我不是你兒,我是你孫子,我的臉在這里……”

試一下導(dǎo)出,有導(dǎo)出到「音頻庫(kù)」和導(dǎo)出到本地兩種選擇,不用說了肯定是后者,有意思的來了,支持高品質(zhì) 16k 和 24k wav 格式文件,也支持標(biāo)準(zhǔn)品質(zhì) MP3 格式文件,可以整篇導(dǎo)出,也可以分段落導(dǎo)出音頻。

曉曉的朗讀效果是這樣的:

好聽歸好聽,可一切都是默認(rèn)選項(xiàng),和 Edge 自帶的曉曉沒什么區(qū)別,別急,在右側(cè)的優(yōu)化欄,我找到了「好東西」。

我把它分成了三欄,你可以在第一欄里從 174 種語(yǔ)音中選擇不同的語(yǔ)音,這是最基礎(chǔ)的,多國(guó)多人不同的語(yǔ)音。

而在第二欄,可以選擇上面不同語(yǔ)音的說話風(fēng)格,比如「助理、聊天、客服、新聞」,還有各種說話情緒,比如「撒嬌、生氣、平靜、開心、不滿、害怕、溫柔、抒情、悲傷、嚴(yán)肅」。

至于第三欄,你可以設(shè)置語(yǔ)音的停頓、發(fā)音、語(yǔ)調(diào)、語(yǔ)速、音高、音量。

最最關(guān)鍵的是,上面的每一種選擇,你都能應(yīng)用在文本中的每一段、每一句、每一詞,甚至每一字。

也就是說,一個(gè)文本,你可以多個(gè)人以不同風(fēng)格討論的形式念出來,比如這個(gè)樣子:

當(dāng)然,也可以讓每句話帶有不同的情緒。

這就很厲害了,我讓曉曉以平靜的語(yǔ)氣念旁白,以害怕的語(yǔ)氣念爺爺?shù)膶?duì)話,以撒嬌的語(yǔ)氣念許三觀的話。

操作起來很簡(jiǎn)單,拉住需要改變的那句話,然后點(diǎn)擊對(duì)應(yīng)的選項(xiàng)就好了。

我們來聽聽效果:

有沒有覺得,最后許三觀說的話,「孫子」倆字發(fā)音聽起來怪怪的,好解決,我們?cè)趩为?dú)改一下發(fā)音,然后插入個(gè)停頓就好了。

再來聽聽效果,是不是沒有那種囫圇喊「孫子」的感覺,吐字更加清晰了。

豐富的操作,讓合成的語(yǔ)音在你的巧手下變得更加真實(shí),如果你愿意,甚至可以通過更改每個(gè)字來讓曉曉口吐方言。

為了讓大家感受一下微軟這個(gè)服務(wù)的強(qiáng)大,我專門用抖音的剪映挑了個(gè)小姐姐的語(yǔ)音,來聽聽效果。

同樣,我還充了個(gè)訊飛出品的「訊飛快讀」的會(huì)員,這是高級(jí) VIP 小媛的語(yǔ)音,聽聽看效果。

哪個(gè)更有人味不用多說了吧,重要的是微軟的這個(gè)服務(wù)還是免費(fèi)的,但實(shí)際上,微軟的這個(gè)應(yīng)用比市面上很多收費(fèi)軟件的效果都更出色,如果你是一名短視頻創(chuàng)作者,相信你心中自有定論。

之前還需要 SSML 語(yǔ)音合成標(biāo)記語(yǔ)言的代碼,現(xiàn)在怎么就能這么點(diǎn)點(diǎn)就實(shí)現(xiàn)了,你點(diǎn)開上面「SSML」的開關(guān),本質(zhì)上是一樣的:

聽著曉曉的聲音,想著合成語(yǔ)音的未來,嗯,千萬別有什么大膽的想法。

結(jié)語(yǔ)

今天給大家安利的兩個(gè)工具,一個(gè)初階 Edge 「大聲朗讀」導(dǎo)出工具,一個(gè)高階的微軟 AI 服務(wù),怎么選擇還得看大家的需求咯。

不知道大家發(fā)現(xiàn)沒有,現(xiàn)在不少推銷電話都開始用 AI 合成音了,不過還是能聽出來有 AI 那種特有的頓感。

那如果未來 AI 合成音更逼真了呢,不管是語(yǔ)調(diào)、尾音、口音,甚至說每句話的抑揚(yáng)頓挫,和我們說話都差不多呢。

想想還真有點(diǎn)可怕。

不管怎么樣,希望我們還能拿捏的住這技術(shù),最后還是讓曉曉幫我送上祝福吧:

這次別下次一定了,記得點(diǎn)贊三連啊!

    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多

    爱草草在线观看免费视频| 国产黄色高清内射熟女视频| 中文字幕一区二区三区大片| 亚洲国产欧美精品久久 | 91欧美日韩精品在线| 视频在线观看色一区二区| 日韩精品亚洲精品国产精品| 日韩女优精品一区二区三区| 福利一区二区视频在线| 日韩中文字幕视频在线高清版| 蜜桃传媒视频麻豆第一区| 在线亚洲成人中文字幕高清| 亚洲熟妇中文字幕五十路| 国产精品刮毛视频不卡| 国产人妻精品区一区二区三区| 丰满的人妻一区二区三区| 91精品日本在线视频| 国产成人精品久久二区二区| 欧美黑人在线精品极品| 欧美色欧美亚洲日在线| 中国日韩一级黄色大片| 日本本亚洲三级在线播放| 麻豆在线观看一区二区| 粉嫩国产美女国产av| 久久人妻人人澡人人妻| 激情国产白嫩美女在线观看| 日本免费一本一二区三区| 成人免费在线视频大香蕉| 高清一区二区三区四区五区 | 日韩夫妻午夜性生活视频| 一本色道久久综合狠狠躁| 亚洲视频一区二区久久久| 激情三级在线观看视频| 在线观看国产成人av天堂野外| 日韩在线免费看中文字幕| 亚洲精品一区三区三区| 欧美日韩精品人妻二区三区| 好吊妞视频免费在线观看| 蜜臀人妻一区二区三区| 国产亚洲精品俞拍视频福利区| 国产精品久久女同磨豆腐|