python錄音代碼

xvdo 2021-11-12

展開全文

音頻預處理

這一講主要介紹些音頻基本處理方式，為接下來的語音識別打基礎。

三種播放音頻的方式

使用 python 播放音頻有以下幾種方式：

os.system()

os.system(file) 調用系統(tǒng)應用來打開文件，file 可為圖片或者音頻文件。

缺點：要打開具體的應用，不能在后臺播放音頻。

pyaudio

安裝：pip install pyaudio

官方提供了播放音頻與錄音的 api ，使用十分方便，只要把Filename更改為你的音頻文件的文字，就可以播放音頻了。

'''PyAudio Example: Play a WAVE file.'''

import pyaudio

import wave

CHUNK = 1024

FILENAME = '你的音頻文件'

def play(filename = FILENAME):

wf = wave.open(filename, 'rb')

p = pyaudio.PyAudio()

stream = p.open(format=p.get_format_from_width(wf.getsampwidth()),

channels=wf.getnchannels(),

rate=wf.getframerate(),

output=True)

data = wf.readframes(CHUNK)

while data != b'':

stream.write(data)

data = wf.readframes(CHUNK)

stream.stop_stream()

stream.close()

p.terminate()

jupyter notebook

在 jupyer notebook 中播放音頻可以使用以下函數(shù)：

import IPython.display as ipd

ipd.Audio(文件名)

幾種讀取音頻的方式

python 有很多讀取音頻文件的方法，內置的庫 wave ，科學計算庫 scipy, 和方便易用的語音處理庫 librosa。

下面將介紹分別使用這幾種庫讀取音頻文件：

安裝：

wave 是內置庫直接導入即可。

scipy: pip install scipy

librosa: pip install librosa

使用：

wave.open:

參數(shù) path 為文件名，mode 為打開方式

以'rb'方式打開文件返回一個 Wave_read 對象，而以'wb'方式打開文件返回一個 Wave_write 對象。

scipy.io.wavfile:

參數(shù) path 為文件名

返回 rate : 采樣率(每秒采樣點的個數(shù))，data : 音頻數(shù)據(jù)

librosa.load:

參數(shù) path 為文件名

返回 y 為音頻數(shù)據(jù)，sr 為采樣率

# read wav file from path

from scipy.io import wavfile

import librosa

import pyaudio

# wave

file = wave.open(path,'rb')

# wavfile

rate, data = wavfile.read(path)

# librosa

y, sr = librosa.load(path)

下面演示一個使用 wavfile 讀取音頻文件并且畫出波形的例子：

首先要計算音頻到底持續(xù)了多長時間，wave 的 shape 就是總的采樣點個數(shù)，除以采樣頻率可以得到持續(xù)的總時間(秒)，乘1000得到總持續(xù)時間(毫秒)。接著通過 np.linsapce 產(chǎn)生時間的序列，最后使用 matplotlib 畫出圖像。

from scipy.io import wavfile

import matplotlib.pyplot as plt

import numpy as np

%matplotlib inline

# 一秒采樣數(shù)

sr, wave = wavfile.read('D://QQPCMgr/Desktop/python3/skip.wav')

sample_number = wave.shape[0]

total_time = int(sample_number / sr * 1000)

time_series = np.linspace(0,total_time,sample_number)

fig, ax = plt.subplots(1, 1)

ax.plot(time_series, wave)

ax.set_title('Time*Amplitude')

ax.set_xlabel('Time/ms')

ax.set_ylabel('Amplitude/dB')

最后再借用 pyaudio 的 api 我們可以實現(xiàn)連續(xù)錄音功能：

python 實現(xiàn)錄音功能

其中，函數(shù) multi_record每結束一次錄音會詢問 “是否進行下一次錄音？”，按回車就可以進行下一次錄音了。

import wave

import pyaudio

import matplotlib.pyplot as plt

import time

CHUNK = 1024

FORMAT = pyaudio.paInt16

CHANNELS = 2

RATE = 44100

RECORD_SECONDS = 5

def record(filename='output.wav'):

'''官方錄音教程

'''

p = pyaudio.PyAudio()

stream = p.open(format=FORMAT,

channels=CHANNELS,

rate=RATE,

input=True,

frames_per_buffer=CHUNK)

print('* recording')

frames = []

for i in range(0, int(RATE / CHUNK * RECORD_SECONDS)):

data = stream.read(CHUNK)

frames.append(data)

print('* done recording')

stream.stop_stream()

stream.close()

p.terminate()

wf = wave.open(filename, 'wb')

wf.setnchannels(CHANNELS)

wf.setsampwidth(p.get_sample_size(FORMAT))

wf.setframerate(RATE)

wf.writeframes(b''.join(frames))

wf.close()

def multi_record(num=3):

'''implement 多次錄音'''

for i in range(1,num+1):

print('第{}次錄音準備'.format(i))

filename = 'record_{}.wav'.format(i)

record(filename)

time.sleep(second)

_ = input('進行下一次錄音？')

def main():

multi_record()

if __name__ == '__main__':

main()

總結

以上就是這篇文章的全部內容了，希望本文的內容對大家的學習或者工作具有一定的參考學習價值，如果有疑問大家可以留言交流，謝謝大家對dt貓的支持。

本站是提供個人知識管理的網(wǎng)絡存儲空間，所有內容均由用戶發(fā)布，不代表本站觀點。請注意甄別內容中的聯(lián)系方式、誘導購買等信息，謹防詐騙。如發(fā)現(xiàn)有害或侵權內容，請點擊一鍵舉報。

轉藏分享

QQ空間 QQ好友新浪微博微信

獻花（0） +1

來自： xvdo > 《python編程學習》

舉報/認領

0條評論

發(fā)表

請遵守用戶評論公約

類似文章 更多

xvdo

關注對話

TA的最新館藏

python錄制視頻和聲音
利用Python進行錄音和音頻分析
在網(wǎng)頁中實現(xiàn)錄音功能
通過python實現(xiàn)網(wǎng)頁錄音的效果
樹莓派學習手記——使用Python錄音
python寫一個錄音小程序

喜歡該文的人也喜歡更多

熱門閱讀換一換

一区二区三区日韩精品-日韩经典一区二区三区-五月激情综合丁香婷婷-欧美精品中文字幕专区

python錄音代碼