這篇文章主要介紹“聲紋識別kaldi callhome diarization怎么實現(xiàn)”,在日常操作中,相信很多人在聲紋識別kaldi callhome diarization怎么實現(xiàn)問題上存在疑惑,小編查閱了各式資料,整理出簡單好用的操作方法,希望對大家解答”聲紋識別kaldi callhome diarization怎么實現(xiàn)”的疑惑有所幫助!接下來,請跟著小編一起來學(xué)習(xí)吧!
十余年的康馬網(wǎng)站建設(shè)經(jīng)驗,針對設(shè)計、前端、開發(fā)、售后、文案、推廣等六對一服務(wù),響應(yīng)快,48小時及時工作處理。營銷型網(wǎng)站的優(yōu)勢是能夠根據(jù)用戶設(shè)備顯示端的尺寸不同,自動調(diào)整康馬建站的顯示方式,使網(wǎng)站能夠適用不同顯示終端,在瀏覽器中調(diào)整網(wǎng)站的寬度,無論在任何一種瀏覽器上瀏覽網(wǎng)站,都能展現(xiàn)優(yōu)雅布局與設(shè)計,從而大程度地提升瀏覽體驗。成都創(chuàng)新互聯(lián)從事“康馬網(wǎng)站設(shè)計”,“康馬網(wǎng)站推廣”以來,每個客戶項目都認(rèn)真落實執(zhí)行。
callhome diarization kaldi 中專門用來進(jìn)行混合錄音文件聚類分別的
學(xué)會自己看kaldi中的 指令demo。
個人操作如下:
teps/segmentation/detect_speech_activity.sh --cmd 'run.pl' --nj 1 --mfcc-config ./conf/mfcc_hires.conf --extra-left-context 79 --extra-right-context 21 --extra-left-context-initial 0 --extra-right-context-final 0 --frames-per-chunk 150 data/ljj exp/segmentation_1a/tdnn_stats_asr_sad_1a exp/mfcc_hires exp/segmentation_sad_snr/nnet_tdnn_j_ljj data/ljj steps/make_mfcc.sh --mfcc-config conf/mfcc.conf --nj 1 --cmd "run.pl" --write-utt2num-frames true data/ljj_seg exp/make_mfcc mfcc utils/fix_data_dir.sh data/ljj_seg # 倒譜均值方差歸一化(CMVN) local/nnet3/xvector/prepare_feats.sh --nj 1 --cmd "run.pl" data/ljj_seg data/ljj_seg_cmn exp/ljj_seg_cmn cp data/ljj_seg/segments data/ljj_seg_cmn/ utils/fix_data_dir.sh data/ljj_seg_cmn diarization/nnet3/xvector/extract_xvectors.sh --cmd "run.pl" --nj 1 --window 1.5 --period 0.75 --apply-cmn false --min-segment 0.5 exp/xvector_nnet_1a data/ljj_seg_cmn exp/xvectors_ljj_seg diarization/nnet3/xvector/score_plda.sh --cmd "run.pl --mem 4G" --nj 1 --target-energy 0.9 exp/xvector_nnet_1a/xvectors_callhome1 exp/xvectors_ljj_seg exp/xvectors_ljj_seg/plda_scores diarization/cluster.sh --cmd "run.pl --mem 4G" --nj 1 --reco2num-spk data/ljj_seg/reco2num_spk exp/xvectors_ljj_seg/plda_scores exp/xvectors_ljj_seg/plda_scores_num_speakers # 如果知道有多少人說話 則需要生成 --reco2num-spk data/ljj_seg/reco2num_spk diarization/cluster.sh --cmd "run.pl --mem 4G" --nj 1 --threshold 0 exp/xvectors_ljj_seg/plda_scores exp/xvectors_ljj_seg/plda_scores_threshold_0 第二列是文件名,第三列是開始時間,第四列是移動時間 第五列是 從移動時間開始 多少時間算一份 第八列是文件的label 如下是 已知文件有幾個人說話的時候 SPEAKER 18642259056-liujinjie.wav 0 0.000 4.5101 SPEAKER 18642259056-liujinjie.wav 0 4.530 1.660 2 SPEAKER 18642259056-liujinjie.wav 0 6.210 4.880 2 SPEAKER 18642259056-liujinjie.wav 0 11.090 1.660 1 SPEAKER 18642259056-liujinjie.wav 0 12.800 2.130 1 SPEAKER 18642259056-liujinjie.wav 0 14.950 4.400 2 SPEAKER 18642259056-liujinjie.wav 0 19.390 1.810 2 SPEAKER 18642259056-liujinjie.wav 0 21.220 5.220 2 SPEAKER 18642259056-liujinjie.wav 0 26.440 4.410 1 SPEAKER 18642259056-liujinjie.wav 0 30.850 2.480 2 SPEAKER 18642259056-liujinjie.wav 0 33.340 5.120 2 SPEAKER 18642259056-liujinjie.wav 0 38.460 5.990 1 SPEAKER 18642259056-liujinjie.wav 0 44.480 3.910 1 SPEAKER 18642259056-liujinjie.wav 0 48.460 3.460 1 SPEAKER 18642259056-liujinjie.wav 0 52.060 5.420 1 SPEAKER 18642259056-liujinjie.wav 0 57.530 5.030 1 如下是 不知文件有幾個人說話的時候 SPEAKER 18642259056-liujinjie.wav 0 0.000 4.510 1 SPEAKER 18642259056-liujinjie.wav 0 4.530 1.660 3 SPEAKER 18642259056-liujinjie.wav 0 6.210 4.880 2 SPEAKER 18642259056-liujinjie.wav 0 11.090 1.660 1 SPEAKER 18642259056-liujinjie.wav 0 12.800 2.130 1 SPEAKER 18642259056-liujinjie.wav 0 14.950 4.400 2 SPEAKER 18642259056-liujinjie.wav 0 19.390 1.810 2 SPEAKER 18642259056-liujinjie.wav 0 21.220 5.220 2 SPEAKER 18642259056-liujinjie.wav 0 26.440 4.410 1 SPEAKER 18642259056-liujinjie.wav 0 30.850 2.480 2 SPEAKER 18642259056-liujinjie.wav 0 33.340 5.120 2 SPEAKER 18642259056-liujinjie.wav 0 38.460 5.990 1 SPEAKER 18642259056-liujinjie.wav 0 44.480 3.910 1 SPEAKER 18642259056-liujinjie.wav 0 48.460 3.460 1 SPEAKER 18642259056-liujinjie.wav 0 52.060 5.420 1 SPEAKER 18642259056-liujinjie.wav 0 57.530 5.030 1 接下來就是 用pydub 進(jìn)行語音片段的拼接了
到此,關(guān)于“聲紋識別kaldi callhome diarization怎么實現(xiàn)”的學(xué)習(xí)就結(jié)束了,希望能夠解決大家的疑惑。理論與實踐的搭配能更好的幫助大家學(xué)習(xí),快去試試吧!若想繼續(xù)學(xué)習(xí)更多相關(guān)知識,請繼續(xù)關(guān)注創(chuàng)新互聯(lián)網(wǎng)站,小編會繼續(xù)努力為大家?guī)砀鄬嵱玫奈恼拢?/p>
網(wǎng)頁標(biāo)題:聲紋識別kaldicallhomediarization怎么實現(xiàn)
分享鏈接:http://weahome.cn/article/gejods.html