摘要: 義無反顧馬督工,Bert-vits2V210復刻馬督工實踐(Python3.10) Bert-vits2更新了版本V210,修正了日/英的bert對齊問題,效果進一步優化;對底模使用的數據進行優化和加量,減少finetune失敗以及電音的可能性;日語bert更換了模型,完善了多語言推理。 閱讀全文
posted @ 2023-11-29 10:47 劉悅的技術博客 閱讀(434) 評論(4) 推薦(6) 編輯
摘要: 本地訓練,立等可取,30秒音頻素材復刻霉霉講中文音色基于Bert-VITS2V2.0.2 之前我們使用Bert-VITS2V2.0.2版本對現有的原神數據集進行了本地訓練,但如果克隆對象脫離了原神角色,我們就需要自己構建數據集了,事實上,深度學習模型的性能和泛化能力都依托于所使用的數據集的質量和多樣性,本次我們在本地利用Bert-VITS2V2.0.2對霉霉講中文的音色進行克隆實踐。 霉 閱讀全文
posted @ 2023-11-27 11:37 劉悅的技術博客 閱讀(245) 評論(0) 推薦(4) 編輯
摘要: 本地訓練,開箱可用,Bert-VITS2 V2.0.2版本本地基于現有數據集訓練(原神刻晴) 按照固有思維方式,深度學習的訓練環節應該在云端,畢竟本地硬件條件有限。但事實上,在語音識別和自然語言處理層面,即使相對較少的數據量也可以訓練出高性能的模型,對于預算有限的同學們來說,也沒必要花冤枉錢上“云端”了,本次我們來演示如何在本地訓練Bert-VITS2 V2.0.2模型。 閱讀全文
posted @ 2023-11-22 15:42 劉悅的技術博客 閱讀(440) 評論(2) 推薦(6) 編輯
摘要: 又欲又撩人,基于新版Bert-vits2V2.0.2音色模型雷電將軍八重神子一鍵推理整合包分享 Bert-vits2項目近期炸裂更新,放出了v2.0.2版本的代碼,修正了存在于2.0先前版本的重大bug,并且重煉了底模,本次更新是即1.1.1版本后最重大的更新,支持了三語言訓練及混合合成,并且做到向下兼容,可以推理老版本的模型,本次我們基于新版V2.0.2來本地推理原神小姐姐們的音色模型。 具 閱讀全文
posted @ 2023-11-20 11:26 劉悅的技術博客 閱讀(851) 評論(2) 推薦(7) 編輯
摘要: 一鍵整合,萬用萬靈,Python3.10項目嵌入式一鍵整合包的制作(Embed) 我們知道Python是一門解釋型語言,項目運行時需要依賴Python解釋器,并且有時候需要安裝項目中對應的三方依賴庫。對于專業的Python開發者來說,可以直接通過pip命令進行安裝即可。但是如果是分發給其他的Windows用戶,特別是不熟悉Python的人來說,這樣過于繁瑣。因此最好的辦法是連同Python解釋器和Python項目打包在一起,通過嵌入式一鍵整合包解決項目的分發問題。 本次我們以[一鍵扒譜的項目](https://v3u.cn/a_id_327)為例子,演示如何將項目直接打包為一鍵整合包,方便其他用戶運行使用。 閱讀全文
posted @ 2023-11-16 18:15 劉悅的技術博客 閱讀(319) 評論(2) 推薦(3) 編輯
摘要: 不懂樂理,也能扒譜,基于openvpi將mp3轉換為midi樂譜(Python3.10) 所謂"扒譜"是指通過聽歌或觀看演奏視頻等方式,逐步分析和還原音樂作品的曲譜或樂譜的過程。它是音樂學習和演奏的一種常見方法,通常由音樂愛好者、樂手或學生使用。 在扒譜的過程中,人們會仔細聆聽音樂作品,辨別和記錄出各個音符、和弦、節奏等元素,并通過試錯和反復推敲來逐漸還原出準確的曲譜或樂譜。這對于那些沒 閱讀全文
posted @ 2023-11-15 16:17 劉悅的技術博客 閱讀(281) 評論(4) 推薦(3) 編輯
摘要: AI歌姬,C位出道,基于PaddleHub/Diffsinger實現音頻歌聲合成操作(Python3.10) 懂樂理的音樂專業人士可以通過寫樂譜并通過樂器演奏來展示他們的音樂創意和構思,但不識譜的素人如果也想跨界玩兒音樂,那么門檻兒就有點高了。但隨著人工智能技術的快速迭代,現在任何一個人都可以成為“創作型歌手”,即自主創作并且讓AI進行演唱,極大地降低了音樂制作的門檻。 本次我們基于PaddleHub和Di 閱讀全文
posted @ 2023-11-14 15:05 劉悅的技術博客 閱讀(271) 評論(0) 推薦(2) 編輯
摘要: 持續進化,快速轉錄,Faster-Whisper對視頻進行雙語字幕轉錄實踐(Python3.10) Faster-Whisper是Whisper開源后的第三方進化版本,它對原始的 Whisper 模型結構進行了改進和優化。這包括減少模型的層數、減少參數量、簡化模型結構等,從而減少了計算量和內存消耗,提高了推理速度,與此同時,Faster-Whisper也改進了推理算法、優化計算過程、減少冗余計算等,用以提高模型的運行效率。 本次我們利用Faster-Whisper對日語視頻進行雙語(日語/國語)轉錄實踐,看看效率如何。 閱讀全文
posted @ 2023-11-03 14:16 劉悅的技術博客 閱讀(459) 評論(0) 推薦(4) 編輯
摘要: 栩栩如生,音色克隆,Bert-vits2文字轉語音打造鬼畜視頻實踐(Python3.10) 諸公可知目前最牛逼的TTS免費開源項目是哪一個?沒錯,是Bert-vits2,沒有之一。它是在本來已經極其強大的Vits項目中融入了Bert大模型,基本上解決了VITS的語氣韻律問題,在效果非常出色的情況下訓練的成本開銷普通人也完全可以接受。 BERT的核心思想是通過在大規模文本語料上進行無監督預訓 閱讀全文
posted @ 2023-10-23 15:49 劉悅的技術博客 閱讀(1246) 評論(0) 推薦(4) 編輯
摘要: 鉛華洗盡,粉黛不施,人工智能AI基于ProPainter技術去除圖片以及視頻水印(Python3.10) 視頻以及圖片修復技術是一項具有挑戰性的AI視覺任務,它涉及在視頻或者圖片序列中填補缺失或損壞的區域,同時保持空間和時間的連貫性。該技術在視頻補全、對象移除、視頻恢復等領域有廣泛應用。近年來,兩種突出的方案在視頻修復中嶄露頭角:flow-based propagation和spatiotemporal 閱讀全文
posted @ 2023-10-13 12:59 劉悅的技術博客 閱讀(448) 評論(0) 推薦(1) 編輯
正能量网站你懂我意思下载,欧美亚洲综合视频,97国产超碰,久在线中文欧美