NEUTRINO是由SHACHI開發的免費歌聲合成器。它基於音頻合成深度學習模型(例如WaveNet,WaveRNN)與Morise開發的NSF來完成合成唱歌任務。
2023年,NEUTRINO v1.0.0發布,項目更名為NEUTRINO Electron。
2024年,NEUTRINO v2.0.0發布,項目更名為NEUTRINO Diffusion Muon。
據官方推特,此軟體的名稱(軟體直譯:中微子)來源於一個「希望能開拓未曾聽說過的樂曲與流派」的想法。
2019年 | ||
---|---|---|
12月3日 | SHACHI在他的推特中上傳了他用自己開發的引擎所合成的音聲的片段。 | |
2020年 | ||
1月27日 | SHACHI表示已將合成引擎轉換成C++,並預告將會把引擎從Linux(Ubuntu)移植到Windows上。 |
v0.1x~0.3x是項目的α測試階段,按順序實現了基本功能。
2020年 | ||
---|---|---|
2月22日 | 名為SHACHI的nico用戶發布演示demo與NEUTRINO正式版本v0.101,內含東北切蒲英與謠子音源模型。 | |
2月29日 | 更新v0.102,公開Linux版引擎。 | |
3月7日 | 更新v0.103,並公開macOS版引擎。 | |
3月20日 | 發布v0.200α,添加隨機生成(-r),解決了氣噪聲和時序估計錯誤的問題。v0.2x開始,加入了新的合成模型-NSF(之前只有WORLD引擎【僅僅是一個音素提取模型】),在使用NSF合成時還需要支持CUDA的NVIDIA顯卡(macOS版本因環境上不支持NVIDIA顯卡而無法使用NSF)。為切蒲英訓練了NSF的新聲庫。 | |
3月22日 | 發布了在線版(online),Google Drive與Colab互聯後就能直接進行合成並輸出。NSF添加到了在線版中。Linux版也集成到了在線版中。 | |
4月10日 | 更新v0.200β,為謠子訓練了NSF的新聲庫。NSF添加到了Windows版中,並將NSF的輸入輸出與其他模塊統一。 | |
4月17日 | 更新v0.200正式版,修復了NSF相關的問題,並添加了運行NSF相關的Visual Studio運行庫。 | |
4月20日 | 更新MacOS版本,但NSF的移植被擱置。 | |
5月29日 | 發布v0.300[1],加入了新的音源模型-JSUT。v0.3x起,提高了引擎的渲染速度和模型的加載速度,GPU優化加速快了4倍,(macOS版本的GPU支持和NSF移植被暫停) | |
6月22日 | 更新v0.310,重新在東北切蒲英與謠子和JSUT的音源數據集上訓練NSF。改善了模型加載,並不再支持以前的模型。 | |
7月7日 | 東北伊達子音源資料庫製作[2],僅僅兩天就完成眾籌目標。 | |
7月10日 | 發布v0.320,加快了GPU上運行的速度,並添加了樣式轉換選項(-k)。 |
β測試階段的v0.4x增加了聲庫數量,而v0.5x提升了質量和功能。
2020年 | ||
---|---|---|
9月18日 | 發布v0.400[3],增加東北伊達子音源,既有音源品質改善,NSF提升採樣率(24khz->32khz)。從這一版本開始系統默認壓縮包只包括切蒲英的音源,其他音源需要另行下載。 | |
11月11日 | 發布v0.411,再次提升採樣率(32khz->48khz),優化高頻噪音,提高質量優化時序。 | |
12月09日 | 更新v0.412。 | |
12月24日 | 發布v0.420,增加音源(Merrow)[4]。 | |
2021年 | ||
1月29日 | 更新v0.422版本,重新兼容macOS(Apple Silicon)。 | |
3月29日 | 發布v0.430,呼吸聲優化。 | |
4月21日 | 小巖井小鳥錄製了50首歌曲,交付給大學開放研究[5],將在NEUTRINO作為SEVEN出道。 | |
4月23日 | 發布v0.431,增加音源(NAKUMO)[6] | |
6月21日 | 面向贊助者的東北俊子音源公開。7月5日,東北俊子音源完全公開。7月7日,SEVEN音源完全公開[7] | |
10月1日 | 發布v0.500β,更新了所有的聲庫,並不再兼容0.431之前版本的聲庫。本版本開始,默認聲庫由切蒲英更改為Merrow。 | |
11月15日 | 發布v0.510,可以微調WORLD(β版本)的平滑選項,支持日英雙語顯示錯誤信息,並將未定義或不包含歌詞的音符改為生成靜音片段。 | |
2022年 | ||
2月10日 | 發布v0.540,更新NSF版本,現可在CPU/GPU上合成NSF,並在Windows、MacOS和在線版本上使用。 | |
3月25日 | 發布v0.551,提高了引擎的估計精度,修復了NSF在MacOS上的錯誤。 |
2022年 | ||
---|---|---|
4月22日 | v1.0.0發布。項目更名為Neutrino Electron。規格和操作已經穩定,因此作為正式版發布。同時註冊了Niconico Commons和PIXIV FANBOX。 | |
6月8日 | v1.1.0發布,提高了NSF合成質量,改進了NSF框架。不再兼容之前的語音庫。 | |
8月1日 | v1.2.0發布。 | |
10月14日 | 更新v1.2.1。 | |
11月15日 | v1.3.0發布,提高了NSF在GPU上的運行速度,並支持多GPU。 |
2023年 | ||
---|---|---|
4月28日 | v2.0.0發布。項目更名為Neutrino Diffusion Muon。 | |
6月16日 | v2.1.0發布。提高f0和WORLD的精度,更新onnx runtime框架的版本。 | |
7月14日 | v2.2.0發布。更改了NSF和WORLD的輸出音量。 | |
10月27日 | v2.3.0發布。更新Merrow,GPU版本的一些操作從CPU改為GPU。 | |
10月30日 | 更新v2.3.1,12月16日更新v2.3.2。 | |
2024年 | ||
1月12日 | v2.4.0發布。 | |
3月13日 | v2.5.0發布,更新了CUDA版本,默認聲庫增加了Nakumo。 | |
5月10日 | 更新v2.5.1。 | |
9月20日 | v2.6.0發布。 | |
10月11日 | 更新v2.6.1。 |
使用 GPU 進行合成需要 NVIDIA 製造的 CUDA 兼容 GPU。由於是深度學習應用,推薦使用搭載RTX顯卡的計算機配置,或直接使用google colab版本。
Google Colaboratory(以下簡稱 Colab)是一項網絡服務,可讓您在瀏覽器上運行 Google 的雲 PC。
首次運行時可能會很慢,但之後再運行就會變得很快。
在線版本也可以在本地 PC 上的 Ubuntu 上運行。
(多人正在開發分支,詳情見官方推特相關)
首先需要用制譜軟體(如自由軟體MuseScore)來創建一個樂譜文件並加上歌詞。注意,呼吸符號(∨)有著重要的意義,把呼吸符號和促音「っ」疊放的話,會更容易發出穩定的聲音。還有,四分以下的休止符要儘可能少一些。歌詞用全形平假名、片假名輸入,一個音符最好只輸入一個元音。
然後導出MusicXML文件,將其拖入NEUTRINO\score\musicxml
文件夾中之後,返回NEUTRINO根目錄,用記事本打開Run.bat
,將set BASENAME=
之後的文字改成導出的MusicXML的文件名,將set ModelDir=
後改成欲使用的歌手,之後保存退出,再直接運行Run.bat
,耐心等候,當命令行窗口自動關閉後,便可在Output
文件夾中找到合成出的WAV文件。
最後再將導出的文件用根據所需在第三方軟體(如WaveSurfer、Melodyne)中進行修音以及其他調整。
|
歌聲ライブラリ(ナクモ)を追加しました。