Starting with 451 (reasons below each sentence)
;nl_rhasspy_465 “Vlag Bahama’s kopen of bestellen.”
weird sentence
;nl_rhasspy_472 “Van vreemde origine dan nog wel!”
the word “origine” could be pronounced the French way
;nl_rhasspy_485 “Wij schreeuwen vanaf de pier en uiteindelijk zagen ze ons.”
inconsistent use of tenses, change to: “Wij schreeuwden vanaf de pier en uiteindelijk zagen ze ons.”
;nl_rhasspy_497 “Gillend en spuitend komt deze blondine klaar.”
pornographic language
;nl_rhasspy_498 “Gauw eind dit jaar weg!”
weird or incomplete sentence
;nl_rhasspy_500 “Wij van wc eend bevelen wc eend.”
incomplete sentence and the use of the word “wc”
;nl_rhasspy_506 “Dat zou ik wel cool vinden. “”
use of English word: cool
;nl_rhasspy_507 “De Fusion Wireless is duidelijk familie.”
use of English words
;nl_rhasspy_508 “De muis is dan de tweede muis.”
weird sentence
;nl_rhasspy_510 “Al dat is geen toeval.”
incorrect Dutch sentence
;nl_rhasspy_517 “Bij mij ligt er van alles haha, oeps!”
weird sentence
; nl_rhasspy_519 “beet ze haar broer toe.”
incomplete sentence
;nl_rhasspy_524 “Om Tjendol of Dawet te maken.”
uncommon words: Tjendol and Dawet
;nl_rhasspy_529 “En de vis die ze eten is de grote massa, oud, ziek, zwak of misselijk.”
weird sentence
;nl_rhasspy_530 “Zouden zeker nog een keer teruggaan!”
incomplete sentence
;nl_rhasspy_531 “In het spel van paus.”
incomplete sentence
;nl_rhasspy_536 “Ze kiest er een met coquille. „”
French word: coquille
;nl_rhasspy_537 “Gemakkelijk en voor ieder budget!”
Could easily be misread as: Gemakkelijk en voor ieders budget!
;nl_rhasspy_543 "hoek, grote eetkamer en bibliotheek.
incomplete sentence
;nl_rhasspy_545 “Ben jij per december beschikbaar?”
Northern Dutch
;nl_rhasspy_547 “Dat is dat ding en dat na a verschil.”
incorrect sentence
;nl_rhasspy_551 “En ook onze kinderen, met fiets.”
incomplete sentence
;nl_rhasspy_553 “Die zijn aan de kant van de iglo open.”
atypical pronunciation of the “g” in the foreign word “iglo”
;nl_rhasspy_554 “Of de trein al per december in Luik start is nog niet zeker.”
Northern Dutch
;nl_rhasspy_555 “Zo kunt u genieten van”
Incomplete sentence
;nl_rhasspy_559 “De zeventienjarige pakte dat af en stak op hem in.”
weird sentence
;nl_rhasspy_564 “Nee, nee zegt de bakra.”
foreign word: bakra
;nl_rhasspy_569 “In deze pdf hebben wij”
incomplete sentence and the use of the word “pdf”
;nl_rhasspy_571 “Hij zit klaar voor uw mail.”
use of English word “mail”
; nl_rhasspy_573 “Nee, ik ben niet pet.”
weird sentence
;nl_rhasspy_575 “Van de verslaving te komen ze voor.”
incorrect sentence
;nl_rhasspy_584 “Let op de vocht die uit de theedoek komt is heet.”
wrong article (de) and gender used for “vocht”
;nl_rhasspy_588 “Leuk dat je de tekst over de mosjav gaat lezen.”
foreign word: mosjav
;nl_rhasspy_589 “Je kan deze hier downloaden.”
English word: downloaden
;nl_rhasspy_590 “Ken dat niet…waar is de blauwe lucht??? #”
weird sentence, use of “…” in stead of “…” and use of “#”
;nl_rhasspy_591 “De glossy zou er nu moeten zijn.”
weird sentence and use of the English word “glossy”
;nl_rhasspy_596 “Laten afkoelen op de plaat.”
incomplete sentence
;nl_rhasspy_598 “Dat is no go area.”
use of English words
;nl_rhasspy_599 “Je kunt deze foto s laten zien tijdens de presentatie.”
Should be: “Je kunt deze foto’s laten zien tijdens de presentatie.”
;nl_rhasspy_600 “Dan kun je met data aan de slag.”
data could be pronounced the English way
;nl_rhasspy_602 “Deze website is nog in aanbouw.”
English word: website
;nl_rhasspy_605 “Mama was er vaak niet.””
Should be: “Mama was er vaak niet.”
;nl_rhasspy_607 “Zing u zondag in de kerk , zeker zing ik.”
incorrect Dutch conjugation
;nl_rhasspy_608 “Waar wacht je nog op, gamen maar!”
English word: gamen
;nl_rhasspy_609 “Je ontvangt automatisch een reminder.”
English word: reminder
;nl_rhasspy_610 “Kom jij lekker heet genieten.”
pornographic language
;nl_rhasspy_611 “Van stoer sportief tot smart casual.”
English words: smart casual
;nl_rhasspy_619 “duits slordig keel neuken pijpen keel.”
pornographic language
;nl_rhasspy_621 “Wie moet hier nu over besluiten? .”
incorrect Dutch sentence
;nl_rhasspy_622 “Geen toilet of douche binnen.”
French words: toilet and douche
;nl_rhasspy_625 “De verzendkosten voor het retourneren zijn voor uw rekening.”
verb derived from French: retourneren
;nl_rhasspy_628 “Wat is Aura of Chakra healing?”
Use of foreign words: chakra and healing
;nl_rhasspy_629 “Op data en tijdstip dat jullie past!”
ill formed sentence and use of the word “data”
;nl_rhasspy_631 “Reden, de ut kan een.”
incomprehensible sentence
;nl_rhasspy_635 “De drone komt ook in de kleuren blauw en groen.”
use of English word “drone”
;nl_rhasspy_644 “Ik doe er niet meer aan.”
weird sentence
;nl_rhasspy_645 “En ben jij per direct beschikbaar.”
Nothern Dutch
;nl_rhasspy_647 "En welke ben jij eigenlijk? ?
weird sentence
;nl_rhasspy_649 “Dus waarom niet op die manier cashen en dan jezelf laten verdwijnen?”
use of verb derived from English: cashen
;nl_rhasspy_652 “Een tool is ook niet alles.”
use of English word: tool
;nl_rhasspy_657 “Dit verschil is relatief klein maar significant.”
possible use of French pronunciation of “gn” in “significant”
;nl_rhasspy_658 “In het musje dat medelijden heeft?”
weird sentence
;nl_rhasspy_660 “Niet bang zijn om Frans te moeten spreken.”
incomplete sentence
;nl_rhasspy_664 “Service is top, advies is uitstekend.”
use of foreign word: service
;nl_rhasspy_670 “Hij moet direct komen om haar te jagen.”
incorrect Dutch
;nl_rhasspy_673 “Een dier is geen machine.”
atypical pronunciation of “ch” in “machine”
;nl_rhasspy_674 “Hoe kan ik mijn budget besteden?”
atypical pronunciation of “g” in “budget”
;nl_rhasspy_677 “dus kan mij er goed in vinden.”
incorrect sentence
;nl_rhasspy_681 “Ik was twee en dertig.”
should be written as: “ik was tweeëndertig”
;nl_rhasspy_683 “kijken, gamen, roken, te veel eten, dan kan deze methode je echt helpen.”
use of a verb derived from English: gamen
;nl_rhasspy_686 “Lees voor, is het of fout?”
incorrect sentence
;nl_rhasspy_687 “Die zullen exposure zijn voor mij.”
use of English word: exposure
;nl_rhasspy_689 “Dus een ver van mijn bed show is.”
incorrect sentence
;nl_rhasspy_694 “Kaas gemaakt van Jersey melk.”
use of English word: Jersey
;nl_rhasspy_695 “Bellen of mailen middels onze contact pagina is ook mogelijk.”
use of a verb derived from English: mailen
;nl_rhasspy_698 “Dit keer gewoon op de bonnefooi.”
Northern Dutch
;nl_rhasspy_701 “Mijn moeder zegt dat ik niet per se alles hoef te doen.”
atypical pronunciation of “per se”
;nl_rhasspy_705 “Iedere patiënt kan deelnemen aan deze pilot.”
use of English word: pilot
;nl_rhasspy_706 “De iets andere deurbel staat zeer mooi deze deurbel uil.”
incorrect sentence
;nl_rhasspy_712 “Maar je kan ook terecht op de pagina Over.”
weird sentence
;nl_rhasspy_715 “De vrouw vindt bijvoorbeeld dat ze best wel eens chagrijnig is.”
atypical pronunciation of “ch” in “chagrijnig”
;nl_rhasspy_717 “En dat met een beetje kick van de ui en paprika.”
Northern Dutch
;nl_rhasspy_723 “En ben jij per direct beschikbaar?”
Northern Dutch
;nl_rhasspy_724 “Op te halen op zaterdag augustus.”
incorrect sentence
;nl_rhasspy_726 “Janet droeg het optreden vervolgens op aan haar vader.”
atypical pronunciation of “j” in “Janet”
;nl_rhasspy_730 “Een leuk aspect van judo is, dat je je leven lang kunt doorleren zonder klaar te zijn.”
foreign word: judo
;nl_rhasspy_736 “Wie oren heeft, die hore!.””
old Dutch
;nl_rhasspy_737 “Deze bepaling mist dan ook toepassing.”
weird sentence
;nl_rhasspy_739 “En de muziek er, wow!”
incorrect sentence
;nl_rhasspy_746 “Waar staat de data eigenlijk?”
possible English pronunciation of the word “data”
;nl_rhasspy_749 “Is er dan te leven zonder dit lichaamsdeel?”
weird sentence
;nl_rhasspy_750 “Het einde van de leugen? –”
should be: “Het einde van de leugen?”
;nl_rhasspy_754 “Ik was moe ik ging liggen.”
should be: “Ik was moe, ik ging liggen.”
;nl_rhasspy_761 “Wat vind je van en Nicaragua?”
foreign word: Nigaragua
;nl_rhasspy_762 “Heb je research voor je verhaal moeten doen?”
English word: research
;nl_rhasspy_785 “Seks onder de douche kan best lastig zijn.”
French word: douche
;nl_rhasspy_790 “Niet over andere mensen praat of je door jaloezie laat leiden.”
incorrect sentence
;nl_rhasspy_793 “Als eerste bezoek ik Belize.”
foreign word: Belize
;nl_rhasspy_794 “De wijn blijft in vat tot vlak voor de botteling eind augustus.”
should be: “De wijn blijft in het vat tot vlak voor de botteling eind augustus.”
;nl_rhasspy_808 “Upper Ten weer naar Praag.”
use of English words: “Upper Ten”
;nl_rhasspy_810 “Beneden is nog een berging.”
replace by: “Beneden is er nog een berging.”
;nl_rhasspy_814 “Verbranden niet snel en worden relatief gemakkelijk bruin.”
incomplete sentence
;nl_rhasspy_815 “Dit alles maakt het verlies van de bagage goed.”
use of French word: bagage
;nl_rhasspy_816 “Zit zelfs een usb aansluiting in de stoel.”
incomplete sentence and use of “usb”
;nl_rhasspy_817 “grote douche, enigszins moe hoor.”
weird sentence and French word: douche
;nl_rhasspy_820 “Past veel in en is mooi stil.”
incomplete sentence
;nl_rhasspy_824 “No je hebt gelijk maar geeft het niet op.”
“No” should be “Nou”
;nl_rhasspy_828 “In veel gevallen zijn deze verdwijnen vanzelf.”
incorrect Dutch
;nl_rhasspy_833 “Of nee, eigenlijk niet eens van hen.”
incomplete sentence
;nl_rhasspy_835 “Op deze pagina vind je alles over Shoemixx.nl.”
use of website name: Shoemixx.nl
;nl_rhasspy_837 “De Fietser is geen winkel.”
weird sentence
;nl_rhasspy_844 “Echter was dat maar schijn.”
weird sentence
;nl_rhasspy_845 “Ideaal voor op de bank of ‘s zomers op de loungeset!”
English word: loungeset
;nl_rhasspy_847 “Dé zondag die een grote verandering in haar leven kan brengen. ‘”
should be: "Dé zondag die een grote verandering in haar leven kan brengen. "
;nl_rhasspy_853 “De schade aan de auto en de vangrail is groot.”
French word: rail
;nl_rhasspy_857 “Hebt u moeite met douchen?”
verb derived from Frecnh: douchen
;nl_rhasspy_858 “De manat is de munt van Azerbeidzjan.”
foreign words: manat and Azerbeidzjan
;nl_rhasspy_859 “U ziet dan in welke range u zit.”
English word: range
;nl_rhasspy_860 “Op de homepage zie je verder al een aantal spellen voorbijkomen.”
English word: homepage
;nl_rhasspy_865 “U kunt altijd retourneren zonder opgaaf van reden.”
verb derived from French: retourneren
;nl_rhasspy_868 “Wij vragen dan uw naam en email adres.”
English word: email
;nl_rhasspy_869 “Voor zover deze data bekend zijn, kunt u die vinden op deze pagina.”
possible English pronunciation of the word “data”
;nl_rhasspy_872 “Of komt de baby van je zus er bijna aan?”
English word: baby
;nl_rhasspy_873 “Ontvang jij de Winkel Cheque?”
foreign word: cheque
;nl_rhasspy_875 “Ik coach hem in die rol en geeft hem advies.”
English word: coach
;nl_rhasspy_877 “Pijpen zonder is te bespreken.”
pornographic language
;nl_rhasspy_879 “Zoals we zien liggen we op deze range gemakkelijk voor.”
English word: range
;nl_rhasspy_880 “Op uw gebruik van de Website alsmede deze disclaimer is uitsluitend Nederlands recht van toepassing.”
English words: website and disclaimer
;nl_rhasspy_887 “Perfect voor uw afbeelding of branding project!”
English words: branding project
;nl_rhasspy_895 “De volgende dag al in hui!”
weird sentence
;nl_rhasspy_907 “Je komt altijd op de homepage uit!”
English word: homepage
;nl_rhasspy_920 “Na de grote hoosbui ben ik weer verder gaan lopen.”
Northern Dutch word: hoosbui
;nl_rhasspy_922 “We waren eind september en hadden niet mooi weer.”
incorrect Dutch sentence
;nl_rhasspy_923 “Goed zoeken is iets anders dan even snel googelen.”
verb derived from English: googelen
;nl_rhasspy_924 “En deel waar ze eten zou rooster zijn.”
incorrect sentence
;nl_rhasspy_930 “Hoe uw woning tot leven komt?”
incomplete sentence
OK, I’ve combined all the approved prompts between @koan and @hugocoolens (total: 1587). I then ran the optimization to minimize the set without dropping overall coverage, which produced 1169 prompts.
I’ve done my best to clean up the prompts. If you have time, please give them one more quick look over.
The final coverage is about 90%, which I think will be sufficient. For reference, I recently came across a set of Dutch prompts on VoxForge and their coverage was only 70%. VoxForge is all GPL, so I’d be hesitant in re-using any of their prompts.
Ok this was much better: I only removed/commented 30 sentences.
But I feel that there is still some repetition in sentence fragments. This one stood out because “wie o wie” is not something you read every day:
koan@x1:~/Rhasspy/tts-prompts$ grep -i "wie o wie" nl-nl/prompts.txt
( nl_rhasspy_999 "Wie o wie kan ons helpen?" )
( nl_rhasspy_1010 "Wie o wie gaat er winnen, en welke weg gaan ze nemen?" )
( nl_rhasspy_1072 "Wie o wie?" )
( nl_rhasspy_1087 "Wie o wie kan mij helpen?" )
999 and 1087 are almost the same, and 1072 is probably redundant.
I’d still love to improve coverage by trying to add as much words as possible for the missing phoneme pairs.
By the way, can you publish the script to compute the coverage? This would be helpful for fine-tuning the list of prompts: I would then immediately see the effect of removing or adding words or sentences.
Great, thank you! I’m thinking we should keep some of the sentences with English works to get a bit of the foreign phoneme coverage. Do you think those English words are common enough?
This must have been a way of getting the phoneme pair /iː o/
(wie is /w iː/
). The /iː/
is from something like “anal[y]se” too. I see maybe 10 examples in the lexicon where this sound comes at the end of a word (like zei), and no cases where the pair occurs in a single word.
Sure, the coverage file contains all of the missing pairs and example words. If the example words all look unusual or foreign, it probably means the pair can be safely ignored.
Yes, maybe I was a bit too strict in weeding out all English words. Words like “Halloween”, “liken”, “showen”, “shop” and “bye” are probably common enough to include.
Awesome, thank you very much! I am training a new model now with your data
Quick update, here are some samples from the latest model: https://drive.google.com/drive/folders/1TXDr_ZeRks3fXDQmlIChlwFcDNK5ki4X?usp=sharing
I’m using GlowTTS and the Multiband MelGAN vocoder. I had to re-train from scratch this morning because of a mistake, so the vocoder isn’t sounding so great yet.
I’ll update the examples after it’s had a change to train overnight
I’m looking forward to this!
I’m already ordering some Pi Zero for wakewords in the house
Updated the samples again with the vocoder about 50% done: https://drive.google.com/drive/folders/1TXDr_ZeRks3fXDQmlIChlwFcDNK5ki4X
Sounds much better!
Awesome! Even at 50% the voice sounds great! Can’t wait for 100%
Would it be possible to do this for French also? Can we do this ourselves (recordings+training)?
Definitely The first step will be adding support for French to gruut. I expect this to be done by next week or so.
The recordings can be done with anything as long as you have WAV files and transcripts. With a little work, gruut
will help select a small set of sentences from a large corpora (books, Wikipedia, etc.) that are maximally useful.
Training just needs a CUDA-enabled GPU that’s supported by PyTorch >= 1.5. I’m using a GTX 1060 6GB.
Updated the samples again with the vocoder about 50% done: https://drive.google.com/drive/folders/1TXDr_ZeRks3fXDQmlIChlwFcDNK5ki4X
4 of them are OK, but in the sentence “moeder sneedt zeven scheve sneden brood”, brood is
mispronounced.
kind regards,
Hugo
Something cool I realized I could do this morning: https://drive.google.com/file/d/1PQneOLgfIyHqACsNj4x3FT1_Ypnuy6w0/view?usp=sharing
This is the rdh
Dutch voice speaking an (accented) English sentence! Because I use IPA for both English and Dutch phonemes, I created a small mapping file that approximates the 14 or so “missing” phonemes from Dutch. I had to guess on some, but it works as a proof of concept
So this means we could re-use some of the voices for other languages, until we get native speakers in that language. To get it right, though, I will need help from people who speak both languages. For example, I don’t really know how Dutch folks pronounce the “th” sounds from “thing” and “the”.
I don’t really know how Dutch folks pronounce the “th” sounds from “thing” and “the”
These sounds don’t exist in Dutch
kind regards,
Hugo
I substituted them with “s” and “z” sounds as a guess
What’s neat is that you could approximate a very specific accent with this approach.
Dutch people starting to learn English often mispronounce the “th” of “thing” as a plain “t” and the “th” of “the” as a “d”.
kind regards,
Hugo
p.s. started trimming the phrases, still 1300 to go…
Much appreciated I’ll get your model in the queue as soon as I get the files!
The first Dutch voice for Larynx is ready!
Special thanks to @rdh for donating his voice
It’s easiest to check out with Docker:
$ docker run -it -p 5002:5002 \
--device /dev/snd:/dev/snd \
rhasspy/larynx:nl-rdh-1
Then visit http://localhost:5002 to test it out
You can use this from Rhasspy or Home Assistant by changing the run command slightly:
$ docker run -it -p 59125:5002 rhasspy/larynx:nl-rdh-1
Now you can tell Rhasspy/HomeAssistant that you’re using a MaryTTS server and point it to http://localhost:59125 (usually the default).
Loving it so far! Enormous thanks to @synesthesiam & @rdh
Just a few remarks, I don’t know if these are typical remarks that need manual finetuning.
Written numbers don’t come out well, 6 uur 46 vs. zes uur zesenveertig.
Example: GetTime intent
Some small things like OK is not correctly pronounced. However if you input “okee” the pronunciation is just fine.