پیشنویس:سنتز گفتار یادگیری عمیق
From Wikipedia, the free encyclopedia
(این مقاله در حال ترجمه از ویکی انگلیسی است
لطفا حذف نشود.)
یادگیری عمیق سنتز گفتار، از شبکههای عصبی عمیق (DNN) برای تولید گفتار مصنوعی از متن (متن به گفتار) یا طیف (رمزگذارهای صوتی) استفاده میکند. شبکه های عصبی عمیق با استفاده از حجم زیادی از گفتار ضبط شده و در مورد سیستم متن به گفتار، برچسب های مرتبط و/یا متن ورودی آموزش داده می شوند.
بعضی از سنتز کننده های گفتار مبتنی بر DNN، رویکرد طبیعت صدای انسان را در پیش می گیرند.