پیش‌نویس:سنتز گفتار یادگیری عمیق

(این مقاله در حال ترجمه از ویکی انگلیسی است

لطفا حذف نشود.)

یادگیری عمیق سنتز گفتار، از شبکه‌های عصبی عمیق (DNN) برای تولید گفتار مصنوعی از متن (متن به گفتار) یا طیف (رمزگذارهای صوتی) استفاده می‌کند. شبکه های عصبی عمیق با استفاده از حجم زیادی از گفتار ضبط شده و در مورد سیستم متن به گفتار، برچسب های مرتبط و/یا متن ورودی آموزش داده می شوند.

بعضی از سنتز کننده های گفتار مبتنی بر DNN، رویکرد طبیعت صدای انسان را در پیش می گیرند.