أعلنت شركة جوجل Google الأمريكية الرائد عن إطلاق نموذج جديد للذكاء الاصطناعي اللغوي يسمى AudioPaLM والذي يتمتع بقدرة استثنائية على الاستماع، والتحدث، والترجمة بدقة عالية وبسرعة فائقة.
وكما يُشير الاسم، فإن هذا النموذج الجديد يعتمد بالأساس على نقاط القوة في نموذجين آخرين موجودين بالفعل وهما PaLM-2 و AudioLM، وفقاً لموقع aitnews.
وينتمي نموذج PaLM-2 إلى نماذج اللغة الكبيرة LLMs التي تستطيع فهم ومحاكاة وتوليد النصوص بشكل يشبه اللغات البشرية، بينما يُعنى نموذج AudioLM بأشياء مثل الحفاظ على هوية المتحدث ونبرة الصوت (الصوتيات).
وقدم الباحثون في جوجل نموذج AudioPaLM عبر الجمع بين كلا النموذجين السابق الإشارة إليهما من أجل توليد النصوص والكلام بكفاءة عالية.
ويستطيع نموذج AudioPaLM الجديد القيام بالعديد من الوظائف المختلفة مثل الترجمة الصوتية من لغة إلى أخرى مع الحفاظ على نبرة الصوت نفسها، كما يمكنه التقاط الأصوات أو الأوامر المنطوقة، ثم إعادة إنتاج الصوت بلغات أخرى مختلفة.
ويعمل النموذج أيضًا على تعرّف الأصوات وترجمتها إلى نصوص، حتى إنه يمكنه ترجمة التراكيب اللغوية التي لم يتعرض لها من قبل بدقة كبيرة، وفقًا للباحثين العاملين على النموذج.