เราต้องการให้ Alexa เลียนแบบเสียงของใครหรือไม่

วันหนึ่ง Alexa จะสามารถเลียนแบบเสียงของใครก็ได้จากเสียงเพียงนาทีเดียว เส้นแบ่งระหว่างเสียงสังเคราะห์กับเสียงจริงนั้นไม่ชัดเจนมานานหลายปีแล้ว

Alexa เลียนแบบเสียง เรามักจะได้ยินตัวแทนที่สร้างจากคอมพิวเตอร์ในสายบริการลูกค้าหรืออ่านบทความออกเสียงให้เราฟังทางออนไลน์ บริษัท Sonantic ในสหราชอาณาจักรมีชื่อเสียงในการลอกเลียนเสียงของ Val Kilmer หลังการผ่าตัดมะเร็งลำคอ ทำให้เขาไม่สามารถพูดได้ ซึ่งคนทั่วไปได้ยินในสารคดีเรื่อง Val เป็นครั้งแรก แต่นั่นก็เข้าถึงเสียงนับสิบล้านใน Top Gun  Maverick ของฤดูร้อนนี้ Amazon ได้ประกาศการเคลื่อนไหวที่ขยายขอบเขตการเข้าถึงเทคโนโลยีดังกล่าวไปยังผู้ใช้ Alexa ผู้ช่วยอัจฉริยะ 

การอัปเดตเทคโนโลยีที่กำลังจะมีขึ้นนี้จะทำให้พวกเขาสามารถแทนที่เสียงมาตรฐานของใครก็ได้ รวมถึงผู้ที่เสียชีวิตด้วย บริษัทอ้างว่าเทคโนโลยีนี้ ซึ่งยังไม่มีกำหนดวางจำหน่าย สามารถสร้างโคลนเสียงของบุคคลได้โดยใช้เสียงเพียง 1 นาที ไม่ว่าใครจะพบว่าความคิดของคุณย่าที่สร้างโดย AI กำลังอ่านเรื่องราวก่อนนอนจาก The Great Beyond ที่น่าขนลุกหรือเป็นที่รัก การเคลื่อนไหวนี้ถือเป็นอีกก้าวหนึ่งในการทำให้เสียงสังเคราะห์สามารถเข้าถึงได้มากขึ้น

เมื่อสี่ปีที่แล้ว การจับรูปแบบเสียงร้องและโทนเสียงของแต่ละบุคคลให้เพียงพอนั้นเป็นกระบวนการที่ยาวนานกว่ามาก ตัวอย่างเช่น VocalID ซึ่งเป็นบริษัทที่ให้บริการเสียงสังเคราะห์สำหรับลูกค้าที่มีเงื่อนไขที่ทำให้พวกเขาไม่สามารถพูดได้ จำเป็นต้องใช้ข้อมูลหลายร้อยประโยคเพื่อสร้างเสียงของแต่ละคนได้อย่างถูกต้อง ในช่วงเวลาเดียวกัน ผลิตภัณฑ์ที่คล้ายกันที่เรียกว่า Speech Morphing ต้องการอินพุตที่เป็นสคริปต์ประมาณหนึ่งชั่วโมง

แม้ว่าการสังเคราะห์จะเริ่มง่ายขึ้นและเป็นเรื่องธรรมดามากขึ้น ในปี 2018 บริษัท Baidu ของจีนได้พาดหัวข่าวเกี่ยวกับการสาธิตเทคโนโลยี Deep Voice ที่ต้องใช้เสียงเพียง 60 วินาทีในการสังเคราะห์เสียง

วันนี้ แพลตฟอร์ม Veritone ช่วยให้คนดังขายเสียงสังเคราะห์เพื่อใช้ในข้อตกลงการรับรอง และฟีเจอร์ Overdub จาก Descript ของบริษัทช่วยให้วิศวกรพอดคาสต์แก้ไขเสียงร้องหรือเปลี่ยนคำในการบันทึกโดยไม่ต้องดึงโฮสต์กลับเข้าไปในสตูดิโอ การสร้างเสียงใหม่เป็นเครื่องมือที่มีประสิทธิภาพสำหรับผู้ที่สูญเสียความสามารถในการพูดเนื่องจากได้รับบาดเจ็บหรือเจ็บป่วย ผู้คนประมาณ 2 ล้านคนในสหรัฐอเมริกาต้องการความช่วยเหลือจากการสื่อสารทางเลือกแบบปรับตัว (AAC) เพื่อพูด สาเหตุของความบกพร่องในการพูดนั้นกว้างมาก 

ตั้งแต่โรคที่ส่งผลต่อการควบคุมการเคลื่อนไหว เช่น สมองพิการ ไปจนถึงเหตุการณ์ต่างๆ เช่น การบาดเจ็บที่สมองหรือโรคหลอดเลือดสมอง ดังนั้นอีกจำนวนมากจึงอาจได้รับประโยชน์จากการทำให้เทคโนโลยีเข้าถึงได้ง่ายขึ้น ประมาณการหนึ่งระบุว่าชาวอเมริกันประมาณ 5 ล้านคนและผู้คน 97 ล้านคนทั่วโลกสามารถได้รับประโยชน์จาก AAC ความสามารถในการใช้เสียงที่กำหนดเองและเป็นส่วนตัวแทน “เสียงโรโบ” ทั่วไปที่พร้อมใช้งานทันทีอาจเปลี่ยนแปลงได้

 

สนับสนุนโดย.  ยูฟ่าสล็อตเว็บตรง