แนะนำ synthesizer for NVDA
Forums:
ปัญหาข้อแรกสำหรับคนที่เพิ่งลองใช้ free Screen Reader อย่าง NVDA ก็คงเป็นเสียงอ่าน หรือตัว Synthesizer ที่ฟัง "ไม่รู้เรื่อง" ซึ่งในส่วนนี้เราคงต้องยอมรับ เพราะจะให้ของฟรีมันอ่านและมีเสียงที่ชัดเจนเหมือนกับเสียงที่มากับโปรแกรมอ่านจอภาพราคาแพงนั้นก็คงจะไม่ใช่
แต่ในส่วนนี้สำหรับคนตาบอดในไทยเราก็อาจจะไม่ใช่ปัญหาหลักเสียทีเดียว เพราะอย่างไรแล้ว เราก็ต้องเปลี่ยนเสียงมาใช้ตาทิพย์ ซึ่งต้องใช้คู่กับ Microsoft Speech engine SAPI4/SAPI5 ซึ่งก็มีเสียงอ่านที่ค่อนข้างจะใช้ได้ในระดับหนึ่ง
แต่การใช้งานบางทีเราก็ต้องการให้มันอ่านเฉพาะภาษาอังกฤษเพียงอย่างเดียว และสำเนียงภาษาอังกฤษของโปรแกรมตาทิพย์ ก็ไม่ค่อยจะรื่นหูสักเท่าไหร่ ดังนั้น เสียง synthesizer ที่เป็นภาษาอังกฤษเพียวๆ ก็ยังมีความสำคัญอยู่
ในบทความนี้เราจะมาแนะนำเสียง Synthesizer ที่นอกเหนือจากตัวที่ติดมากับ NVDA กันครับ แต่ก็ต้องบอกไว้ก่อนว่า เราต้องเข้าใจกันไว้ก่อนนะครับว่ามันเป็นของที่เขาแจกมาให้ใช้ฟรี ดังนั้นคุณภาพการอ่าน คุณภาพเสียง ก็อาจจะแตกต่างจาก Eloquence ที่เราคุ้นเคยไปพอสมควร
Pico
Pico เป็นเสียงสังเคราะห์หรือ Synthesizer จาก SVOX ซึ่งก็เป็นบริษัทที่พัฒนาโปรแกรมด้านเสียงสังเคราะห์เจ้าหนึ่ง (บริษัทนี้ได้พัฒนาเสียงสังเคราะห์ภาษาไทยบน Android ออกมาตัวนึงด้วย) ซึ่งโดยปกติแล้ว เสียงสังเคราะห์พวกนี้ก็เป็นซอฟต์แวร์ที่มีราคาค่อนข้างสูง แต่ทาง SVOX ก็ยังใจดี ยอมปล่อยตัวเสียง Pico นี้มาให้เราได้ใช้งานกันฟรีครับ
หากใครสนใจก็สามารถ Download Pico ได้ที่นี่ จริงๆ แล้วเราสามารถโหลดจากเว็บไซต์ของ NVDA เองก็ได้ แต่เพื่อความสะดวก ผู้เขียนจึงทำให้ Pico Synthesizer มาอยู่ในรูปแบบของ NVDA add-on คือมาเป็น package file *.nvda-addon เลยนั่นเอง ทำให้ผู้ใช้สามารถติดตั้งตามขั้นตอนการติดตั้ง add-on ได้เลย
ซึ่งพอติดตั้งเสร็จเรียบร้อยแล้ว เมื่อกดคำสั่ง NVDA+control+s เพื่อเลือกเสียง synthesizer ก็จะเจอSvox Pico Synthesizer เพิ่มขึ้นมาอีกตัวหนึ่ง (ตัวนี้เป็นเสียงผู้หญิงนะครับ)
และเราก็สามารถไปปรับแต่งตรง Voice settings (NVDA+control+v) เพื่อเลือกสำเนียงภาษาต่างๆ ได้อีกนะครับ โดยค่าปริยายก็จะเป็น American English นั่นเอง
Festival
Festival นี้ก็เป็นอีกเสียงหนึ่งที่มีให้โหลดมาใช้กันได้ฟรีจากเว็บ NVDA นะครับ
โดยใครที่สนใจก็สามารถโหลดได้จากเว็บของ NVDA โดยตรง Download Festival Synthesizer for NVDA 2011.1 or later clickhere (ตัวนี้ไม่สามารถทำเป็น add-on ให้ได้)
โดยตัวนี้เป็นไฟล์ติดตั้งสำหรับโปรแกรม NVDA version ที่ใหม่กว่า 2011.1 ขึ้นไปนะครับ (ใครใช้ NVDA คงใช้รุ่นใหม่ล่าสุดกันอยู่แล้วแหละเนาะ)
ไฟล์ที่เราโหลดมาได้จะเป็นไฟล์นามสกุล .exe แต่มันไม่ใช่ไฟล์ที่ไว้ติดตั้งโปรแกรมทั่วๆ ไปหรอกครับ มันเป็นการซิปรูปแบบหนึ่งเท่านั้น เมื่อเรากด enter ที่ไฟล์ ก็จะเจอหน้าต่างถามว่าเราจะคลายไฟล์ซิปนี้ไปยังที่ไหน โดยค่าเริ่มต้นก็จะเป็นใน folder ที่เราวางไฟล์นั้นไว้นั่นแหละ ส่วนใครจะคลายไปไว้ที่อื่นๆ ก็แล้วแต่สะดวกนะครับ
ขั้นตอนถัดไปก็คือ เราต้องนำไฟล์ที่คลายซิปออกมาแล้วทั้งหมด (มี1 folder กับอีก 2 files) ไปวางในโฟเดอร์ userConfig\synthDrivers\ นะครับ สำหรับคนที่อ่านบทความที่แล้ว แล้วลง add-on userParams ไว้แล้ว ก็กด NVDA+shift+p เพื่อเข้าไปยังโฟเดอร์ userConfig ได้เลย จากนั้นก็กด s หา โฟเดอร์ synthDrivers และนำไฟล์ไปวางได้เลย
หลังจากนั้นเมื่อเรา restart โปรแกรม NVDA แล้ว เมื่อกดเลือกเสียง synthesizer (NVDA+control+s) เราก็จะเจอ Festival เพิ่มขึ้นมาให้ใช้งานกันอีกเสียงนึงแล้วครับ (ตัวนี้เป็นเสียงผู้ชาย)
และเช่นเดียวกับเสียง Pico เมื่อเราเข้าไปตรงส่วนของ Voice settings ก็จะมีเสียงให้เลือกเปลี่ยนเช่นกัน (แต่จำนวนอาจไม่เท่ากัน)
Microsoft Speech Platform
ตัวนี้จะแตกต่างจาก Microsoft Speech API หรือพวก SAPI4/SAPI5 ที่เราคุ้นเคยกันนะครับ เข้าใจว่าเป็นรูปแบบใหม่จาก Microsoft ความจริงในเว็บมีระบุไว้ว่า ติดตั้งได้ตั้งแต่ระบบปฏิบัติการ Microsoft Windows Vista ขึ้นไปเท่านั้น แต่ผู้เขียนทดสอบแล้วพบว่า Microsoft Windows XP servicePack 3 นี่ก็ติดตั้งได้เช่นกัน
การใช้งานนี้เราจะต้องใช้กับ NVDA version ใหม่ๆ ด้วยนะครับ ไม่อย่างนั้นตัว NVDA จะไม่เจอเสียงนี้ให้เลือก
การติดตั้ง Microsoft Speech Platform
- อย่างแรกท่านต้อง Download ตัว SpeechPlatformRuntime มาเสียก่อน
- สำหรับระบบปฏิบัติการ 32bit
- สำหรับระบบปฏิบัติการ 64bit โหลดมาแล้วก็ติดตั้งตามขั้นตอนปกติได้เลย แต่สำหรับผู้ที่ใช้ระบบปฏิบัติการ 64bit มีเงื่อนไขนิดนึงว่าท่านต้องติดตั้งทั้ง 2 ตัวเลย (ด้วยเหตุผลบางประการที่ผู้เขียนมิทราบได้)
- จากนั้นเราก็ต้องเข้าไป download redistributable language packs ซึ่งมันก็คือเสียงที่เราต้องการนำมาใช้นั่นเอง โดยมีข้อสังเกตให้ว่า ชื่อไฟล์ที่มีให้โหลดนั้น จะแบ่งเป็น 2 ประเภทหลัก คือ ไฟล์ที่ชื่อขึ้นต้นว่า MSSPeech_sr ซึ่งจะอยู่ส่วนแรกๆ ในตารางที่มีให้โหลด ตัวนี้จะเป็นส่วนของ Speech recognizion นะครับ เราคงไม่ได้ใช้ ก็ไม่จำเป็นต้องโหลดมา และส่วนไฟล์ที่เราจะโหลดมาใช้ได้ ก็จะชื่อขึ้นต้นว่า MSSPeech_tts_(ชื่อของประเทศต่างๆ เป็นตัวย่อ 2 ตัว)และตามด้วยชื่อของเสียงนั้นๆ ซึ่งส่วนนี้แหละที่เราจะโหลดมาใช้งานเพื่อใช้เป็น synthesizer ของ NVDA ได้ แต่ถ้าใครไม่อยากวุ่นวายเข้าไปเลือกเสียงด้วยตนเอง ผู้เขียนก็มีเสียงที่เป็นภาษาอังกฤษมาให้ทดลองเอาไปใช้กันดู 3 สำเนียงตามนี้ครับ
- MSSpeech_TTS_en-AU_Hayley
- MSSpeech_TTS_en-US_Helen
- MSSpeech_TTS_en-US_ZiraPro แต่ถ้าใครชอบสำเนียงอื่นๆ ก็เข้าไปลองโหลดมาใช้ดูได้จาก link ที่ให้ไว้กันเองได้เลยครับ ตัวเสียงเมื่อโหลดมาแล้ว วิธีติดตั้งก็ไม่มีอะไรเพียงแค่ enter ที่ไฟล์ที่โหลดมา มันก็จะติดตั้งให้โดยอัตโนมัติ ไม่มีถามอะไรเลย
ส่วนวิธีใช้ เมื่อเราลงตัว Speech Platform พร้อมทั้งเสียงที่ต้องการเรียบร้อยแล้ว เมื่อเราเลือกเสียง synthesizer ในโปรแกรม NVDA (NVDA+control+s) ก็จะมี Microsoft Speech Platform ขึ้นมาเป็นตัวเลือกให้ จากนั้นก็เช่นเดิม หากต้องการเปลี่ยนเสียง(สำเนียง) จากไฟล์ที่เราโหลดมาติดตั้งในขั้นตอนที่ 2. ก็ให้ไปที่ Voice settings (NVDA+control+v) เสียงต่างๆ ที่ท่านโหลดมาลง ก็จะมีให้เลือกตรงนี้ (ซึ่งความเห็นส่วนตัวของผู้เขียน คิดว่าเสียงจาก Microsoft Speech Platform นี้ดูจะฟังง่ายกว่า เสียง Pico และ Festival ที่แนะนำไปก่อนหน้านี้ทั้ง 2 ตัว)
Switch Synthesizer
ส่วนนี้แหละครับ ที่ได้เกริ่นไว้ท้ายบทความที่แล้วว่า จะมี "surprise!" สำหรับคนอื่น ผู้เขียนก็ไม่ทราบนะ แต่โดยส่วนตัว การค้นพบเจ้าส่วนเสริมที่เอาไว้สลับเสียง synthesizer ใน NVDA ได้เนี่ย เป็นอะไรที่ WOW! มากๆ
สำหรับใครที่ใช้โปรแกรม Jaws version ที่เก่ากว่า 11 ลงไป คงคุ้นเคยกับ JPT Tatip Plugin ที่ไว้ทำให้เราสามารถสลับเสียง synthesizer ระหว่าง เสียง Eloquence กับเสียงตาทิพย์ได้สะดวกมากขึ้นกันดีอยู่แล้ว (หรือว่า Jaws v.11 ขึ้นไป ก็มี plugin ตัวนี้แล้วหว่า ผู้เขียนอาจตกข่าว)
ซึ่งเชื่อว่าการมีคำสั่งลัดไว้สลับเสียงแบบนี้ เป็นความสะดวกสบายที่ใครหลายคนเคยตัวกันไปเสียแล้ว (ผู้เขียนก็ด้วย) ดังนั้นเมื่อมาใช้ NVDA และต้องกดคำสั่งหลายขั้นตอนเพื่อสลับเสียง ก็เป็นสาเหตุอย่างหนึ่งที่ทำให้เราไม่อยากจะใช้มัน
แต่วันเดียวกับที่ผู้เขียนได้เจอเว็บไซต์ ที่มี NVDA add-on ให้โหลด ผู้เขียนก็ได้ไปค้นพบเว็บนึง ที่เขาแจก add-on ที่ไว้สลับภาษา และเมื่อนำมาใช้ ก็พบว่ามันสามารถใช้งานได้ และก็ทำงานได้ดีเสียด้วย
วิธีการใช้งานของ add-on ตัวนี้ จะเป็นหลักการคล้ายๆ กับปุ่มเปลี่ยนภาษาแป้นพิมพ์ที่เราใช้ๆ กันนั่นเอง คือกดหนึ่งครั้งเพื่อสลับไปอีก synthesizer นึง และกดอีกครั้งเพื่อสลับกลับมา วนไปได้เรื่อยๆ
โดยผู้เขียน add-on ตัวนี้ เขาตั้งคำสั่งลัดมาเป็น NVDA+ปุ่มตัวหนอน ซึ่งเราส่วนใหญ่ก็เปลี่ยนมันเป็นปุ่มเปลี่ยนภาษาของแป้นพิมพ์กันไปแล้ว ดังนั้นคำสั่งนี้จึงไม่เหมาะกับการใช้งานของคนไทยเราเท่าไหร่ ผู้เขียนจึงได้เปลี่ยนคำสั่งลัดนี้ ให้เป็น control+shift+space bar แทน ซึ่งทดสอบแล้วว่ากดใช้งานได้สะดวกมากๆ
และผู้เขียนก็ได้ทำให้ส่วนเสริมตัวนี้เป็น add-on package อยู่ในรูปแบบของ *.nvda-addon เพื่อความสะดวกในการติดตั้ง พร้อมทั้งปรับแต่งเป็นสองรูปแบบได้แก่
- แบบที่ 1 ไว้สลับระหว่าง เสียง eSpeak กับเสียง SAPI5 หรือเสียงตาทิพย์นั่นเอง
- แบบที่ 2 ไว้สลับระหว่างเสียงMicrosoft Speech Platform กับ SAPI5 อีกเช่นเดิม
ซึ่งใครที่คิดว่าจะใช้ synthesizer 2 ตัวไหนเป็นหลัก ก็เลือกโหลดกันตามที่จะใช้ได้เลยนะครับ แต่อย่าลงพร้อมกันทั้งสองตัวล่ะ เพราะมันจะทำงานได้แค่ตัวใดตัวหนึ่งเท่านั้น :P
ก็มีมาแนะนำกันประมาณนี้นะครับสำหรับ synthesizer ที่เอาไว้ใช้กับโปรแกรม NVDA ได้ จะเห็นว่าแค่ของฟรี ที่ไม่ต้องไปละเมิดลิขสิทธิ์ใคร ก็สามารถนำมาใช้งานในชีวิตประจำวันได้อย่างสะดวกพอสมควรแล้ว ผู้เขียนก็หวังว่า บทความทั้ง 2 บทความเกี่ยวกับโปรแกรม free Screen Reader อย่าง NVDA ที่ได้เขียนมานี้ จะเป็นแรงบรรดาลใจให้ใครหลายๆ คนหันมาสนใจ freeware กันบ้าง และถ้าคุณเลิกที่จะละเมิดลิขสิทธิ์ซอฟต์แวร์ตัวอื่นๆ ได้ด้วยก็จะยิ่งดีมากๆ
ขอได้รับคำขอบคุณ .... (ทีมงาน) ฮาฮา
อ้อๆ เกือบลืมไป ข้อมูลที่นำมาเขียนบทความนี้ นำมาจาก Extra Voices for NVDA ก็ต้องขอขอบคุณชุมชนนักพัฒนาโปรแกรม NVDA และผู้เขียนส่วนเสริม Switch_synthe (ซึ่งไม่ทราบว่าเป็นใคร) ไว้ ณ ที่นี้ด้วยครับ :D
- 13784 reads