Diberdayakan oleh Blogger.
RSS

SPEECH RECOGNITION

1.Teknologi Speech Recognition
Speech recognition adalah suatu pengembangan teknik dan sistem yang memungkinkan komputer untuk menerima masukan berupa kata yang diucapkan. Teknologi ini memungkinkan suatu perangkat untuk mengenali dan memahami kata-kata yang diucapkan dengan cara digitalisasi kata dan mencocokkan sinyal digital tersebut dengan suatu pola tertentu yang tersimpan dalam suatu perangkat.

Kata-kata yang diucapkan diubah bentuknya menjadi sinyal digital dengan cara mengubah gelombang suara menjadi sekumpulan angka yang kemudian disesuaikan dengan kode-kode tertentu untuk mengidentifikasikan kata-kata tersebut. Hasil dari identifikasi kata yang diucapkan dapat ditampilkan dalam bentuk tulisan atau dapat dibaca oleh perangkat teknologi sebagai sebuah komando untuk melakukan suatu pekerjaan.

2.Cara Kerja Speech Recognition
Teknologi Speech Recognition yang dikembangkan sejak sepuluh tahun lalu menghadapi dua pilihan, yakni menangkap percakapan terputus (kata per kata) atau percakapan tersambung (per kalimat). Komputer sebenarnya lebih mudah memahami suara untuk kata per kata, yang di antara masing-masing kata terdapat jeda, namun kebanyakan orang lebih menyukai jika teknologi ini mampu menangkap sebuah percakapan normal.

Untuk mengubah percakapan menjadi teks on-screen atau perintah tertentu, komputer melakukan beberapa langkah yang kompleks. Ketika berbicara, Anda mengeluarkan getaran di udara. Kemudian, analog-to-digital converter (ADC) yang ada di soundcard menerjemahkan gelombang analog ini menjadi data digital yang dapat dimengerti oleh komputer.

Untuk melakukan hal tersebut, sistem Speech Recognition melakukan sampling atau digitizing suara dengan cara mengambil ukuran yang paling pas dari gelombang. Sistem menyaring suara yang telah didigitalkan tersebut dan membuang gangguan (noise), dan kadang-kadang memisahkannya ke dalam pita frekuensi yang berbeda. Frekuensi adalah panjang gelombang suara, yang terdengar oleh telinga manusia sebagai tinggi nada (pitch) yang berbeda.

Sistem ini juga menormalkan suara, atau mengaturnya ke dalam tingkat volume yang tetap, terkadang juga mendatarkan suara. Manusia tidak berbicara dalam kecepatan yang sama sehingga suara harus diatur dengan kecepatan yang sama dengan sampel-sampel template suara yang tersimpan dalam komputer.

Langkah selanjutnya adalah memecah sinyal menjadi bagian-bagian kecil, dengan durasi seperseratus detik, atau bahkan seperseribu pada kasus bunyi-bunyi konsonan atau mati. Konsonan memberhentikan produksi suara dengan menghalangi aliran gelombang pada bidang vokal, seperti “p” atau “t”.

Program di komputer kemudian mencocokkan bagian-bagian kecil ini dengan fonem yang dikenal dalam bahasa tertentu. Fonem adalah elemen terkecil dalam sebuah bahasa, merepresentasikan suara yang kita hasilkan, dan merangkainya ke dalam bentuk ujaran yang memiliki makna.

Tahap berikutnya kelihatan sederhana, tapi pada dasarnya merupakan proses yang paling susah diselesaikan, sekaligus merupakan inti dari sebagian besar penelitian di bidang Speech Recognition. Komputer memeriksa fonem-fonem dalam konteks (hubungan) dengan fonem-fonem lain yang menyertainya.

Komputer menjalankan alur (plot) melalui sebuah model statistika yang kompleks, dan membandingkannya dengan koleksi kata, frase, dan kalimat yang telah dikenal. Program Speech Recognition selanjutnya menentukan apa yang mungkin dikatakan oleh pengguna, dan juga mengetikkannya sebagai teks atau mengeluarkannya sebagai perintah pada komputer.

3.Implementasi
Contoh yang paling sederhana pemanfaatan teknologi Speech Recognition adalah voice dial yang sempat menjadi fitur andalan ponsel-ponsel high-end akhir dekade yang lalu. Sedangkan pengaplikasian mutakhir teknologi ini dapat dijumpai pada layanan call center, kemudian secara otomatis komputer akan memberikan solusinya.

Penerapan Speech Recognition juga dapat ditemukan pada beberapa aplikasi komputer yang memungkinkan kita mengetik dokumen tanpa harus memencet tombol-tombol keyboard. Cukup dengan mendiktekan kalimat-kalimat, kemudian secara otomatis komputer akan mengetikkannya. Banyak software yang dirancang untuk mengetikkan apa yang kita katakan melalui microphone, seperti iListen untuk komputer Mac, dan software ViaVoice keluaran IBM.

Dari teknologi mobile, Samsung Electronics saat ini sedang bekerja pada pengembangan versi berikutnya dari platform mobile bada untuk smartphone. Salah seorang eksekutif Samsung mengatakan bahwa mereka ingin menjadikan bada sebagai alternatif software terbaik untuk Google Android.

Samsung sangat serius dalam pengembangan software bada setelah beberapa produk Android mereka terkena imbas dalam sengketa perang paten dengan Apple sehingga tidak bisa dijual di beberapa negara Eropa dan Australia. Selain itu pembelian Motorola Mobility oleh Google juga dikhawatirkan dapat mengurangi ketergantungan pemilik Android itu pada pemasok hardware lainnya, termasuk Samsung. Samsung saat ini telah memiliki keuntungan dari popularitas Android sehingga menjadi perusahaan terdepan yang bersaing untuk menantang Apple di pasar smartphone.

Versi terbaru dari bada 2.0 yang diresmikan pada bulan Februari kemarin, memiliki dukungan mobile-payment, Wi-Fi Direct, Web App dan fitur baru lainnya. Lee mengatakan bahwa perusahaannya belum memutuskan kapan akan memperkenalkan versi terbaru dari bada berikutnya atau berapa banyak software akan berubah.

Samsung juga mengembangkan teknologi pengenalan suara (voice-recognition) yang dapat digunakan untuk fitur yang mirip dengan layanan terbaru Siri milik Apple, kata Lee. Siri, yang termasuk dalam fitur unggulan Apple iPhone 4S terbaru, memungkinkan pengguna meminta update cuaca, membuat janji pada kalender atau mengirim pesan dengan suara.

Sumber : http://badaindonesia.blogspot.com/
http://togaptar.wordpress.com/tag/speech-recognition/

  • Digg
  • Del.icio.us
  • StumbleUpon
  • Reddit
  • RSS

0 komentar:

Posting Komentar