Ses konuşma tanımlayıcı yazılımlar

Sesli konuşmayı yazıya çeviren bilgisayar yazılımları veya daha yaygın ve bilinen ingilizce adıyla "Speech recognition"

kelime açılımı kök anlamıyla ses kayıt tespiti ; Dikte - [Türkçe Konuşma Tanıma]

genelde bilinen Konuşma Sentezleyici veya Speech Synthesizer, programlarının aksine mikrofon benzeri bir şekilde daha önceden alınan bir konuşma veya diyalogun bilgisayar üzerinde yazılı bir hale getirilmesi için kullanılan programlardır.

kullanım alanları

özellikle gazetecilik açısında video ve ses formatında alınan görüşme ve mülakatların bilgisayar ortamında arşivlenmesi ve daha sonraki süreçlerde kişilerin hangi sözü ne zaman söylediğini ortaya çıkması açısında kullanıldığı gibi

ulusal güvenlik açısında yasal zaman aşımı süresince kaydedilen telefon görüşmelerinin süpeli konuşma veya anahtar kelimeli arama için dinleme işinin yasal anlamda tarafsız olarka bilgisayar tarafından tanımlanmasıdır.

çeşitli tartışmalar

genelde bu tarz programlar her ülkenin kendi istikbarat teşkilatı içinde geliştirildip kullanıldığı yönünde söylentiler söylene gelmektedir !

Free software

  • CMU Sphinx — open source under a BSD license
  • Julius — BSD-style license

Free speech corpus and acoustic model repositories

  • VoxForge — open source, GPL

Proprietary software

  • AT&T WATSON
  • HTK — copyrighted by Microsoft, but altering the software for the Licensee's internal use is allowed.
  • CSLU Toolkit
  • Dragon NaturallySpeaking from Nuance Communications is the continuous-speech successor to the older DragonDictate product, and appears to be the focus of all their current development effort (in the dictation area). Since version 10.1 it runs on 64-bit Windows, too.
  • IBM ViaVoice - Control and development as it pertains to embedded processors remain in the hands of IBM. Linux, Mac OS, and Windows products were licensed to Nuance Communications (formerly ScanSoft) which has since discontinued the product. The Nuance website provides a list of which legacy systems can run the final versions.
  • MacSpeech Dictate - Mac OS X speech recognition using the Dragon NaturallySpeaking engine. This replaces MacSpeech's former iListen product which is based on Philips Speech Technology.
  • Microsoft Windows Speech Recognition - Windows Vista and Windows 7 includes version 8.0 of the Microsoft speech recognition engine along with a completely new end user speech experience, known as Windows Speech Recognition.
  • Microsoft Speech API - Speech recognition functionality included as part of Microsoft Office and on Tablet PCs running Microsoft Windows XP Tablet PC Edition. It may also be downloaded as part of the Speech SDK 5.1 for Windows applications, but since that is aimed at developers building speech applications, the pure SDK form lacks any user interface, and thus is unsuitable for end users.
  • Philips SpeechMagic - Market leader within the medical industry according to Frost & Sullivan, Philips SpeechMagic is a recognition engine that may be run either as a stand-alone product or integrated into other applications.[1][2]
  • Proteus Conversational Interface
  • Simmortel Voice
  • Quack.com (acquired by AOL)
  • SpeechWorks
  • Tellme Networks (acquired by Microsoft)

Kaynakça

Konu hakkında basında yer alan haberler

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.