Podatkovni vi - PowerPoint PPT Presentation

About This Presentation
Title:

Podatkovni vi

Description:

Sveu ili te u Zagrebu Fakultet Elektrotehnike i ra unarstva Zavod za elektroni ke sustave i obradbu informacija Podatkovni vi emedijski prijenos i ra unalne mre e – PowerPoint PPT presentation

Number of Views:42
Avg rating:3.0/5.0
Slides: 11
Provided by: Josk79
Category:

less

Transcript and Presenter's Notes

Title: Podatkovni vi


1
Podatkovni višemedijski prijenos i racunalne
mrežeSpeech Recognition
Sveucilište u Zagrebu Fakultet Elektrotehnike i
racunarstva Zavod za elektronicke sustave i
obradbu informacija
  • Joško Rogulj
  • Joško Rokov
  • Nino Talian
  • Sijecanj 2006.

2
Sadržaj
  • Uvod
  • Princip rada
  • Opca kategorizacija sustava
  • Primjene
  • Komercijalni sustavi
  • Besplatni sustavi
  • Zakljucak
  • Literatura

3
Uvod
  • Prepoznavanje govora je proces kojim racunalo
    identificira izgovorene rijeci
  • Velik broj rješenja s tehnologijom raspoznavanja
    govora
  • Kompleksnost problema

4
Princip rada
  • Koraci sustava za raspoznavanje
  • Snimanje govora i detekcija iskaza
  • Predfiltriranje
  • Uokviravanje
  • Filtriranje (opcionalan korak)
  • Usporedba
  • Djelovanje

5
Opca kategorizacija sustava
  • Podjela s obzirom na tipove iskaza koji se mogu
    detektirati
  • Izolirane rijeci
  • Povezane rijeci
  • Kontinuirani govor
  • Spontani govor
  • Provjeravanje/identifikacija govora

6
Primjene
  • Diktiranje
  • Naredbe/kontrola
  • Telefonija
  • Prijenosni uredaji
  • Medicinske svrhe
  • Ugradeni (embedded) sustavi

7
Komercijalni sustavi
  •  Dragon Naturally speaking (Nuance) --
    http//www.nuance.com/
  •  IBM ViaVoice -- http//www.scansoft.co.uk/viavoic
    e/
  •  SpeakToText (CoolSoft) -- http//www.coolsoftllc.
    com
  •  VR Commander (Interactive Voice Technologies) --
    http//www.vrcommander.com/
  •  Audiomatic (Wise Riddles Software) --
    http//www.wiseriddles.com/Audiomatic
  •  e-Speaking (e-speaking) -- http//www.e-speaking.
    com/
  •  Realize Voice Lite (Realize Software) --
    http//www.realizesoftware.com
  •  Voice Studio (Ultimate Interactive Desktops) --
    http//www.voicestudio.us
  •  Abbot (Softsound) -- http//www.softsound.com
  •  Dictation Buddy (High Criteria) --
    http//www.highcriteria.com
  •  MacSpeech iListen -- http//www.macspeech.com/
  • ...

8
Besplatni (OpenSource) sustavi
  •  Xvoice -- http//xvoice.sourceforge.net/
  • Open Mind Speech -- http//freespeach.sourceforge.
    net/
  • CMU Sphinx -- http//cmusphinx.org
  • NICO toolkit -- http//nico.sourceforge.net/
  • GVoice -- http//www.cse.ogi.edu/omega/gnome/gvoi
    ce/
  • CVoiceControl -- http//www.kiecza.de/daniel/linux
    /index.html
  • ...

9
Zakljucak
  • Ocekivanja
  • Veci broj komercijalnih proizvoda
  • Niže cijene postojecih rješenja
  • Razvoj boljih algoritama
  • Veci broj OpenSource rješenja
  • Nove primjene

10
Literatura
  • http//www.tldp.org/HOWTO/Speech-Recognition-HOWTO
    /
  • http//www.nuance.com/naturallyspeaking
  • http//www.scansoft.co.uk/viavoice/
  • http//sourceforge.net
  • ...
Write a Comment
User Comments (0)
About PowerShow.com