ďťż

Ładny brzuch

Witam!

Chciałbym stworzyć pewien system, który wymagałby rozwiązania dwóch problemów. Byłbym wdzięczny, gdyby ktoś mógłby mi zasugerować jakieś tutoriale (również anglojęzyczne) / technologie / książki wydawnictwa Helion lub inne, które mogłyby mi pomóc w osiągięciu celu. Chciałbym:
1. Przesłać dane dźwiękowe z telefonu komórkowego do serwera. Osoba posiadająca telefon dzwoniłaby pod specjalny numer i dyktowała ciąg cyfr.
2. Przeanalizować na serwerze te dane i zapisać ciąg cyfr z pliku dźwiękowego do pliku tekstowego (analiza mowy; wymaga rozpoznawania tylko dziesięciu słów - cyfr i kilku dodatkowych).

Z góry dzięki za wszelkie sugestie!
Pozdrawiam!



Bardzo trudne technologicznie ;) rozpoznawanie mowy wymaga dość skomplikowanego oprogramowania. Do tego serwer musi zarządzać podłączonym do niego telefonem (czy też samym modułem GSM) np. za pomocą gammu/wammu (żeby odebrać połączenie i nagrać). Jak masz kilkanaście tysięcy PLN to jakaś firma może coś takiego pewnie napisać ;) Potrzebna znajomość protokołów żeby napisać soft kontrolujący interakcję komórka-odbiornik --- serwer.
Użytkownik Riklaunim edytował ten post 16 sierpień 2009, 18:00
dużo prostsze byłoby wysłanie smsa na serwer i jego zapisanie do pliku txt.Rozpoznawanie mowy to nadal bardzo trudny temat nawet dla gigantów w świecie informatyki.Problem polega na tym że każdy mówi nieco inaczej.Łatwiejsza sprawa by była gdyby kazdy kto dzwoni miał na serwerze nagrany wzorzec głosu.

Jeżeli chodzi o rozpoznawanie mowy w technologii .NET, to obejrzyj sobie te trzy filmy:
http://msdn.microsof...952.aspx#speech
i poczytaj dokumentację:
http://msdn.microsof...28VS.85%29.aspx
http://msdn.microsof...y/aa914274.aspx

Jeżeli wolisz Javę niż .NETa, to poczytaj dokumentację Suna:
http://java.sun.com/...uide/index.html

A jeżeli tych informacji Ci mało, to na googlach, na wikipedii lub na stronach wielkich potentatów informatycznych (Sun, Microsoft, itp.) szukaj pod hasłem "speech" lub "speech recognition" lub "speech api".
Za dobrze się nie znam na rozpoznawaniu mowy, ale podejrzewam, że te api nie obsługują wszystkich języków. Na pewno język angielski jest rozpoznawany, ale czy polski też, tego nie wiem.
Użytkownik Geroj edytował ten post 24 sierpień 2009, 16:55


Dzięki!

Skoro to jest telefon komórkowy to rozwiązania Microsoftu raczej odpadają, zostaje Java. Pomyślałem o tym, żeby kupić np. Nokię 1680 Classic za 199,00 zł albo jakiś inny tani telefon z obsługą Javy (MIDP). Ten tutorial, który podałeś wygląda na pierwszy rzut oka bardzo ciekawie, ale w requirements widzę, że korzysta z Java Virtual Machine, podczas gdy na komórki raczej wchodzi w grę tylko K Virtual Machine albo droga komórka z systemem operacyjnym Symbian. Generalnie to z tego, co po przeczytaniu artykułów z Wikipedii znalazłem, to że musiałbym wzorować się na rozwiązaniu "voice dialing".

No i pozostaje druga sprawa, czyli przesył. Zakładając, że analizę mowy udałoby się zrobić na komórce to można by wysłać dane przy pomocy SMS-a. I to jest właśnie druga kwestia, której jeszcze nie mam rozwiązanej - jak to zrobić, żeby serwer odbierał SMS-a?

Pozdrawiam!

  • zanotowane.pl
  • doc.pisz.pl
  • pdf.pisz.pl
  • zsf.htw.pl
  •