About site: Speech Technology/Research - Russian Speech Database
Return to Computers
  About site: http://www.stel.ru/speech/speech_database.htm

Title: Speech Technology/Research - Russian Speech Database Russian firm offering a large collection of .wav files containing Russian speaker samples on CD. Useful for voice and speech recognition research.
Speech_at_Carnegie_Mellon_University Dedicated to speech technology research, development, and deployment. Offers open source speech software, speech and language projects, publications, and resources.

Speech_Group_ESAT/KULeuven_Belgium Site of the Leuven research group on speech technology (speech recognition, speech coding, and speech modification).

Speech_Module_of_an_AI_Mind A design for the speech recognition portion of a robot. Source code and theory.

Speech_Processing_and_Signal_Analysis_Group_FEL_CTU Czech Technical University research focusing on enhancement of speech in the running car environment, speech recognition and to creating of databases of natural language. Demo available for doing spec

Speech_Recognition_Group,_Univ__of_Cambridge The Speech Recognition Group is part of the Machine Intelligence Lab at the University of Cambridge. Its primary area of research is large vocabulary speech transcription. Its research interests also

Speech_Structure_Recognition Speech recognition based on inner structure. Pattern recognition method to estimate which the inner structure of the spoken phoneme.


  Alexa statistic for http://www.stel.ru/speech/speech_database.htm





Get your Google PageRank






Please visit: http://www.stel.ru/speech/speech_database.htm


  Related sites for http://www.stel.ru/speech/speech_database.htm
    Speech_synthesis_and_prosody_papers Webpages of Dimitris Spiliotopoulos. Research in speech synthesis, intonation, prosody, natural language, talking robots.
    Speech-based_and_Pervasive_Interaction_Group Project is investigating non-visual, speech only user interfaces, especially focusing on how the interface design can make up for errors in recognition. Primarily Finnish lanquage will be used.
    Speed_of_Sound,_Inc_ Performs speech data collection and transcription in order to assist vendors and researchers in the training and evaluation of speech-recognition systems.
    STTS_-_Speech_Technology_Services Offers development of technology for speech synthesis, speech recognition and lexica. Based in Stockholm.
    TC-STAR_Project_ Technology and corpora for speech to speech translation project - includes information and details on the project, partners, public documents and news.
    (USA)_Responsive_Virtual_Human_Technology An NSF funded project led by Research Triangle Institute studying spoken language interaction with virtual characters.
    Vishwac_Sena Speech recognition and synthesis based research activities and research papers. Particular focus on neural speech modeling, speech recognition and synthesis in virtual reality agents and virtual reali
    VoiceXML_Italian_User_Group Developers exchange information, solutions, read news and meet other developers and people interested in Voice and Speech recognition technology. Mixed English/Italian site.
    VoiceXML_WOZ The WOZ (Wizard of Oz) experiment is a method used to help the developers verify their dialog models. Also a multimodal implementation for VoiceXML is given. Free binaries and source code.
    WASPAA\'97_Home_page IEEE 1997 Workshop on Applications of Signal Processing to Audio and Acoustics.
    Gensys_VoiceGenie Allows hands free, eyes free web access from any phone. Complements WAP wireless web phones. Uses speech recognition, text to speech, and VoiceXML.
    Designed_to_a_T Download images free for personal and business use.
    Grandma\'s_Graphics Unique graphics, illustrations and images collected from various vintage antique books.
    Lise\'s_Garden_Gallery Thousands of graphics, mostly Victorian and old fashioned.
    Victorian_Art_For_Mother Antique images from the Victorian Era collection for personal use.
    Victorians_net Vintage Victorian clipart, arranged in categories of angels, cherubs, flowers, hearts, and Holidays for personal use.
    FAQ_you A small collection of various FAQs.
    net_legends_FAQ Noticeable phenomena of Usenet. Not completely factual, but as close as can be, given that in some cases the facts are known only to one person or have been lost in the mists of time.
    The_Ultimate_Learn_and_Resource_Center A directory of Usenet FAQs classified by theme rather than by newsgroup.
    Lotus_Systems_&_Services Sells power adaptors, and hardware supplies. Also offers data recovery and transfer.
    AWS_-_The_Dragon_People Specializes in Dragon NaturallySpeaking sales, installation, training, customization, consultation, and support.
    Bliss_Enterprises Provides software, customization and training for individuals seeking to achieve 98% accuracy with Dragon Software. Training is one on one.
    Can_We_Talk_Systems Reseller/integrator of Dragon Systems speech software catering to business, legal and medical profession. Also has specialty consulting, hardware and software products for people with physical, visual
    Chatty_Speech_Technology_Resource Sells Dragon NaturallySpeaking Preferred and Professional, IBM ViaVoice, speech recognition software, Talk Mics microphones, Philips SpeechMikes, Talk Back 2002, text-to-speech software, and free tech
    CITYC Volunteer organization providing computers and teaching via speech reconition software, to quadraplegics in the state of Florida.
    CompuTALK Provides insights into purchasing and using Dragon NaturallySpeaking. Products, resources, help, and support.
    Computers_Made_Effective,_Inc_ Dragon Systems Premier Partners who guide you in selecting products and services that match your needs. Offers end-user training and provides software customization.
    Crown_International IBM certified solution expert in speech recognition using IBM ViaVoice software. Offers 26 speech specialty packages for medical, legal and law enforcement use. Consulting, training, customization a
    Databell_Computing UK based company, certified Scansoft reseller of Dragon NaturallySpeaking voice recognition software. Provides complete voice activated solutions, including software, hardware, training and free telep
    Digital_Dictation_and_Speech_Recognition Provides documents production solutions for professionals in the legal and medical industry.
    Dragon_Solutions Cape Town based Dragon Systems NaturallySpeaking reseller. Also supplies training.
    EverSpeech Speech technology consulting and solutions specializing in voice-enabling Web-based content as well as hands-free applications such as inspection, assembly, maintenance, repair, and data entry.
    Exaq_Micro_Services Specialists in speech recognition and paperless office systems. Site includes background, FAQ and contact information.
    Focus_Medical_Software Sells Dragon Naturally Speaking medical transcription software and provides related services in the San Francisco area.
    Hands_Free_Computing_Speech_Recognition_Software Supplier of speech recognition software, hardware, training, support and consultancy. Leading providers of voice recognition solutions for healthcare, including Dragon NaturallySpeaking specialist voc
    Harcote_Industries_Limited Provides wide variety speech recognition software and hardware solutions including digital audio recorders, microphones, wireless, telephony dictation & conferencing solutions, IBM ViaVoice, Olymp
    InSync_Speech_Technologies Dragon speech recognition software, Andrea microphones, "Buddy" line of USB microphones. Canadian based.
    Lexacom_Digital_Dictation_software Provides organizations a flexible, efficient digital dictation solution - whether at the office or out and about. Has software for Pocket PC.
    McK_Consulting_Inc_ Toronto, Ontario based with 10 years training users on IBM ViaVoice. On-site training for IBM ViaVoice. Corporate, legal, medical, judicial and government organizations. Support includes training vide
    Microtechusa Computer center specializing in Dragon Naturally Speaking software.
This is now2007.com cache of m/ as retrieved on 2008.12.04 now2007.com's cache is the snapshot that we took of the page as we crawled the web. The page may have changed since that time.
A:hover {color: #CC0000} Речевая база данных для программ распознавания и синтеза речи. Описание Телефоны: (+7 495) 77-55-122, 77-55-123, 77-55-124. Главная страницаE-MailКонтактная информацияПоискКарта сайтаВерсия для печати Видеоконференции Решения для Телемедицины Дистанционное обучение Речевые технологии Компьютерная техника Новости RU EN www.stel.ru » Речевые технологии » Базы данных Поиск: function ShowDiv(div_id){adiv=document.getElementById(div_id); adiv.style.display='block';}function HideDiv(div_id){adiv=document.getElementById(div_id); adiv.style.display='none';} Логин: Пароль: Запомнить меня на этом компьютере Забыли свой пароль?   Регистрация О компании Новости Видеоконференции Телемедицина Мультимедийные залы Дистанционное обучение Речевые технологии АПК "Голос"Qspeech"Голос - Аноним"Компьютерная техника Контакты English version Карта сайта Речевая база данных для программ распознавания и синтеза речи. Описание

БАЗА данных для распознавания и синтеза речи 

Характеристика текстов русской речевой базы Характеристика дикторов Метод записи речевой базы Носитель и структура речевой базы  Условия продажи English version

Характеристика текстов

Собранная база данных объединяет несколько составных частей, отличающихся типом читаемого текста и соответствующим транскрипционным материалом. База Описание Таблицы Состоит из 50 серий предложений по 10 или 11 предложений на серию (в среднем, 5 слов в предложении). База сбалансирована по фонемному набору. Для базы существует временная, индивидуальная для каждого диктора, звуковая разметка. Цифры Тексты состоят из различных последовательностей цифр. Каждым диктором начитывалось пять последовательностей (в среднем, 190 слов в файле), отличающихся порядком цифр и манерой их прочтения (слитно, раздельно с паузами). База использовалась для тестирования полученных при помощи базы "Таблицы" моделей, а также для подстройки моделей, адаптированных для распознавания цифр. Для базы существует транскрипция, полученная при помощи программы-транскриптора. Также существует временная, индивидуальная для каждого диктора пословная разметка, полученная при помощи собственной программы распознавания речи на построенных при помощи других баз моделях. Сбалансированные тексты Два художественных текста, сбалансированных по фонемному набору (358 и 398 слов). База использовалась для тренинга и подстройки моделей, построенных на основе базы "Таблицы". При помощи программы-транскриптора для текстов была получена фонемная транскрипция, которая затем адаптировалась для каждого диктора экспертами-фонетистами. Тексты Подборка из 51 текста (в среднем, 520 слов в тексте) на основе газетных статей. Вместе с базой "Сбалансированные тексты" использовалась для тренинга и подстройки моделей. Транскрипции адаптированы для каждого диктора. Предложения Подборка сбалансированных предложений: 50 серий по 10 или 11 предложений в каждой (см. базу "Таблицы"). Транскрипции получены при помощи программы-транскриптора. Общие характеристики каждой базы: База Всего дикторов Мужчин Женщин Общее время звучания (сек.) Таблицы 4 2 2 4364 Цифры 19 16 3 11057 Сбалансированные тексты 96 68 28 16880 Тексты 96 68 28 25816 Предложения 35 16 19 50281 Во всей базе 137 89 48 108398 Предварительная обработка каждой базы: База Выполненные действия Таблицы Для каждого диктора хранится 510 файлов *.wav; по одному предложению в файле. Каждому такому файлу соответствует текстовый файл *.lab с фонемной транскрипцией и разметкой прочитанного предложения (разметка и транскрипция экспертная).Формат названий файлов:NNnniis.wav (NNnniis.lab),гдеNN - номер серии,nn - номер предложения в серии,ii - инициалы или номер диктора,s - пол диктора. Цифры Для каждого диктора хранится 5 файлов *.wav с произнесенными последовательностями цифр. Каждому такому файлу соответствует текстовый файл *.lab с фонемной транскрипцией прочитанных слов (транскрипция выполнена программой-транскриптором, одинакова для всех дикторов), а также текстовый файл *.rec с транскрипцией и пословной разметкой прочитанных слов (разметка и транскрипция выполнена программой распознавания речи). Формат названия файлов:51nniis.wav (51nniis.lab, 51nniis.rec), гдеnn - номер предложения в серии,ii - инициалы или номер диктора,s - пол диктора. Сбалансированные тексты Для каждого диктора хранится файл *.wav с зачитанным сбалансированным текстом. Каждому такому файлу соответствует текстовый файл *.lab с фонемной экспертной транскрипцией прочитанного текста. Формат названий файлов: 53nniiis.wav (53nniiis.lab), где nn - номер сбалансированного текста,iii - инициалы или номер диктора,s - пол диктора. Тексты Для каждого диктора хранится файл *.wav с зачитанным текстом. Каждому такому файлу соответствует текстовый файл *.lab с фонемной экспертной транскрипцией прочитанного текста. Формат названий файлов: 54nniiis.wav (54nniiis.lab), где nn - номер сбалансированного текста,iii - инициалы или номер диктора,s - пол диктора. Предложения Для каждого диктора хранится 510 файлов *.wav; по одному предложению в файле. Каждому такому файлу соответствует текстовый файл *.lab с фонемной транскрипцией прочитанных слов (транскрипция выполнена программой-транскриптором, одинакова для всех дикторов) Nnnniiis.wav (NNnniiis.lab), гдеNN - номер серии,nn - номер предложения в серии,iii - инициалы или номер диктора,s пол диктора.

Характеристика дикторов речевой базы

Возрастная характеристика: Возрастная характеристика дикторов речевой базы русского языка для распознавания и синтеза речиВозраст всех дикторов речевой базы. По оси ординат здесь и далее отложено количество дикторов, по оси абсцисс - их возраст. Возрастная характеристика дикторов речевой базы для распознавания и синтеза речиВозраст дикторов речевой базы "Таблицы" Возрастная характеристика дикторов речевой базы для распознавания и синтеза речиВозраст дикторов речевой базы "Цифры" Возрастная характеристика дикторов речевой базы для распознавания и синтеза речиВозраст дикторов речевых баз "Сбалансированные тексты" и "Тексты" Возрастная характеристика дикторов русской речевой базы для распознавания и синтеза речиВозраст дикторов речевой базы "Предложения" Диалектные группы дикторов по месту рождения: Севернорусское наречие: Ладого-Тихвинская группа 1 человек Костромская группа 1 человек Архангельские говоры 1 человек Среднерусские говоры: Владимиро-Поволжский говор 6 человек Южнорусское наречие: Рязанская группа 8 человек Курско-Орловская группа 11 человек Тульская группа 6 человек Западная диалектная зона 4 человека Восточная диалектная зона 12 человек Литературная норма: Московская 84 человека Петербургская 3 человека

Метод записи речевой базы

Запись речевой базы выполнялась при помощи следующего оборудования и в следующих условиях: Микрофон: Shure SM10A (гарнитура). Неравномерность частотной характеристики в диапазоне от 200 до 10000 Гц v 3 дБ Микрофонный предусилитель: Symetrix SX202. Отношение сигнал/шум 96 дБ. Звуковая плата: Turtle Beach Tropez Plus (использовался линейный вход) Отношение сигнал/шум 80 дБ. Фильтры: отсутствовали Помещение: тихий кабинет Запись и сохранение информации: сигнал от микрофона подавался на линейный вход звуковой платы. Оцифрованный сигнал записывался непосредственно на жесткий диск. Частота опроса и разрядность: 22050 Гц, 16 бит

Носитель и структура речевой базы данных

Носители информации:Речевая база данных хранится на CD ROM ISO9660. База Количество компакт-дисков Таблицы 1 Цифры 1 Сбалансированные тексты 4 Тексты 4 Предложения 4 Во всей базе 14 Структура речевой базы: База данных хранится в виде файлов звукозаписи *.wav. База Структура Таблицы 2040 файлов (по 510 на каждого диктора) хранятся в одном каталоге на CD "База 1. Размеченные таблицы" в отдельном для каждого диктора каталоге на MOD "Б1. Таблицы". В двух каталогах хранится по 2040 файлов *.lab, содержащих соответствующие размеченные транскрипции (латинские и кириллические). Цифры 19 каталогов (по одному каталогу для каждого диктора), содержащих по 5 файлов каждый. Один каталог с транскрипциями всех файлов *.lab. Один каталог с размеченными при помощи программы распознавания пословными транскрипциями всех файлов *.rec. Сбалансированные тексты По одному файлу для каждого диктора. Файлы хранятся в общих каталогах. Всего 96 файлов. Тексты По одному файлу для каждого диктора. Файлы хранятся в общих каталогах. Всего 96 файлов. Предложения 35 каталогов (по одному каталогу для каждого диктора), содержащих по 510 файлов каждый.

УСЛОВИЯ продажи

Выяснить условия приобретения речевой базы можно здесь © 1991-2008 "Стэл - Компьютерные Системы" var gaJsHost = (("https:" == document.location.protocol) ? "https://ssl." : "http://www."); document.write(unescape("%3Cscript src="http://www.stel.ru/speech/speech_database.htm/" + gaJsHost + "google-analytics.com/ga.js' type='text/javascript'%3E%3C/script%3E")); var pageTracker = _gat._getTracker("UA-3706240-3"); pageTracker._addOrganic("mail.ru", "q"); pageTracker._addOrganic("rambler.ru", "words"); pageTracker._addOrganic("nigma.ru", "s"); pageTracker._addOrganic("gogo.ru", "q"); pageTracker._addOrganic("blogs.yandex.ru", "text"); pageTracker._addOrganic("webalta.ru", "q"); pageTracker._addOrganic("aport.ru", "r"); pageTracker._addOrganic("akavita.by", "z"); pageTracker._addOrganic("meta.ua", "q"); pageTracker._addOrganic("bigmir.net", "q"); pageTracker._addOrganic("ukr.net", "search_query"); pageTracker._addOrganic("search.com.ua", "q"); pageTracker._addOrganic("search.ua", "query"); pageTracker._addOrganic("poisk.ru", "text"); pageTracker._addOrganic("km.ru", "sq"); pageTracker._addOrganic("liveinternet.ru", "ask"); pageTracker._addOrganic("gde.ru", "keywords"); pageTracker._addOrganic("quintura.ru", "request"); pageTracker._initData(); pageTracker._trackPageview();
 

Russian

firm

offering

a

large

collection

of

.wav

files

containing

Russian

speaker

samples

on

CD.

Useful

for

voice

and

speech

recognition

research.

http://www.stel.ru/speech/speech_database.htm

Russian Speech Database 2008 December

dvd rental

dvd


Russian firm offering a large collection of .wav files containing Russian speaker samples on CD. Useful for voice and speech recognition research.

Rules




© 2005 Internet Explorer 5+ or Netscape 6+

Recommended Sites: 1. Arts - Business - Computers - Games - Health - Home - Kids and Teens - News - Recreation - Reference - Regional - Science - Shopping - Society - Sports - World Miss Gallery - Top Anime Hentai - DVD rental by mail - Advertising - Loans - Credit Counseling - Myspace Layouts - Adverse Credit Remortgage
2008-12-04 15:04:46

Copyright 2005, 2006 by Webmaster
Websites is cool :)