О международных конференциях и выставках
                              по обучению машин общаться с человеком
c помощью речи

                            На международных выставках мира  все большее значение уделяется
                            быстро  развивающимся технологиям общения человека  с машинами
                            посредством голоса.  Речевые технологии становятся  очень  важным
                            направлением прогресса, поскольку они в большой степени увеличат
                            производительность  труда,   облегчат  жизнь человека,   сделают  ее
                            более комфортной.
                            Большое  значение  этих  технологий  определяется  также  и тем, что
                            человек все больше интегрируется в своей работе и жизни с машинами и
                            будет окружен  роботами, которым  он будет  отдавать команды голосом.
                  
                            Быстро развивающиеся речевые технологии все больше
                            демонстрируются на выставках  в  Европе,  США  и  Азии.

                            В США и Европе проводятся важные международные выставки по
                            развитию речевых технологий.  В Нью-Йорке такая конференция
                            и выставка «
SPEECH TEK» с возрастающим успехом проводится
                            ежегодно. Следующая выставка
SPEECH TEK пройдет 18-20 августа
                            на всех трех конгрессных этажах 50-этажной гостиницы «Marriott Marquis»
                            на Бродвее
 
                                                                                                                            Шестнадцать ее лифтов готовы за полминуты
                                                                                                                            доставят также и до 50го этажа  участников
                                                                                                                            конференции и выставки речевых технологий.

                                                                                                    
                                      Около гостиницы
«Marriott Marquis» на Times Square
                           

 
                    Хотя развитие речевых технологий находится  фактически только в
                     начале пути, но по использованию в экономике эти технологии уже
                     перешагнули рубеж  в  2 миллиарда  долларов.
                     В ряде стран люди, когда они  получают информацию,  делают заказы, 
                     производят оплату за товары и услуги, звонят в  банки и различные
                     фирмы в любое время дня и ночи, они  в основном общаются с  говорящим
                     и  понимающим речь роботом.
                   
                     В этом году на выставке демонстрировались более совершенные системы,
                     которые  могут общаться с человеком  на  20  и  больше  языках  и  притом 
                     не только  понимать, но и  анализировать  получаемую от людей речевую
                     информацию, просьбы  или задания.

                     Пользователь может выбирать из  многих вариантов тембр и «окраску» голоса,
                     которым он хочет, чтобы ему отвечала машина. Например, итальянская фирма
                    «
Loquendo» научила свои машины говорить 47 голосами на 20 языках.

                     Разработчики говорящих машин считают, что дальнейшее совершенствование
                     речевых возможностей машин скоро приведет к значительному изменению
                     условий  работы  и  отдыха человека  и  к  изменению  его  образа  жизни.

                     Некоторые автокомпаним уже работают над выпуском автомобилей, которые
                     смогут выполнять голосовую команду водителя, отвечать ему и сообщать
                     водителю своим голосом о своем техническом состоянии.

                     Интересно, что такая работа по речевому общению человека  с машиной
                     уже  двадцать  лет проводится  также и в Китае под руководством и при
                     поддержке правительства.
                             Стенд одной из китайских фирм, которая «учит» свои машины  понимать
                             и говорить  по-китайски  и  переводить  на  европейские языки, которых
                             китайцы  считают более легкими  по сравнению  с  китайским языком.

                         

 

                    А итальянцы, отличающиеся большей  эмоциональностью, особенно в
                    манере разговора,  с успехом  учат свои итальянские машины понимать
                    также и эмоциональную речь.

                      Итальянец  с почетной грамотой,  полученной  именно за эту способность их машины
                      понимать быструю восторженную итальянскую речь и давать на нее разумны ответы:


                         На выставке были показаны технологии, которые по речи могут
                         определять эмоционального состояния человека, правдивости
                         его высказываний и даже выявлять у говорящего опасность
                         его намерений. В этой области значительного успеха удалось
                         добиться ученым израильской компании Nemesysco. Их система
                         извлекает 129 параметров из каждого голосового сегмента.
                                Результаты их работы отражены на этом видео
>>> 

                         Представляют интерес также и разработки компании VoltDelta,
                         позволяющие узнавать по голосу повторно звонящего клиента,
                         знать о его местонахождении в момент звонка, помнить все
                         предыдущие разговоры с ним и учитывать эту информацию
                         в беседе с каждым клиентом.  Системы VoltDelta работают
                         на 53 языках. Несколько видео на английском о достижениях
                         этой фирмы
>>>

                                          
              В практических целях речевые технологии используются, конечно, и при
              освоении космоса. В частности еще в августе 2013 года на Международную
              космическую станцию прибыл говорящий работ. Его имя
KIROBO сочетает
              в себе слова «Робот» и «
Kибо», что по-японски означает «Надежда» и является
              также официальным названием Японского отсека Международной орбитальной
              станции. Киробо был создан японскими учеными для отработки взаимодействия
              и совместного проживания в космосе человека с роботом.
              Он имеет определенные преимущества перед человеком в космосе: весит
              всего 1 кг, ему не требуются продукты питания, он получает бесплатную энергию
              от солнечных батарей станции, может работать  без отдыха и без сна,  не боится
              радиации, не подвержен заболеваниям, депрессии, у него не может быть плохого
              настроения или страха, он способен на любые героические подвиги.
              Астронавт Киробо хранит в своем мозгу, который находится вне станции
              в «облачном» сервере, практически неограниченный объем информации и
              знаний и всегда может извлечь из своей памяти любую информацию,
              может говорить без переводчика в принципе на нескольких языках, хотя пока
              освоил только японский и поэтому его речь понимает на борту станции пока
              только единственный японский астронавт
Koichi Wakata. Когда Ваката спросил
              Кироба, не было ли ему опасно лететь на станцию в грузовой ракете, тот ответил:
              «Да я же робот !» .

                     Видео первого разговора космического робота с японским астронавтом
>>>

                                           Видео первого послания робота на Землю >>>


                     Честь России на этой выставке с большим успехом спасала единственная
                  фирма - Центр речевых технологий из Санкт-Петербурга, которую на выставке
                  представлял ее филиал
Speech Pro.   У  ее  стенда  -   специалист  из  Малазии:

                  Петербургский Центр речевых технологий «научил» машину говорить
                  по-русски с хорошей ясной дикцией и добился при обращении к машине
                  устранения окружающего  шума, который мог бы затруднить машине
                  понимания того, что хочет сказать ей человек.
                  Кроме того,  разработки этой фирмы позволяют воспроизводить речь машины
                  как в ускоренном, так и замедленном темпе без ее искажения. Эта фирма
                  добилась также возможности  быстрого поиска информации  в большом
                  объеме  уже записанной речи, автоматического превращения текста в речь
                  или речи в текст. То есть при использовании их системы можно «увидеть»
                  речь в уже записанном виде и при том в реальном времени ее произношения.

                  Представители этой петербургской фирмы сообщили, что они выставляются
                  не только в Нью-Йорке,  но  и на других соответствующих выставках Европы -
                  самой  большой  из них  -  на  ганноверской.
                  Видео и информацию о Центре речевых технологий в Петербурге можно
                  посмотреть и прослушать
  отсюда.

                  Несмотря на большие успехи этой фирмы, все же российским специалистам
                  нужно еще очень много сделать. Например, большая секция русского перевода
                  в штаб-квартире ООН в Нью-Йорке и другие секции русского перевода
                  в других отделениях ООН в различных центрах мира не могут пока использовать
                  программы перевода голосом на русский язык с других языков   ввиду
                  неудовлетворительной работы этих программ.
                  В этом русские секции перевода в системе ООН  отличаются  от  всех  других
                  аналогичных  секций в ООН – английской, французской, испанской  и 
                  даже  китайской.  Все другие секции с успехом наговаривают на своих языках
                  тексты прямо на  компьютер.  Русским же  переводчикам  приходится
                  значительно медленнее делать это от руки, то есть письменно, теряя на это
                  много времени, что замедляет  подготовку для ООН важных  и срочных
                  документов.  Это продолжается уже много лет. 
                  И это еще раз  -  на печальном примере русских переводчиков в ООН
                  (и не только их)  показывает,   какое   большое   увеличение
                  производительности труда могут дать новые речевые технологии,
                  которые стремительно улучшаются и позволяют выполнять
                  также и такую сложную работу как перевод на самые различные
                  и очень специализированные темы – выполнять эту работу
                  значительно   быстрее  и  притом  более  качественно.

                  Это также подтверждает известную истину о том, как важно посещать
                  выставки, чтобы знакомиться с достижениями других стран и не
                  «изобретать заново велосипеды».

                  Речевые технологии развиваются стремительно и на следующих выставках
                  будут показаны новые достижения в этой области. Уже в этом году, например,
                  появилась виртуальная помощница «
SpeakToIt». Она может «поселиться» в Вашем
                  мобильном телефоне и отвечать на Ваши различные вопросы по-английски,
                  русски, китайски, японски, корейски, французски и португальски.
                  К концу этого года она освоит еще ряд языков. Она сообщает Вам информацию
                  не только устно, но и одновременно переводит ее для Вашего  удобства в текст
                  на экране Вашего мобильного телефона или планшетника.
                  Как она работает  можно  посмотреть  на  этом
 видео >>>

                 
На этом видео можно посмотреть и послушать разговор водителя со своим
                  автомобилем
>>>

                   В США и мире пройдет много конференций и выставок речевых технологий,
                   наиболее интересные из них:
                 
                 
14 - 15 августа 2014 г. в Праге -  межддународная конференция по диалогу
                                                                            межу человеком и компьютером.

                  18 - 20 августа в Нью-Йорке в гостинице Marriott Marquis – очередная выставка
                                                                                              и конференция речевых технологий.
                  05 – 09 октября в Сербии - Новом Саде – 16ая Международная конференция
                               и выставка по компьютерной речи -  
International Conference on Speech
                              
and Computer SPECOM 2014.
                  21 - 24 января 2015 года в Лондоне пройдет кконференция по самообучающимся
                                                          системам, способным к речевому общению с человеком.
 
                                                    М. Голубничий, Нью-Йорк – фото автора

                                                    Перейти на сайт журнала «DISCOVERY» >>>