Алгоритмы распознавания казахского слова как целого


НазваниеАлгоритмы распознавания казахского слова как целого
страница4/12
Дата публикации01.10.2013
Размер1.01 Mb.
ТипДокументы
1   2   3   4   5   6   7   8   9   ...   12
^ СПИСОК ЛИТЕРАТУРЫ


1. Засыпкин А.В., Мицевич А.Т., Овецкий М.В., Шелепов В.Ю. О дикторонезависимой системе голосового телефонного номеронабирателя // Труды международной конференции “Знание-Диалог-Решение”.-Ялта.-1995.-С. 427-430.

2. Винцюк Т.К. Анализ, распознавание и интерпретация речевых сигналов. - Киев: Наукова думка. - 1987. - 262 с.

3. Шелепов В.Ю., Ниценко А.В.Структурная классификация слов русского языка. Новые алгоритмы сегментации речевого сигнала и распознавания некоторых классов фонем // Искусственный интеллект. – 2007. - №1. – С. 213-224.
Қазақ сөздерін бүтіндей тану. Қазақ тілі сөздерін құрылымдық сараптау

Мақалада DTW алгоритмі бойынша сөйлеу сигналдарын алдын ала өңдеу және сөздерді эталондар арқылы тану үшін белгілер жүйесін тұрғызу қарастырылған. Кодтық кітапты құру және баспалдақты тану қарастырылған. Қазақ тілі сөздерін құрылымдық сараптау көрсетілген.

^ The recognition algorithms of the isolated words of Kazakh language. Structural classification of the Kazakh words

In the paper a preprocessing algorithm of the speech signal were discussed, as well as the design of the set of features for the recognition of words using the DTW algorithm. Also we exploit the technique for building the codebook and the algorithm of hierarchical recognition. Finally, the structural classification of the Kazakh words is presented.

^ РУСТАМОВ Н.Т., ТЕМИРБЕКОВ А.Н., ТУРЕЖАНОВ С. К., КАНТУРЕЕВА М.А.

Интеллектуальная информационная система NS

(Евразийский национальный университет им. Л.Н. Гумилева, г. Астана)

В данной работе рассматриваются вопросы создания интеллектуальной информационной системы, основанной на продукционной базе знаний. Приводятся некоторые операции над знаниями и решение прикладной задачи в области медицинской диагностики.

На сегодняшний день от информационных технологий требуется нечто большее, чем быть оргтехникой и средством связи. Возникает желание найти новые способы эффективного решения возникающих проблем. Для этого есть пока одно направление-интеллектуализация информационных технологий. Весь спектр типов задач, решаемых с помощью информационных технологий лежит в пределах от структурированных задач до неструктурированных. Большую группу в этой совокупности составляют слабо структурированные задачи, решение которых связано с определением количественных и качественных переменных. Данное обстоятельство привело к необходимости создания программных средств, основанных как на традиционных методах алгоритмической обработки данных, так и на методах создания и использования баз знаний [1]. Такими АС (автоматизированная система) являются экспертные системы (ЭС) и алгоритм поддержки принятия решений (АППР). Основу ЭС составляет база знаний, хранящая множество фактов и набор правил, полученных от экспертов и из специальных исследований. База знаний отличается от базы данных тем, что если в базе данных единицы информации представляют собой интерпретированные в определенном контексте сведения, то в базе знаний те же элементы уже связаны как между собой, так и с понятиями внешнего мира, определенными соотношениями и сами содержат в себе эти отношения, т.е. интерпретированы в информационном контексте [2].

Целью работы является создание интеллектуальной информационной системы (ИИС), выполняющей функцию ЭС и АППР. АППР призваны помочь человеку в решении стоящей перед ним проблемы, а ЭС–заменить человека при решении проблемы.

^ Метод решения. Допустим, что, создаваемую ИИС обозначим как NS. Прежде чем описать ход создания NS, приведем те алгоритмы, на которых основана работа NS.

Алгоритм представления знаний.

1.На первом шаге алгоритм с помощью операции Qj1, …, Qjq(j), находит Вj1, . . ., Вjuj из набора данных (р) {1; 2;…}, где р – имя набора (введем обозначение = {1; 2;…}), характеризующий те свойства ПО Sj, которые составляют существенные стороны этого ПО. С помощью этих сторон мы можем определить, что это то ПО.

2. На этом шаге алгоритм, с помощью операции Qj1, …, Qjq(j), находит из набора данных (р) , , характеризующие те свойства Sj, с помощью которых, если они являются информационными носителями, определяющие импликативные отношения со свойствами Вj1, . . ., Вjuj .

3. После нахождения Вj1, . . ., Вjuj и алгоритм производит семантическое описание Sj с помощью ЯПЗ NS

: где; (1) Формулу (1) можно написать в виде таблицы [3]. Здесь верхний индекс формулы показывает номер класса, нижний индекс номер знаний, содержащий (Вj1, . . ., Вjuj) и (). Индексы фиксируют номера (Вj1, . . ., Вjuj) соответствующие классу 1, l, j. Индекс фиксирует номера (Вj1, . . ., Вjuj) соответствующие ., причинно-следственно связанные с(Вj1, . . ., Вjuj), иеj – информационная единица где интерпретируются () или и . Ядро этой продукции будет << атомарным >> знанием. А набор формул {}–семантическим описанием SJ в виде продукционных знаний.

Таким образом, языком представления продукционных знаний (ЯПЗ) будет следующее выражения [4]:

(i) Q; P; AB; N (2)

С помощью формулы (2) , при заданной иеj можно создать продук-ционную БЗ[3].

Алгоритм поддержки принятия решений (АППР).

1. Определяется семантическая метрика в виде функции релевантносты для двух допустимых продукционных знаний (ПЗ) {}, {}, т.е двух классов знаний (KJ (SJ)) и (KJ (SJ)).

(3)

Если , то алгоритм вычисляет , т.е. релевантность по .

(4)

На этом этапе определяется релевантность информационных объектов и . Понятно, что в этом случае и сравнивается с точки зрения информационной единицы иеj. представленной в виде продукционных базы знаний.

2. На этом этапе вычисляется функция

(5)

- важность формулы (); мощность множества

важность .

На этом этапе вычисляется число голосов, поданных за класс обьектом

: (6)

Таким образом, на этом алгоритм строит числовую матрицу:

, (7)

где -вес u-го Вjuj в j - ом классе.

3. С помощью правила вывода (решающее правило) переходим к информационной матрице:

(8)

являющейся знанием о вхождении в класс , , где символы 1,0,1 кодируются соответственно в факты: , , неизвестно, принадлежит к или нет.

Примем поддержку принятия решений в следующем простом виде: среди элементов находим максимальный элемент , тогда в строке элемент равен 1, остальные – 0. Если среди нет максимального элемента, то и строка состоит . Когда в строке встречается , это говорит что в не существует знания принадлежащей описанию . При таком случае присоединяется к отмечается появление в БЗ нового знания.

На базе этих алгоритмов спроектирован ИИС NS, и ее общая блок схема показана на рис.1:
Предметная область

База знаний



ЯПЗ

(i) Q; P; AB; N

ЯУЗ

NS-язык

Пользователи

Создание инфор-мационного пред-ставления ПО (р) {1; 2;…}
База данных

= {1; 2;…},

^ Рис.1. Общая блок схема ИИС NS

Таким образом, в ИИС NS предусмотрены следующие операторы обработки знаний [5], подсистема приобретения знаний; база знаний; машина вывода; интерфейс пользователя; подсистема объяснения; подсистема совершенствования вывода и “очищения” знаний и т.д. На рис. 2 показаны основные интерфейсы ИИС NS:



^ Рис. 2. Основные интерфейсы ИИС NS

С помощью ИИС NS решена практическая задача, связанная с клиническим прогнозированием морфологических и морфометрических изменений сосудов головного мозга при инсульте. Постановку задачи и первичные материалы предоставили сотрудники кафедры «Патологическая анатомия» Ташкентской Медицинской Академии (зав.каф. д.м.н., проф. Исраилов Р.И.), После анализа этих материалов, был сделан к вывод, что причиной мозгового инсульта является сужение и разрыв сосудов мозга. Причиной мозгового инсульта также может быть атеросклероз, гипертоническая болезнь, аневризма и др., [6]. Для решения поставленной задачи мы построили информационную модель мозгового инсульта. Для этого мозговой инсульт представили как информационную совокупность, характеризующуюся набором свойств . Далее это совокупность состоит из нескольких информационных сущностей, образующих эту совокупность, и в свою очередь имеющие соответствующие наборы свойств (атрибутов). Из динамичности процесса следует, что именно набор свойств информационных сущностей порождает набор свойств информационной совокупности, т.е. мозгового инсульта. Для представления информационной модели мы воспользовались семантикой, предложенной в работе [7].

При этом, сущности классифицировались следующим образом. Стержневые сущности (семантика- ), характеризующие сущности (семантика - ), обозначающиеся сущности (семантика- ), и ассоциативные сущности (семантика- ). Естественно, эти энергоинформационные сущности имеют соответствующие атрибуты (семантика- ), характеризующие свойства этих сущностей.

В нашем случае мозговой инсульт, как ПО будет множеством Х. Мы должны производит семантическую обработку информацию о Х и определить, какие именно характеризующие информационные сущности существенно влияют для порождению носителя информации . Для этого опишем процесс появления мозгового инсульта, как образования информационной совокупности из информационных сущностей(рис. 2):


Мозговой инсульт

Х



Обтурация или разрыв сосуда







Гипертоническая

болезнь



Х1



атеросклероз

Х3




Х2




васкулит

Рис.2. Информационная модель образования мозгового инсульта

- мозговой инсульт; - гипертония; - воспаления; - липидные бляшки; - изменения морфометрии сосудов, здесь

, , ,

.

Из рис.2 видно, что информация о мозговом инсульте образуется с помощью трех носителей информации , , . т.е. .

На базе в ИИС NS проектирована продукционная БЗ:


Продукционная БЗ

B

тип

ИЕ

Значения

кол

обш_кол

частота

Важность

B2

ЖГ

A1

a11

10

16

0,625

0,4

B2

ЖГ

a1

a12

5

16

0,3125

0,4

B2

ЖГ

a1

a14

1

16

0,0625

0,4

B2

ЖГ

a2

a21

1

16

0,0625

0,1

B2

ЖГ

a2

a22

9

16

0,5625

0,1

B2

ЖГ

a2

a23

3

16

0,1875

0,1

B2

ЖГ

a2

a24

2

16

0,125

0,1

B2

ЖГ

a2

a25

1

16

0,0625

0,1

B2

ЖГ

a3

a32

2

16

0,125

0,2

B2

ЖГ

a3

a33

4

16

0,25

0,2

B2

ЖГ

a3

a34

10

16

0,625

0,2

B2

ЖГ

a4

--

4

16

0,25

0,2

B2

ЖГ

a4

a41

1

16

0,0625

0,2

B2

ЖГ

a4

a42

5

16

0,3125

0,2

B2

ЖГ

a4

a43

6

16

0,375

0,2

B2

ЖГ

a5

a53

15

16

0,9375

0,3

B2

ЖГ

a5

a54

1

16

0,0625

0,3
1   2   3   4   5   6   7   8   9   ...   12

Похожие рефераты:

Алгоритмы распознавания казахского слова как целого
Об оптимальной абсолютно линейной дискретизации решений волнового уравнения с начальными условиями из классов Соболева
С. К. Коваленко о методике дифференцированных функциональных состояний...
Метод качественных структур, изложенный в [1], как способ рассмотрения целого, предполагает возможность исследования трех различных...
Учебное пособие для студентов
Образов по цветовому описанию, геометрическим параметрам, а также по принятию решений в интеллектуальных системах. Теоретические...
Процедуры распознавания зависят от понятия расстояния между двумя...
Методы классификации распознавания образов, использующие евклидовы пространства описаний
Процедуры распознавания зависят от понятия расстояния между двумя...
Методы классификации распознавания образов, использующие евклидовы пространства описаний
Создан первый в мире мультимедийный самоучитель казахского языка
«M. A. R. I. D. I» ведущий европейский производитель профессиональных it–решений для ускоренного изучения иностранных языков презентовала...
Сарсен аманжолов основоположник казахского языкознания
В XIX веке большую роль в создании казахского литературного языка сыграли Абай и Алтынсарин. У истоков казахского языкознания стоял...
Учебное пособие для студентов специальностей н. 02. 02 «Радиофизика»
Учебное пособие предназначено для студентов и аспирантов факультета радиофизики и электроники, включает принципы организации и алгоритмы...
Гу «Средняя общеобразовательная школа №5 г. Павлодара»
Как вы понимаете слова Н. Заболоцкого? Как вы думаете, почему именно эти слова я взяла в качестве эпиграфа нашего занятия?
Ш. Уалиханов – великий ученый и просветиель казахского народа
Цель урока: а образовательная: на основе дополнительного материала раскрыть роль Ш. Ш. Уалиханова как ученого, просветителя в истории...

Вы можете разместить ссылку на наш сайт:
Школьные материалы


При копировании материала укажите ссылку © 2013
контакты
referatdb.ru
referatdb.ru
Рефераты ДатаБаза