Алгоритмы распознавания казахского слова как целого


НазваниеАлгоритмы распознавания казахского слова как целого
страница8/12
Дата публикации01.10.2013
Размер1.01 Mb.
ТипДокументы
1   ...   4   5   6   7   8   9   10   11   12

^ 1-сурет. Шешімдер қабылдаудың схемотехникалық моделі (көптік жалғаулар)

Өздеріңіз байқағандай, бұл схемада дыбыстарды классификациялау қарастырылмаған. Ол өзінше бір бөлек есеп болып табылады, және басқадай схема арқылы жүзеге асырылуы мүмкін. Сондықтан біз бұл жерде схеманың, мысалы, «а» дыбысының жуан дауысты екендігін қалай анықтайтыны жөнінде бас қатырмаймыз. Бұл жердегі басты мәселе – сөзге көптік жалғауды жалғау барысында шешім қабылдау.

Сонымен біз жасанды зердеге «бала» сөзін енгізейік. Ол өзіне ғана белгілі қандай да бір жолмен сөздің соңындағы «а» әрпінің жуан дауысты дыбыс екендігін анықтады. Соның әсерінен біздің схемамыздың кірісіне 101000000 (, - 1, қалғандары - 0) коды берілді. Қарапайым схеманың жұмысы нәтижесінде «ана» сөзіне «-лар» жалғауы жалғанатынына көз жеткіздік. Енді жасанды зердеге «кітап» сөзін енгізіп көрейік. Алғашқыдағыдай емес, бұл есеп күрделірек. Себебі бұл жерде соңғы дыбыс дауыссыз, яғни, оның ұяң немесе қатаңдығын анықтағаннан бөлек, соңғы буынның жуан-жіңішкесін анықтауымыз қажет. Бұл жағдайда да жасанды зерде бізге беймәлім жолмен дыбыстарды жіктеп берді: «п» - қатаң дауыссыз дыбыс, соңғы буындағы «а» дауысты дыбысы – жуан. Демек, біздің схемамызға 010010010 коды беріледі. Берілген деректердің нәтижесінде «кітап» сөзіне «-тар» жалғауы жалғансын деген шешім қабылданады.

Енді септік жалғауларын қарастырайық. Септік жалғауларына байланысты ереже келесі кестеде көрсетілген:

1-кесте

Септік жалғауларының жалғану ережесіСоңғы дыбыс

Септік жалғаулары

ілік

барыс

табыс

жатыс

шығыс

көмектес

Дауысты

жуан а,о,ұ,ы


ның

ға


ны


да


дан


мен

менен

Жіңішке ә,ө,ү,і,е


нің

ге

ні

де

ден

мен

менен

қатаң

с.б.жн.

тың

қа


ты


та


тан


пен

пенен

с.б.же.

тің

ке

ті

те

тен

пен

пенен

үнді1

м,н,ң

с.б.жн.

ның

ға


ды


да


нан


мен

менен

с.б.же.

нің

ге

ді

де

нен

мен

менен

үнді2

р,у,й,л

с.б.жн.

дың

ға


ды


да


дан


мен

менен

с.б.же.

дің

ге

ді

де

ден

мен

менен

ұяң 1

б,г,ғ,д

с.б.жн.

тың

қа


ты


та


тан


пен

пенен

с.б.же.

тің

ке

ті

те

тен

пен

пенен

ұяң 2

ж,з

с.б.жн.

дың

ға


ды


да


дан


бен

бенен

с.б.же.

дің

ге

ді

де

ден

бен

бененТүсіндірме:

с.б.жн – түбір сөздің соңғы буыны жуан,

с.б.же – түбір сөздің соңғы буыны жіңішке.
Ереже бойынша, бізде келесідей параметрлер болады:
– дауысты дыбыстар;

– дауыссыз дыбыстар;

– жуан дауыстылар;

– жіңішке дауыстылар;

– қатаң дауыссыздар;

– ұяң дауыссыздар (б, г, ғ, д);

– ұяң дауыссыздар (ж, з);

– үнді дауыссыздар (м, н, ң);

– үнді дауыссыздар (р, у, й, л);

– түбір сөздің соңғы буыны жуан;

– түбір сөздің соңғы буыны жіңішке;

– ілік септік;

– барыс септік;

– табыс септік;

– жатыс септік;

– шығыс септік;

– көмектес септік;

– қабылданатын шешімдер.
Бұл кезде біздің жүйеміз келесі түрде болады:


 1. «ның»;

 2. «ға»;

 3. «ны»;

 4. «да»;

 5. «дан»;

 6. «мен, менен»;

 7. «нің»;

 8. «ге»;

 9. «ні»;

 10. «де»;

 11. «ден»;

 12. «тың»;

 13. «қа»;

 14. «ты»;

 15. «та»;

 16. «тан»;

 17. «пен, пенен»;

 18. «тің»;

 19. «ке»;

 20. «ті»;

 21. «те»;

 22. «тен»;

безымянный1

.

2-сурет. Шешімдер қабылдаудың схемотехникалық моделі (септік жалғаулар)

 1. «ды»;

 2. «нан»;

 3. «ді»;

 4. «нен»;

 5. «дың»;

 6. «дің»;

 7. «бен, бенен»;


Кіріс және шығыс нүктелерінің саны көп болуына байланысты бұл жүйенің схемотехникалық моделі көптік жалғау жүйесінің схемотехникалық орындалуына қарағанда әлдеқайда күрделі (2-сурет).

Осыған ұқсас принциптерді ұстана отырып, тәуелдік, жіктік жалғауларын жалғаудың схемотехникалық үлгісін жасауға болады. Бір ғана айырмашылығы, көптік және септік жалғауларына байланысты жалпы параметрлерден бөлек «жақ» (І, ІІ, ІІІ жақ) параметрі пайда болады. Сонымен қоса, тәуелдік жалғаударды жалғаған кезде түбірдің соңындағы кейбір әріптердің өзгеретінін (мысалы, «п» әрпі «б» әрпіне, «к» әрпі «г» әрпіне, «қ» әрпі «ғ» әрпіне өзгереді) ескерген жөн.

Осындай құрылған схемотехникалық моделдер қазақ тілінің сөздерін талдау мен құруды автоматтандыру аппаратты (программалық емес) түрде жүзеге асыруға мүмкіндік беретін арнаулы микропроцессор жасап шығаруға жол ашады. Оны қазақ тілін оқыту, қазақ тілінде іс жүргізу, қазақ тіліндегі ақпараттардың орфографиясын, морфологиясын және синтаксисін тексеру мүмкіндігі бар қазақ тілінде қарым–қатынас жасайтын зерделік ақпараттық технологиялар мен жүйелерді дайындауда және телекоммуникациялық жүйелерде қазақ тіліндегі ақпаратты дұрыс қабылдау, беру мен өңдеуде қолдануға болады.

^ ПАЙДАЛАНҒАН ӘДЕБИЕТТЕР

 1. Барский А.Б. Логические нейронные сети. - М.: Интернет-Университет Информационных технологий; БИНОМ. Лаборатория знаний , 2007.-352 с.


^ Схемотехническое моделирование принятия решений при добавлении окончаний в казахском языке

Бурибаева А.К., Шарипбаев А.А.

В этой работе составлена математическая модель правил окончаний казахского языка, и на ее основе реализована схемотехническая модель.

The circuit modeling of decision making at addition of ending in Kazakh

Buribayeva A.K., Sharipbayev A.A.

This work examines mathematical model of guidance Kazakh and in terms of realized circuit model
Редакцияға 12.01.10. қабылданды

Басылымға 29.01.10. жебірілді

^ РУСТАМОВ Н.Т., КАНТУРЕЕВА М.А.

Структуризация продукционных модели знаний

(Евразийский национальный университет им. Л.Н. Гумилева, г. Астана)

В данной работе предлагается продукционный метод структуризации знаний. Приводится формализация такого подхода, с целью теоретического обоснования предложенной концепции.

Компьютерный мир проходит мучительный процесс эволюционного переход от вычислительных систем в их, если так можно выразиться, «чистом виде» через системы обработки данных, далее к системам управления информацией и знанием. Мучительность этого процесса состоит в том, что на каждом из его этапов усложняются не только средства, но и предмет обработки – причем и предмет, и средства управления информацией и знанием далеки от полноценного определения.

Когда появились первые компьютеры, они использовались непосредственно, отвечая своему названию – как средство автоматизации расчетов. Вплоть до 70–х годов прошлого века применение компьютеров ограничивалось решением математических задач, поэтому достаточно было представлять данные в виде массивов чисел, что не представляло особого труда. Затем, необходимость оперирования данными с более сложной структурой привела к появлению систем управления базами данных; этот этап начался в 70-е годы прошлого века и протянулся до современности. На первых двух этапах участие человека ограничивалось подготовкой данных и анализом конечных результатов [1].

Особенности третьего этапа связаны прежде всего, появлением фундаментальных отличий трех «соседствующих» понятий – данных, являющихся продуктом, потребляемой машиной, информации и знания, продуктом, который потребляет человек. Эти различия пока еще не вполне осознаны. Поэтому и появляются на свет отдельные, чаще паллиативные решения, которые в каком–то смысле этого слова являются информационными системами. Далее, интеллектуализация этих систем породила задачу структуризации знаний. В данной работе сделана попытка решить эту задачу с помощью понятий «продукция».

^ Метод решения. В общем виде под продукцией понимается выражение следующего вида [2].

(i) Q; P; AB; N (1)

здесь і - имя продукции, с помощью которого данная продукция выделяется из всего множества продукций. В качестве имени может выступать некоторая лексема, отражающая суть данной продукции (например, “покупка книги” или “набор вида замка”), и порядковый номер продукции в их множестве, хранящемся в памяти системы.

Элемент Q характеризует сферу применения продукции, т.е. контекст где интерпретируется информация . Такие сферы легко выделяются в когнитивных структурах человека. Наши знания как бы “разложены по палочкам”. На одной “палочке” хранятся знания о том, как надо готовить пищу, на другой – как добраться до работы и т.п.

Основным элементом продукции является ее ядро - носитель знания: AB. Интерпретация ядра продукции может быть различной и зависит от того, что стоит слева и справа от знака секвенции . Обычное прочтение ядра продукции выглядит так: ЕСЛИ А, ТО В, более сложные конструкции ядра допускают в правой части альтернативный выбор, например, ЕСЛИ А, ТО В1, ИНАЧЕ В2. Секвенция может истолковываться в обычном логическом смысле как знак логического следования В на истинного А (если А не является истинным выражением, то о В ничего сказать нельзя). Возможны и другие интерпретации ядра продукции, например А описывает некоторые условия, необходимое для того, чтобы можно было совершить действие В. Элемент Р есть условие применимости ядра продукции. Обычно Р представляет собой логическое выражение (как правило предикат). Когда Р принимает значение “истина”, ядро продукции активизируется. Если Р ложно, то ядро продукции не может быть использовано. Например, если в продукции “НАЛИЧИЕ ДЕНЕГ”; “ЕСЛИ ХОЧЕШЬ КУПИТЬ Х, ТО ЗАПЛАТИ В КАССУ ЕЕ СТОИМОСТЬ И ОТДАЙ ЧЕК ПРОДАВЦУ” условия применимости ядра продукции ложно, т.е. денег нет, то применить ядро продукции невозможны. Элемент N описывает постусловие продукции. Они актуализируются только в том случае, если ядро продукции реализовалось. Постусловия продукции описывают действия и процедуры, которые необходимо выполнить после реализации В. Например, после покупки некоторой вещи в магазине необходимо в описи товаров, имеющихся в этом магазине, уменьшить количество вещей такого типа на единицу. Выполнение N может происходить не сразу после реализации ядра продукции.

При этом информация должна быть семантической. Надо сразу отметить, что традиционная (шенноновская) теория информации, являющейся частью теории связи изучает методы кодирования сообщений различных источников и проблемы надежной передачи сообщений по каналам связи с шумом. Сама семантика сообщений здесь остается в стороне и, следовательно, семантическая информация не является предметом этой теории. Понятие семантической информации, семантика знаний отсутствует и в традиционной (виннеровской) кибернетике. Это связано с тем, что в кибернетике в ситуациях, когда каждый из исследуемых точек множества характеризуется (если смотреть эту точку в информационном пространстве) большим числом разнотипных взаимосвязанных свойств, тогда определить знание об этой точке требует более глубокого (в диалектическом смысле) изучиния свойства и идентификации его семантического указателя. Актуальность этой проблемы обусловлена как необходимостью решения задачи, определения семантики свойств точки, так и связанные с созданием базы знаний. Для информационных систем работающих семантическими информациями, само создание базы знаний тесно связано с представлением знаний для обработки, хранения и передачи.

Всякий объект обладает определенными свойствами, проявляющимися при отражении с другими объектами. Всякое свойство объекта проявляется в рамках того или иного контекста [3]. Как уже отмечалось, всякое сведение должно иметь указатель (имя) объекта, о котором сообщается в данном сведении. Обозначим через тот объект, который указан в сведении. Тогда является элементом как опорного множества , так и подмножества , т.е. . В случае табличном представлении будет выражать строку таблицы.

Все вышесказанное схематически можно представить следующим образом:

ТаблицаИнформация в контексте x0


Информация в контексте ,
1   ...   4   5   6   7   8   9   10   11   12

Похожие рефераты:

Алгоритмы распознавания казахского слова как целого
Об оптимальной абсолютно линейной дискретизации решений волнового уравнения с начальными условиями из классов Соболева
С. К. Коваленко о методике дифференцированных функциональных состояний...
Метод качественных структур, изложенный в [1], как способ рассмотрения целого, предполагает возможность исследования трех различных...
Учебное пособие для студентов
Образов по цветовому описанию, геометрическим параметрам, а также по принятию решений в интеллектуальных системах. Теоретические...
Процедуры распознавания зависят от понятия расстояния между двумя...
Методы классификации распознавания образов, использующие евклидовы пространства описаний
Процедуры распознавания зависят от понятия расстояния между двумя...
Методы классификации распознавания образов, использующие евклидовы пространства описаний
Создан первый в мире мультимедийный самоучитель казахского языка
«M. A. R. I. D. I» ведущий европейский производитель профессиональных it–решений для ускоренного изучения иностранных языков презентовала...
Сарсен аманжолов основоположник казахского языкознания
В XIX веке большую роль в создании казахского литературного языка сыграли Абай и Алтынсарин. У истоков казахского языкознания стоял...
Учебное пособие для студентов специальностей н. 02. 02 «Радиофизика»
Учебное пособие предназначено для студентов и аспирантов факультета радиофизики и электроники, включает принципы организации и алгоритмы...
Гу «Средняя общеобразовательная школа №5 г. Павлодара»
Как вы понимаете слова Н. Заболоцкого? Как вы думаете, почему именно эти слова я взяла в качестве эпиграфа нашего занятия?
Ш. Уалиханов – великий ученый и просветиель казахского народа
Цель урока: а образовательная: на основе дополнительного материала раскрыть роль Ш. Ш. Уалиханова как ученого, просветителя в истории...

Вы можете разместить ссылку на наш сайт:
Школьные материалы


При копировании материала укажите ссылку © 2013
контакты
referatdb.ru
referatdb.ru
Рефераты ДатаБаза