2009 - يىلى 3 - ئاينىڭ 22 - كۈنى ئۇيغۇر
تىلى مورفولوگىيىلىك ئانالىز سىستېمىسى MeCab-uyghur نىڭ كۆرۈنمە يۈز
قىسىمغا تىل تاللاش ئىقتىدارى قوشۇلدى. قاچىلاشتىن بۇرۇن، كونا
نۇسخىسىنى چىقىرىۋېتىپ قايتىدىن قاچىلاپ ئىشلىتىڭ.2010-يىلى 5-ئايدا
2.0نۇسخىسى ئىلان قىلىندى.
MeCab-uyghur2.0 نى چۈشۈرۈش
(
2010-يىلى 6-ئاينىڭ 3-كۈنىدىن باشلاپ
قېتىم )
2009 - يىلى 3 - ئاينىڭ 19 - كۈنى ئۇيغۇر تىلى مورفولوگىيىلىك
ئانالىز سىستېمىسى MeCab-uyghur كۆرۈنمە يۈزلۈك قىلىپ ئۆزگەرتىلدى.
ئىشلىتىپ كۆرۈڭ.
MeCab-uyghur2.0 نى چۈشۈرۈش
2008 - يىلى 11 - ئاينىڭ 7 - كۈنى uyghur_dic غا بىر قىسىم
ئۆزگەرتىش كىرگۈزۈلۈش ئارقىلىق، نامىنى MeCab-uyghur غا ئۆزگەرتتىم.
شۇنداقلا
سىستېما بىلەن لۇغەتنى بىر گەۋدىلەشتۇردۇم. قاچىلاشمۇ ئاسانلاشتى.
دېققەت قىلىشقا تېگىشلىك ئىشلار
2008 - 10- ئاينىڭ 15- كۇنى بىر قىسىم ئۆزگەرتىشلەر ئېلىپ بېرىلدى.
ئاساسلىقى چىقىرىش فورماتى ئۆزگەرتىلدى. شۇنداقلا لۇغەتتە يوق
سۆزلەرنى Lughette yoq شەكلىدە كۆرسىتىلىدىغان قېلىندى. بۇنىڭدىكى
مەقسەت ئىلگىرىكى نۇسخىسىدىكىدەك لۇغەتتە يوق سۆزلەرنى ئېھتىماللىق
پىرنسىپىي بۇيىچە ئىسىم ياكى باشقا سۆز تۈركۈمىلىرى شەكىلىدە
چىقىرىلىدىغان
قىلىنسا، ئىشلەتكۈچىنىڭ بۇنداق سۆزلەرنى ئايرىپ چىقارمىقى تەسكە
توختايتتى. بۇ قېتىمقى نۇسخىسىدا بۇنداق سۆزلەرنىڭ ئىچىدىكى ئۇيغۇر
كونا يېزىققا
تەۋە ھەرىپلەر قاتارى يەنى سۆزلەرنى Lughette yoq شەكلىدە
چىقىرىلىدىغان قىلىندى. لاتىن يېزىقنى بوش ئورۇننى بىرلىك قىلىپ شۈ
پېتى چىقىرىلىپ،
ئۇنىڭغا "ئىسىم - خاس ئىسىم - ئادەتتىكى "دېگەن تەۋەلىك بېرىلىدىغان
قىلىندى.يەنى "bilik تورى بىلەن bilqut تورى تەمىنلىگەن. " دېگەن
جۈملىنى
ئانالىز قىلىپ باقساق، تۆۋەندىكىدەك نەتىجىگە ئېرىشمىز.

بۇ جۈملىدىكى لاتىن ھەرىپلىرى بىلەن يېزىلغان سۆزلەر لۇغەتتە يوق.
بۇنداق سۆزلەرگە قارىتا ئانالىز ئېلىپ بارمايدۇ.ئانالىز ئېلىپ بېرىلغان
تېكىستتىكى
Lughette yoq دېگەن سۆزلەرنى ئىزدىسىڭىزلا uyghur_dic كىرگۈزۈلمىگەن
كونا يېزىقتا يېزىلغان سۆزلەرنى ۋە ئىملاسى خاتا سۆزلەرنى تاپقىلى
بولىدۇ. بىراق ھەممىسى
توغرا بولۇشى ناتايىن. ھازىر ياخشىلاش ئۈستىدە ئىزدىنىۋاتىمەن.
MeCab-uyghur بولسا، ئۇيغۇر تىلى مورفولوگىيىلىك ئانالىز سىستېمىنىڭ
نامىدۇر. ئەسلى بۇ سىستېمىنىڭ ئاساسىي قىسىمنى ياپونىيە كىيوتو
ئۇنىۋېرسىتېتى
يېتەكچىلىكىدىكى تەتقىقات گۇرۇپپىسىدىن كۇدو ئەپەندىم تۈزگەن.
پروگراممامنىڭ كودى ئۇچۇق. پروگرامما بىلەن لۇغەت ئايرىم – ئايرىم بىر
بىرىگە تايانماسلىقتەك ئەۋزەللىككە ئىگە. شۇڭا خالىغان تىلىنىڭ
ئالاھىدىلىككە ماسلاشتۇرۇپ تەڭشەش ئارقىلىق، شۇ تىلنىڭ لۇغىتىنى
قوشۇشقا بولىدۇ. مەنمۇ ئۇيغۇرچىغا ئائىت يەرلىرىنى ئازراق توزۇپ،
ئۇيغۇرچە لۇغەتنى قوشتۇم. شۇنداقلا كۈدو ئەپەندىمنىڭ ماقۇللۇقى بىلەن
MeCab-uyghur دېگەن نامدا ئېلان قىلدىم.
ئۇيغۇرچە لۇغىتىگە ئۇيغۇر تىلىدىكى تۈپ سۆزلەرنى ئاساس قىلىپ، بىر
قىسىم ياسالما سۆزلەر كىرگۈزۈلدى. بۇ سىستېمىدا، ھازىر ئۇيغۇر تىلى
ئۇچۇر بىر تەرەپ قىلىشتا ئاساسىي ئېقىم سۈپىتىدە قوللىنىۋاتقان بوش
ئورۇن بىرلىك قىلىنمىدى. يەنى ". ، ؟ ! " بەلگىسىنى بىرلىك قىلىپ،
تېكىستنى سۆزگە ئايرىپ سۆز تۈركۈملىرى بەلگىسى قويۇپ بېرىدۇ. شۇڭا "
ئاتا – ئانا "، " ئۇيغۇر ئېدىت"، " شىنجاڭ ئۇيغۇر ئاپتونوم رايونى "
دېگەنگە ئوخشاش سۆزلەرنى بىر سۆز قىلىپ بىر تەرەپ قىلىشقا بولىدۇ.
ئەنئەنىۋى ئۇيغۈر تىلى تىلشۇناسلىقتا سۆزنىڭ ئايرىلىش چېگرىسى ھەققىدە
تەتقىقاتلار ئاز بولغانلىقتىن ۋە ئۇچۇر ئىلمى ساھەسىدە سۆزنىڭ بىرلىكى
ھەققىدە ئېنىق بىر بەلگىلىمە بولمىغاچقا، مەن سۆزلەرنى ئۆزۈمنىڭ
ئىزدىنىشلىرى بۇيىچە بۆلۈپ تۇردۇم. كېيىنچە بىرەر بەلگىلىمە چىقسا شۇنى
ئۆلچەم قىلساق بولىدۇ.
بۇ لۇغەت سۆزلۈك قىسىم بىلەن گرامماتىكا قىسىمدىن تۈزۈلگەن. (تەپسىلاتىغا
قىزىقسىزىڭىز " ئۇيغۇر تىلىنىڭ مورفولوگىيىلىك ئانالىز سىستېمىسى
توغرىسىدا " شىنجاڭ ئۇنىۋېرسىتېتى ئىلمي ژۇرنىلى 2006 - يىل 4 – سان ۋە
http://cogsci.l.chiba-u.ac.jp/~hariri/morfologiye.html ياكى
http://www.uyghurdev.net/Web/Forum/FTopicView.aspx?TID=430 دىن
پايدىلىنىڭ.)
سۆزلۈك قىسىمنى ئادەتتىكى لۇغەتلەردىن ئۆزگەرتىشكە بولىدۇ. بىراق
گرامماتىكا قىسىمنى قول بىلەن تۈزۈش تەس بولغاچقا، ئاپتوماتىك ئۆگىتىش
ئۇسۇلى (Machine learning) قوللىنىلدى. بۇ ئۇسۇلدا گرامماتىكىلىق
قانۇنىيەتلەرنى بەلگە سېلىنغان تېكىست ئامبىرىدىن ئۆگىتىلىدۇ. شۇڭا مەن
ئۇزۇن ۋاقىت سەرپ قىلىپ، 70,000 سۆزلۈك بەلگە قويۇلغان ئۇيغۇر تىلى
تېكىست ئامبار قۇرۇپ، مۇشۇ ئارقىلىق گرامماتىكىلىق قانۇنىيەتلەرنى
سىستېمىغا ئۆگىتىش ئېلىپ باردىم. بىراق بۇ سان ئاز . ياپون تىلىدا
2,000,000 سۆزلۈك بەلگە قويۇلغان تېكىست ئامبىرى قوللىنىۋاتىدۇ. شۇڭا
ئۇيغۇرچە ئانالىزجەرياندا نۇقسانلاردىن خالىي بولالماسلىقى مۇمكىن.
بىراق ھازىر مۇشۇنداق بىر سىستېما يوق (مەن بىلمەي قالغان سىسـتېما
بولسا ئەيىبكە بۇيرۇمىغايسىلەر) ئەھۋالدا ئىشلىتىپ تۇرۇشقا بولىدۇ -
دەپ ئويلايمەن. بۇنىڭدىن كېيىنمۇ داۋاملىق ياخشىلىنىدۇ. كۆپرەك تەكلىپ
- پىكىر بەرگەيسىلەر.
بۇ سىناق نۇسخا. ئىشلىتىش سەل ئەپسىزرەك. سىستېما بىر ئاز
مۇكەممەللەشكەندىن كېيىن كۆرۈنمە يۈزلۈك قىلىپ ئۆزگەرتىلىدۇ. ئالدى
بىلەن تۆۋەندىكى
ھۆججەتنى چۈشۈرۈڭ. ئاندىن Uyghur_dic نىڭ ئىچىدىكى
قوللانما بۇيىچە مەشغۇلات ئېلىپ بېرىڭ. سىسـتېمىنى چۈشۈرۈپ،
ئىشلىتىشىدىن بۇرۇن ئانالىز شەكلىنى كۆرۈپ باقىدىغانلار تۆۋەندىكى
ئۈلانمىغا مەرھەمەت.
تۆۋەندە ئىككى خىل ئانالىز شەكلى كۆرسىتىلدى. يەنە باشقا نۇرغۇن
ئىقتىدارى بار. كېيىنچە ئايرىم تونۇشتۇرىمەن.
بىۋاستە چىقىرىش
بىۋاستە چىقىرش ھۆججىتىنىڭ
PDF
تاللاپ چىقىرىش
تاللاپ چىقىرىش ھۆججىتىنىڭ
PDF
ئالاقىلىشىش ئادرېسى : abuduhariri@gmail.com
باش بەت
|