سفارش تبلیغ
صبا ویژن
مدیر وبلاگ
 
آمار واطلاعات
بازدید امروز : 0
بازدید دیروز : 0
کل بازدید : 3202
کل یادداشتها ها : 3
خبر مایه


دستور زبان گراف مولد
برنامه های کاربردی
NLP برای سانسکریت تا کنون در داخل محاسباتی کار می کنند باپارادایم گرامرهای رشته انتزاعی است. با این حال ، برای محاسبه "معانی" ، از همان روش  سنتی  abdabodha prakriy استفاده می شود·بنابراین، نیاز به توسعه مناسب  ساختار وجودی  و اساسی نمودار گرامرهای گراف  وجود دارد.
ما در چارچوب رسمی  هستی شناسی Vai"ses Neo عمل میکنیم و در این راستا از دستور زبان گراف مولد  استفاده می کنیم . هدف از نوشتن مفسر  این ساختار گرافیکی  این است که گرامرهای تولید شده توسط گراف ها به خوبی شکل بگیرند  وبتوانند به آسانی تفسیر کنند.و  باعث بوجود آمدن محیط محاسباتی می شود.

کلمات کلیدی:  دستور زبان گراف ، گرامر مولد است.
1 مقدمه
پردازش زبان طبیعی برای سانسکریت  هایی مانند sandhi  نوشته شده است. نحو زبان محاسباتی با عملیات بر روی گرامرهای رشته مولد به کار گرفته می شوند وساختار غنی تر از نحو زبان را تشکیل می دهند. می توان کلمات وصرف ها را به صورت خطی تبدیل کرد به صورتی که رفتار نمادهای رشته ای قابل دستکاری و تطابق باشند، در حالی که معانی کلمات مربوط به عناصر خارجی از قوائد خطی پیروی می کنند.

به طور معمول ، مشخصات معنای یک جمله،شامل درج اطلاعات مربوط به کلاس ها ، خواص و غیره حوادث در وسط رشته نمادین ظاهر می شوند چنین اطلاعاتی  تشکیل یک گراف می دهند. بنابراین ، در گراف دستور زبان نمادها باید معنی جملات مشخص باشند.ای چنین  گرامرهایی بیاد قابل ارائه برای تعبیه و paraphrasing از نمودار در وسط رشته ها باشند. این دقیقا همان چیزی است که در معانی سانسکریت سنتی انجام می شود. برای تجزیه و تحلیل معنی جملات سانسکریت "¯ abdabodha prakriy · عنوان شده است. در واقع ، هدف ما حل مسا ئل بسیار بزرگ ¯ abdabodha است که در آن  تلاش برای تجزیه و تحلیل معنای یک جمله است.

هدف از ساخت هستی شناسی محاسباتی بر پایه گراف  دستور زبان مولد  طبیعی است که بتواند بطور جامع تفسیر کند، تمرکز اصلی مقاله بر روی ساختمان دستور زبان گراف مناسبی  برای هستی شناسی برنامه های کاربردی است.

1.     محیط محاسباتی
بسیاری از هستی شناسی های  موجود به دنبال یک رویکرد بالا به پایین  هستند که با نام اشخاص (حقیقی و چه به عنوان خیالی) موجود در جهان  شروع می شوند ، و نامها را دسته بندی  میکنند. اما مشکل این روش در زمان فرآیند طبقه بندی صفات می باشد، که می توان با قرار دادن صفات تحت دو کلاس این مسئله را حل نمود که باعث تشکیل رویکرد پایین به بالا شده که یک گراف مولد را تشکیل می دهد. بر اساس این ایده رسمی  شکل هستی شناختی به صورت بازگشتی است . این فرم را punctuator (نشان گذار) می نامند.
2.1 Punctuator
برای درک تفاوت ویژگی های دسته بندی ،از  فرم نشان گذاری استفاده می کنیم که محتویات آن بشدت به عنوان بیرونی خود وا بستگی دارد . ایده تعمیم از نشان گذارها محافظت می کند، برای بدست آوردن تجربه از طریق همه روشهای حسی و شنوایی اسنفاده می شود. تعمیم بر اساس یک  بینش است که هیچ نهاد واقعی ، بدون تجربه داده ها  نشان گذاری نمی شود.

بافت های خالی شکل کلی نشان گذاری است ، دو نهاد بیرونی به عنوان contiguants در زمینه contiguum رابطه. contiguum رابطهای هستند که از بقیه نهادها  ساخته شده اند. با دسته بندی ، و استفاده از نشانه گذارهای مناسب و استفاده از رابطه ها در چارچوب معین، می توان اسامی را به طور  قابل شناخت و  تلفظ تبدیل نمود. رابطه ها بر سه  اساس زیر تشکیل شده اند:
(الف)نشان گذارهای خود پیوند

(ب) نشان گذارهای جدایی ناپذیر

(ج) نشان گذارهای جدا از هم

1- نشان گذارهای خود پیوند:

که از نماد های  گراف جهت دار استفاده می شود و اشخاص به عنوان گره ها و نشان گذار ها به عنوان خط استفاده می شوند.

2-نشان گذارهای جدایی ناپذیر
از نمادهای گراف جهت دار استفاده می شود که اشخاص به عنوان گره ها و نشان گذارها به عنوان خط با فلش استفاده می شود. ساختار این نشانه گذتر در شکل زیر آمده است:

3- نشان گذارهای جدا از هم
 نشان گذار pτ (ex|ey)  کاربرد مستقیم گره های گراف را نمایش می دهد که صفات بعنوان گره ها و نشان گذارها  با  خطهای فلش دار مشخص میگردند  که دررابطه های گراف  از ترکیب های فصلی و عطفی مانند یک دستگاه سویچینگ  استفاده می شود ساختار نشان گذارها  مجزا از هم  می باشد.

در ساختن گرامر ها می توان هر سه نوع نشانه گذاری را با هم ترکیب نمودو ساختاری که قابلیت تفسیر دستور زبان  را داشته باشد تولید نمود.
3 – نمودار گرامرهای مولد

مولد نمودار گراامر نسخه های عمومی تر از گرامرهای رشته ای هستند که در آن گره ها و لبه ها الفبا هستند. نیاز به تعریف قواعد برای ترکیب نشان گذارهای اساسی در روش های مختلف وجود دارد.
در مرحله اول ، دستور زبان ما شامل مجموعه ای از قوانین برای تولید یک گراف با اندازه دلخواه با نشان گذارهای  اساسی تشکیل شده است.برای نوشتن مفسر نیاز به یک سری  قوانین برای شناسایی زیرساختهای گراف با دسته بندی های فوق است.
قبل از این که قوانین را ذکر کنیم ،یک سری  جزئیات فنی برای درک آنها لازم است:
3.1 تعاریف
به دو ثابت الفبای ΩV و ΩE به ترتیب برای گره و لبه های برچسب داده می شود ، یک گراف (نشاندار) (سراسر(ΩV ، ΩE)یک  تاپل است، G=(GV ,GE, sG, tG, lvG, leG) ،که در آن GV  مجموعه ای از رئوس (یا گره) ، GE مجموعه ای از لبه (یا به شکل قوس)است ، SG ، TG :GE -- → GV منبع و توابع هدف ، و lvG : GV -- → ΩV و leG : GE −→ ΩE→ ΩE توابع برچسب زدنده به  گره ها و لبه ها است.

گراف (نگاشت) F : G à G~ به صورت  یک جفت از توابع  f = (fV : GV −→ G`V , fE : GE −→ G_E) که برای  حفظ منابع ، اهداف ، و برچسب ها استفاده می گردد.
generate:

تولیدp : (L −→r R) شامل نام  تولید شده که یک قسمت از گراف همریخت بنام r می باشد و ترتیب گراف تولید کننده RوL بصوت(LHS)و(RHS) می باشد.

نمونه ای از گراف گرامر شبیه زیر می باشد

4- قوائد تولید گراف گرامر

برای تولید نمودار ها گرامر یک سری از مقررات وجود دارد قوائد  تفسیر  نمودارهای  تولید به صورت زیر میباشد:

 برای قواعد نسل ، {G ، X ، E ، S ، J ، D}= ΩV که در آن:
G -- گره شروع
X -- گره متغیر
E --  نهاد ناشناس  ( یکی از مقوله های شناسایی وتفسیر)
S -- نهاد ذاتی
J -- نهاد بهم پیوسته
D – نهاد جدا
و مجموعه ای از برچسب های لبه ،  {in ، con ، DIS}= ΩE که در آن
در in-- چسبیدگی
con-- contant / conjuct
DIS --disjunct
قائده1 (شروع).با جایگزین کردن گره شروع Gبا نهاد بی نام Dو گره متغیرX  که به صورت خود پیوند است شروع می کنیم.

 



قاعده 2 (SelfLinking). در اینجا LHS punctuator جایگزین شده که لینک های خود از ما در حال حاضر
موجود در "E" (1 : E) با دیگر "E". "X" در اینجا گره ها متغیر هستند.


قانون 3 (LeftInherence). در اینجا LHS توسط punctuator جبلی جایگزین که در آن
جدید نهاد (E) inheres در نهاد های قدیمی (1 : E). در این روند ، "S" ، تولید شده است که
خود وابسته به هر دو اشخاص.


قانون 4 (RightInherence). در اینجا LHS توسط punctuator جبلی جایگزین که در آن
نهاد های قدیمی (1 : E) inheres در نهاد جدید (E).

قاعده 5 (متصل). LHS توسط punctuator از هم جدا جایگزین که در آن نهاد های جدید
(E) و نهاد (1 : E) با یکدیگر در تماس هستند. در این روند "J" است
تولید شده که inheres در هر دو نهاد است.

قانون 6 (جدا شده). LHS توسط punctuator از هم جدا جایگزین که در آن نهاد های جدید
(E) و نهاد های قدیمی (1 : E) جدا شده با یکدیگر هستند. در روند "D"
تولید شده که inheres در هر دو نهاد است.


قانون 7 (MereologyConjunct). در اینجا نمودار متوسط ??نشان دهنده LHS از این قاعده ،
و یکی از سمت راست ، RHS آن. این گزارش می گوید که هنگامی که برخی از نهاد inheres در دو نفر دیگر
اشخاص ، بهم پیوسته را می توان در بین آنها در شرایط ایجاد (NAC) وجود دارد که
در حال حاضر هیچ بهم پیوسته بین آنها ، است که توسط گراف سمت چپ در نمایندگی
تصویر بالا کلیک کنید. این قانون این است که مدل بین بخش هایی از یک کل بهم پیوسته است.


قانون 8 (MereologyDisjunct). این گزارش می گوید که هنگامی که برخی از نهاد inheres در دو نفر دیگر
اشخاص ، جدا شده را می توان در بین آنها در شرایط ایجاد (NAC) وجود دارد که
در حال حاضر هیچ جدا شده بین آنها است.


قانون 9 (ConjunctToDisjunct). بهم پیوسته بین دو نهاد جدا شده جایگزین شده است.
این قانون است به جای چنین مواردی است.


قانون 10 (DisjunctToConjunct). جدا شده بین دو نهاد توسط بهم پیوسته جایگزین کرد.
این قانون است به جای چنین مواردی است.

قانون 11 (ختم). این قانون اعمال می شود زمانی که هیچ نهاد جدید تر نیاز به
تولید می شود.
E = ΩE و هر یک از نمودار های تولید شده توسط1
اعمال قواعد نسل می تواند به عنوان شروع نمودار ، G0 ، در اینجا در نظر گرفته شده است.






طراحی پوسته توسط تیم پارسی بلاگ